登录

会员权益

获取需求

查看名片

专属客服

尊贵标识

VIP低至1.5U/天

睽違5年的Nvidia GTC實體大會登場,新一代Blackwell GPU架構問世

分享

2024-03-20

繼兩年前推出Hopper架構後,Nvidia發表新一代GPU架構Blackwell,支援第二代Transformer引擎,可加速大型語言模型及專家混合模型的推論及訓練,並提高其精度與準確度

這場會議備受外界矚目,因為Nvidia在全球AI晶片的市占率高達9成。黃仁勳認為,通用運算已失去動力,加速運算則到達了臨界點,人們需要另一種運算方式以繼續擴展,繼續降低運算成本,才能於可持續的同時繼續消耗更多的運算。此外,需要訓練各種型態資料的多模態AI的興起也讓運算需求升溫,人們需要更大的模型,也需要更大的GPU,Blackwell即是為了解決此一挑戰而設計的。

Blackwell為Nvidia新一代的GPU架構,是兩年前推出的Hopper架構的繼任者,其名稱是為了向美國首位進入國家科學院的黑人數學家David Harold Blackwell致敬。

根據Nvidia的說明,基於Blackwell架構的GPU是由2,080億個電晶體組成,採用客製化的台積電4NP製程所生產,所有Blackwell產品皆配備兩個具有光罩限制的晶粒,藉由每秒10TB的晶片互連技術,產生一個強大的GPU。此外,Blackwell支援第二代Transformer引擎,可加速大型語言模型(LLM)及專家混合模型(MoE)的推論及訓練,並提高其精度與準確度。

Blackwell透過NVLink及NVLink Switch等互連技術來強化GPU之間的通訊,配備解壓縮引擎來協助處理傳統上通常仰賴CPU的資料分析任務,以及擁有一個可協助系統復原的可靠性、可用性及可維護性引擎(RAS)。

這使得Blackwell在訓練上的FP8效能是Hopper的2.5倍,推論的FP4效能是Hopper的5倍,採用第5代NVLink技術則可達到Hopper的兩倍快,還可擴展至576個GPU。

現階段基於Blackwell架構的AI晶片主要為B100與B200,但Nvidia特別設計了GB200 Grace Blackwell Superchip超級晶片(下圖),透過NVLink將兩個B200連至Nvidia Grace CPU,再利用GB200建置了機架系統Nvidia GB200 NVL72。

全球最主要的AI晶片業者所發表的最新技術及產品,也受到全球主要AI業者及雲端服務供應商的青睞,包括AWS、Google Cloud、Microsoft Azure與Oracle Cloud Infrastructure皆已承諾要提供基於Blackwell架構的實例。

/Nvidia

免责声明:
详情
HUIDU.io

GROWTH DRIVEN GLOBAL PTE. LTD. 202618650K

101 THOMSON ROAD, #28-03A, UNITED SQUARE, SINGAPORE 307591

Copyright 2026 HuiDu