AMD蘇姿丰獲IMEC創新獎,揭秘未來AI晶片能效提升百倍藍圖

Featured Image
AMD 董事長兼執行長蘇姿丰於 IMEC (比利時微電子研究中心)舉辦的 ITF World 2024 大會上獲得了 IMEC 創新大獎,以表彰其在行業創新和領導方面所做出的貢獻。這一榮譽此前曾被頒發給英特爾創辦人戈登·摩爾(Gordon Moore)、微軟創辦人比爾·蓋茨(Bill Gates)以及台積電創辦人張忠謀。

在獲獎演講中,蘇姿丰提到,AMD 正在全力衝刺 30×25 的目標。這一目標要求在 2025 年之前將計算能效提升到 2014 年的 30 倍,而在 2026 年至 2027 年期間,AMD 還計劃將計算能效進一步提升到 2014 年的 100 倍。這一速度將遠超行業平均水準。

隨著處理器和顯示卡等處理器的能耗不斷增加,AMD 在 2014 年就確定了一個名為 25×20 的目標,即到 2020 年將產品能效提升 25 倍,最終實現了 31.7 倍的超額目標。此後,AMD 提出了新的 30×25 目標,預計在 2025 年能夠成功實現。蘇姿丰指出,目前提升運算產品能效的最大障礙是 AI 大模型訓練和微調所需的巨大計算能力。這往往需要數以千計的圖形處理單元(GPU)和數以千兆瓦計的電力,而且目前這個需求還在急劇增長。

為了應對這一挑戰,AMD 將採取多種措施,從產品架構、製程技術、封裝技術和互連技術等方面提升能效。例如,他們將使用 3 奈米 GAA 全環繞柵極製程技術和 2.5D/3D 先進封裝技術等。蘇姿丰強調,AMD 最強大的 AI 晶片 Instinct MI300X 是高能效的典型代表。該晶片擁有 1530 億個電晶體,分為 12 顆小晶片,還整合了 24 顆共 192GB HBM3 記憶體。此外,核心執行序數量從單核心/單執行序增加到 96 核心/192 執行序,頻率從 20MHz 提高到 3.5GHz,暫存記憶體容量從 16MB 增加到 486MB,內核心面積從 49 mm² 增加到 1240mm²。所有這些技術都可以應用於 GPU,通過優化功率和性能以及結構互連技術的結合,使運算和記憶體密度更接近處理核心,從而減少傳輸數據所需的能量。

蘇姿丰進一步指出,雖然硬體優化很重要,但 AMD 在軟硬體協同優化方面也取得了令人矚目的成果。使用較低精度的數位格式可以提高能源效率和能耗,使得特定硬體加速的設計對於持續擴展變得非常重要。特別是轉向 FP4 等較低精度格式,相較於 FP32 可以大幅增加每焦耳消耗能量,例如 FP8 的能耗提高了 15 倍,而 FP4 的能耗提高了約 30 倍。然而,較低的精度也導致準確度降低。對此,蘇姿丰強調,先進的量化技術有助於解決這個問題。事實上,即使 MXFP6 也能產生與 FP32 相似的精度,只有少數不同模型的 MXFP4 上出現了下降,而其他模型仍然同樣準確。目前,提高低精度格式準確性的工作仍在進行中,因此 AMD 甚至可以預見到 MXFP4 在未來的更多模型中變得與 FP32 一樣準確。

最後,蘇姿丰指出,從整體上看,AMD 在每個節點的電源效率方面已經超過了行業的進步速度,並且該公司仍在努力實現 30 倍的電源效率提高。預計這一趨勢將持續下去,通過這種類型的創新,AMD 將能夠更上一層樓。到 2026 年和 2027 年,我們有望實現超過 100 倍的目標。

科技新知,時時更新

Share this content: