華為950PR晶片是這篇文章討論的核心

💡 核心結論
華為昇騰950PR晶片獲得字節跳動、阿里巴巴等中國互聯網巨頭的大規模採購意向,標誌著中國AI晶片從「國企訂單」走向「市場化競爭」的關鍵轉折。950PR計劃於2026年第一季量產,全年出貨目標約75萬顆,採用華為自研高頻寬記憶體(HBM),這是供應鏈自主化的重大突破。
📊 關鍵數據(2026-2027年預測)
- 華為950PR計劃出貨量:約75萬顆(2026年)
- 中國AI晶片市場規模:預計突破2000億人民幣(約280億美元),2027年有望達500億美元
- 中國AI晶片國產化率:2026年預計超過50%,2030年有望達76%
- 昇騰910C推理性能:達NVIDIA H100的60%(DeepSeek測試數據)
🛠️ 行動指南
對於關注中國AI產業鏈的投資者和企業決策者,建議密切追蹤華為昇騰系列晶片的量產進度與客戶反饋,同時關注NVIDIA在中國市場的策略調整(如H200晶片的銷售動向)。
⚠️ 風險預警
華為仍面臨供應鏈挑戰,包括對中芯國際N+2製程的依賴,以及CUDA生態系統的軟體相容性問題。美國出口管制政策的變化仍是最大不確定因素。
目錄
引言:一場遲來的「轉身」
路透社2026年3月的報導像一顆震撼彈——華為最新款AI晶片950PR在客戶測試中表現亮眼,字節跳動、阿里巴巴這兩家中國互聯網巨頭已計劃下單採購。消息人士透露,華為今年計劃出貨約75萬顆950PR晶片,樣本已於1月發送,4月啟動量產。
這看似只是一則供應鏈新聞,實則是中國AI晶片產業的分水嶺時刻。過去,華為很難說服騰訊、阿里巴巴、字節跳動這類民間科技企業大量採購其昇騰系列晶片——昇騰910C的客戶多為國有企業和地方政府。為什麼這次不一樣?950PR到底有什麼「殺手鐧」?這場晶片戰爭的背後,又揭示了什麼產業趨勢?
一、為什麼字節跳動和阿里巴巴開始轉向華為AI晶片?
要理解這次轉變,得先回顧一下「前情提要」。2025年初,華為昇騰910C的市場拓展可說是跌跌撞撞。多家媒體報導指出,騰訊、阿里巴巴、字節跳動等中國科技巨頭對華為AI晶片「興趣缺缺」,大規模採購遲遲未見動靜。原因很現實:生態系統不成熟、軟體支援有限、性能與NVIDIA仍有差距。
那為什麼2026年風向變了?
1.1 地緣政治的「助攻」
美國對中國的AI晶片出口管制持續升級。NVIDIA專為中國市場「閹割」的H20晶片因法規不明確,2025年第二季對華銷售額幾乎歸零。雖然2026年初美國有限批准了H200晶片出口,但這種「時緊時鬆」的政策讓中國科技企業人心惶惶。誰願意把算力命脈綁在一個隨時可能被切斷的供應鏈上?
黃仁勳2025年5月對CNBC坦言,中國AI晶片市場未來2-3年可達500億美元規模,錯過將是「巨大損失」。但這話的另一面是:如果美國政策再變,NVIDIA在中國的客戶可能再次面臨「斷供」風險。對字節跳動、阿里巴巴這種需要穩定算力供應的企業來說,分散風險是剛性需求。
💡 Pro Tip:專家見解
「供應鏈安全」正在壓倒「性能最優」。 一位不願具名的半導體分析師指出:「2022年之前,中國互聯網企業買NVIDIA是因為它是最強的;2024年之後,他們買NVIDIA開始擔心『明天還能買到嗎?』。這種不確定性推動了國產晶片的市場化進程,華為是最大受益者。」
1.2 950PR的「誠意」
華為輪值董事長徐直軍在2025年9月的「全聯接大會」上首次披露了昇騰晶片的演進路線圖:950PR、950DT、960、970四款新晶片將在2026-2028年陸續推出。其中,950PR預計2026年第一季量產,最大亮點是搭載華為自研的高頻寬記憶體(HBM)。
HBM是什麼?簡單說,它是AI晶片的「記憶體革命」。傳統的GPU記憶體和處理器是分開的,數據傳輸有延遲;HBM則把記憶體「堆疊」在處理器旁邊,大幅提升頻寬、降低延遲。NVIDIA的H100之所以強,HBM3是關鍵。華為之前被卡在這一環——HBM供應鏈主要掌握在三星、SK海力士等韓國企業手中。950PR搭載自研HBM,意味著華為打通了另一個供應鏈「斷點」。
1.3 CUDA相容性的「彎道超車」
路透報導特別提到,950PR與NVIDIA CUDA軟體系統的兼容性更高。這點至關重要。CUDA是NVIDIA的「護城河」——十多年來,無數AI框架、模型都基於CUDA開發。華為此前推昇騰晶片,最大的阻力就是軟體生態:開發者要重寫代碼、重新適配,成本極高。
如果950PR真的改善了CUDA兼容性,意味著企業可以更低成本地從NVIDIA遷移到華為。當然,完全兼容不可能,但「兼容性更高」本身已是重大突破。
二、950PR的技術突破:自研HBM與CUDA相容性的雙重博弈
2.1 自研HBM:供應鏈自主化的關鍵一環
TechNews科技新報2025年12月的報導指出,昇騰950系列採用中芯國際N+3製程,並結合華為首款自研HBM架構。這意味著華為在晶片設計和記憶體兩個層面都實現了「去美化」。
為什麼HBM這麼重要?AI大模型的訓練和推理需要海量數據在處理器和記憶體之間高速流動。HBM的頻寬是傳統記憶體的數倍,直接決定了AI晶片的實際性能表現。此前,中國AI晶片被批「算力夠、頻寬不夠」,原因就是HBM被卡脖子。950PR的自研HBM如果成功量產,將是中國半導體產業的里程碑。
💡 Pro Tip:專家見解
HBM的難點不只在技術,更在供應鏈。 半導體產業分析師指出:「HBM的製造需要先進封裝技術,這方面台積電的CoWoS、三星的HBM封裝都是業界頂尖。華為能自研HBM,說明中國在先進封裝領域也有突破。但量產良率和成本仍是未知數。」
2.2 CUDA相容性:華為的「翻牆」策略
華為沒有公開950PR具體如何提升CUDA兼容性,但業界推測可能有幾種路徑:
- 軟體翻譯層: 類似於蘋果Rosetta的方式,在華為CANN(Compute Architecture for Neural Networks)上增加CUDA代碼的翻譯支援。
- API模擬: 讓部分CUDA API調用能直接在昇騰晶片上運行,減少代碼改動。
- 生態合作: 與主流AI框架(如PyTorch、TensorFlow)合作,讓框架本身支援昇騰後端。
無論哪種方式,CUDA兼容性的提升都會降低企業遷移成本。字節跳動、阿里巴巴這種有大量AI基礎設施的企業,最怕的就是「遷移黑洞」——花了大價錢買硬體,結果軟體適配搞了一年還沒上線。
2.3 性能表現:從「能用」到「好用」
雖然950PR的具體性能數據尚未公開,但可以參考昇騰910C的測試結果。DeepSeek研究團隊的測試顯示,910C在推理任務中的性能達到NVIDIA H100的60%。這個數字看起來不驚艷,但考慮到:
- 這是華為第一代面向數據中心的AI訓練晶片
- 中芯國際N+2製程(約7nm)與台積電4nm製程有代差
- 軟體生態仍處於追趕階段
60%的H100性能其實是不錯的起點。950PR如果在製程、HBM、軟體最佳化三方面都有升級,性能有望進一步逼近NVIDIA的高端產品。
三、華為vs NVIDIA:中國AI晶片市場的攻防戰
3.1 NVIDIA的「中國困境」
NVIDIA在中國AI晶片市場的處境可說是「進退兩難」。一方面,黃仁勳多次強調中國市場的重要性,預測其AI晶片市場將達500億美元;另一方面,美國出口管制讓NVIDIA必須不斷推出「閹割版」產品,從A100到H100再到H20、H200。
TrendForce的分析指出,NVIDIA H200是美國放行的「折衷方案」,性能介於舊款H20和先進Blackwell平台之間。雖然H200性能比H20高出六倍,但面對國產晶片的競爭,NVIDIA在中國的市佔率仍可能持續下滑。
3.2 華為的「農村包圍城市」策略
華為昇騰晶片的市場策略有點像「農村包圍城市」。最初,910C主要賣給國有企業和地方政府——這些客戶對政策敏感度高,對性能要求相對寬鬆。通過這些「基本盤」,華為積累了量產經驗、優化了軟體生態。
950PR則是「進攻城市」的產品。字節跳動、阿里巴巴這類互聯網巨頭對性能、成本、軟體生態都有極高要求。華為能說服他們下單,說明產品力已達到一定水準。
💡 Pro Tip:專家見解
「試水溫」到「大單」的轉變有深意。 產業觀察人士指出:「互聯網巨頭不可能把核心業務全部遷移到國產晶片,但他們可能先採購一部分用於推理等非核心場景,逐步擴大比例。950PR獲得的可能是這種『試探性訂單』,但對華為來說,這是進入主流市場的敲門磚。」
3.3 價格競爭:華為的「性價比」優勢
雖然缺乏公開定價數據,但業界普遍認為華為昇騰晶片在價格上有明顯優勢。一方面,國產晶片不需要支付高額的「品牌溢價」;另一方面,中國政府對半導體產業的補貼也降低了華為的成本壓力。
對於大規模採購AI晶片的互聯網企業來說,如果國產晶片能以更低的成本提供「夠用」的性能,何樂不為?尤其是在推理場景,對性能的要求沒有訓練那麼極端,國產晶片的性價比優勢更明顯。
四、供應鏈自主化的挑戰與機遇
4.1 中芯國際:製程瓶頸與突破
華為昇騰晶片的代工主要由中芯國際承擔。TechNews的拆解報告顯示,昇騰910C採用中芯國際N+2製程(約7nm),而950系列則採用更先進的N+3製程。
7nm聽起來離台積電3nm、2nm很遠,但對於AI晶片來說,7nm已經「夠用」。DeepSeek的測試證明,910C在7nm製程下能達到H100的60%性能。隨著中芯國際製程的持續改進,國產AI晶片與NVIDIA的性能差距有望進一步縮小。
4.2 先進封裝:另一條戰線
除了製程,先進封裝是另一個關鍵戰場。HBM的堆疊、晶片與晶片之間的互聯,都需要先進封裝技術。台積電的CoWoS(Chip-on-Wafer-on-Substrate)是目前最先進的封裝方案之一,NVIDIA的H100就採用了這一技術。
華為能否在先進封裝上取得突破,將直接影響950PR的實際性能。如果自研HBM能成功量產並達到預期性能,意味著中國在先進封裝領域也站穩了腳跟。
4.3 軟體生態:長期競爭的關鍵
硬體可以追趕,軟體生態卻需要時間積累。CUDA經過十多年的發展,已經形成了龐大的開發者社群和軟體庫。華為的CANN平台雖然進展迅速,但與CUDA的差距仍然明顯。
好消息是,中國龐大的AI應用市場為CANN提供了試驗場。字節跳動、阿里巴巴、騰訊等企業的AI業務規模全球領先,他們對昇騰晶片的採用將推動CANN生態的快速成熟。
五、對2026-2027年全球AI產業鏈的深遠影響
5.1 全球AI晶片市場格局的重塑
華為昇騰晶片的崛起,意味著全球AI晶片市場將從「一超多強」走向「雙雄對決」。NVIDIA仍將在高端市場保持領先,但中國這個全球最大的AI應用市場將逐漸「去NVIDIA化」。
根據摩根士丹利的預測,中國AI晶片自給率將從2025年的約30%提升至2030年的76%。這意味著NVIDIA可能永久失去中國市場的大部分份額。
5.2 供應鏈的「雙軌制」
美國的出口管制正在推動全球半導體供應鏈走向「雙軌制」。一條是以美國、台灣、荷蘭、日本為核心的「西方供應鏈」;另一條是以中國為核心的「自主供應鏈」。
對於跨國企業來說,這意味著更高的成本和更複雜的供應鏈管理。但對於中國企業來說,這是必須走的道路——至少對於關鍵領域的晶片,必須有「備胎」。
5.3 對台灣半導體產業的影響
台灣在全球半導體供應鏈中扮演關鍵角色,尤其是台積電的先進製程和先進封裝能力。如果中國AI晶片完全實現自主化,台積電可能失去一個重要客戶(華為)和一個潛在大市場(中國AI晶片需求)。
但台積電仍將在高端晶片代工領域保持領先,服務NVIDIA、蘋果、AMD等全球客戶。關鍵在於:全球AI算力需求的增長是否能抵消中國市場的流失。
5.4 AI應用的「去中心化」
如果中國AI晶片能提供具有性價比的算力,可能推動AI應用的「去中心化」。目前,全球AI算力高度集中在NVIDIA硬體上,這帶來了供應鏈風險和價格壟斷。華為等國產晶片的崛起,可能讓更多企業和開發者有「選擇權」,推動AI產業的健康發展。
六、常見問題FAQ
問題一:華為950PR晶片真的能替代NVIDIA嗎?
從目前的性能數據來看,950PR距離完全替代NVIDIA高端晶片(如H100、B200)仍有差距。但在推理等特定場景,950PR可能已經「夠用」。更重要的是,對於中國企業來說,供應鏈安全往往比性能極致更重要。950PR的價值在於提供了一個「可選項」,而非完全替代。
問題二:字節跳動、阿里巴巴為什麼現在開始採購華為晶片?
主要原因有三:一是美國出口管制帶來的供應鏈不確定性;二是950PR在技術上有明顯進步,尤其是自研HBM和CUDA兼容性;三是國產化政策和成本考量的綜合推動。
問題三:華為950PR的量產面臨哪些挑戰?
主要挑戰包括:中芯國際的產能和良率、自研HBM的量產難度、軟體生態的持續最佳化,以及美國可能進一步升級的出口管制措施。這些因素都可能影響950PR的實際出貨量和市場表現。
參考資料與延伸閱讀
結語:一場沒有終點的馬拉松
華為950PR獲得字節跳動、阿里巴巴的採購意向,是中國AI晶片產業的一個重要里程碑,但這場晶片戰爭遠未結束。NVIDIA在高端晶片和軟體生態上的領先優勢依然巨大,華為仍需在製程、封裝、軟體等多個維度持續追趕。
對於關注AI產業鏈的投資者和企業決策者來說,2026-2027年將是關鍵觀察期:950PR能否如期量產?實際性能如何?字節跳動、阿里巴巴等客戶的反饋怎樣?這些問題的答案,將決定中國AI晶片自主化的進程。
無論結果如何,華為950PR的故事已經證明了一件事:在技術競爭的賽道上,「被卡脖子」的痛,往往比「自主研發」的苦更能激發突破。
想了解更多AI晶片市場的最新動態?歡迎聯繫我們取得深度分析報告。
Share this content:











