Cerebras vs Nvidia是這篇文章討論的核心



Cerebras vs Nvidia:2026 AI 晶片霸主之爭的深度解剖與投資全攻略
AI 半導體戰場的核心——晶片架構的選擇,正決定下一代運算的權力分配。(Photo: Jimmy Chan / Pexels)

⚡ 快速精華 Key Takeaways

  • 💡 核心結論:Nvidia 仍是 AI 資料中心運算的預設選項,但 Cerebras 的晶圓級架構(WSE-3)正在推理賽道撕開缺口——CS-3 系統號稱比 Nvidia DGX B200 Blackwell 快 21 倍、成本低 1/3、功耗低 1/3。
  • 📊 關鍵數據:2026 年全球半導體市場突破 1 兆美元(IDC 預測);AI 晶片市場估值約 1,210 億美元(Precedence Research),預估 2035 年衝上 1.1 兆美元;Nvidia 2026 資料中心單季營收達 391 億美元;Cerebras 2025 全年營收 5.1 億美元(年增 76%),IPO 估值 564 億美元。
  • 🛠️ 行動指南:投資人應同時追蹤 CUDA 生態系護城河(Nvidia)與晶圓級推理速度破局(Cerebras),關注 Cerebras 的客戶集中度風險與 OpenAI/AWS 合約執行進度。
  • ⚠️ 風險預警:Cerebras 營收高度依賴 MBZUAI(佔 62%)與 G42(佔 24%),客戶集中度極端;單顆 WSE-3 晶片功耗 25kW、造價高達 300 萬美元/節點;TSMC 是唯一能製造 Cerebras 晶片的代工廠,供應鏈單一風險不容忽視。

觀察 AI 晶片市場這幾年的動態,有種看著兩個截然不同的文明碰撞的既視感——一邊是早已建立完整帝國的 Nvidia,CUDA 生態系綁架了整個開發者世界;另一邊是 Cerebras,這家 2015 年由 Andrew Feldman 帶著 SeaMicro 舊班底在 Sunnyvale 車庫裡搞出來的異類,用一整片晶圓當處理器,硬是把半導體產業的常識給翻了個底朝天。Yahoo Finance 近期的深度報導把這兩家公司攤開比較,從產品線、效能指標到估值邏輯全盤拆解——這不是簡單的「大公司 vs 小公司」敘事,而是兩種運算哲學的生死對決。

Cerebras 的晶圓級引擎憑什麼挑戰 Nvidia 的 GPU 帝國?

先把技術架構講清楚,因為這是一切分歧的根源。Nvidia 的路線是多晶片叢集——用成千上萬顆 GPU 透過 NVLink 和 InfiniBand 互聯,靠軟體層把分散式運算的複雜度藏起來。這套玩法的好處是彈性極高、生態系成熟,壞處是延遲和通訊開銷是物理上無法消除的瓶頸。

Cerebras 走了一條完全不同的路:Wafer-Scale Engine(WSE)。WSE-3 是目前地球上最大的 AI 晶片,面積 215mm × 215mm,一整片 8.5 吋晶圓就是一顆處理器,內含 4 兆個電晶體、44GB 的片上 SRAM。關鍵差異在於——整個模型可以直接載入單一晶片的記憶體,不需要跨節點通訊。這就是為什麼 Cerebras 敢宣稱推理速度比傳統多 GPU 架構快 10 倍以上,CS-3 系統更號稱比 Nvidia DGX B200 Blackwell 快 21 倍。

但硬幣的另一面很殘酷。WSE-3 單顆功耗 25kW——大概等於一台小冷氣全力運轉;單節點造價最高 300 萬美元;而且因為晶片面積太大,良率問題得靠獨特的「繞過缺陷核心」軟體方案來解決。Cerebras 燒了 2 億美元、每月燒 800 萬美元才搞定包裝和散熱問題,直到 2019 年 7 月才做出能用的產品。

🎯 Pro Tip 專家見解:Cerebras 的殺手鐧不是硬體本身,而是 2024 年夏天推出的雲端推理 API。這意味著客戶不用花 300 萬買一台 CS-3,直接按 token 付費就能享用晶圓級推理速度。這個商業模式的轉換——從賣硬體到賣推理服務——才是真正讓 Nvidia 緊張的地方。Sacra 的分析指出,雲端推理 API 已成為 Cerebras 的主要增長引擎。

2025 年 3 月,Cerebras 宣布在北美和歐洲新增六座 AI 資料中心,推理容量超過 4,000 萬 tokens/秒,直接在雲端推理賽道與 Nvidia 正面交鋒。

Cerebras WSE-3 vs Nvidia GPU 架構比較圖此圖表比較 Cerebras 晶圓級引擎 WSE-3 與 Nvidia GPU 在電晶體數量、片上記憶體、推理延遲和功耗四個維度的差異Cerebras WSE-3 vs Nvidia H100 GPU — 架構核心指標對決Cerebras WSE-3Nvidia H100 GPU電晶體數量4 Trillion80B片上記憶體44GB SRAM~0 (HBM3 80GB)推理延遲 (相對)1x (基準)10–21x 慢單節點功耗25kW~700W單節點造價$2–3M~$300K資料來源:Cerebras 官方、Sacra、Jarsy | 圖表僅供示意,實際數值依配置而異

數據很直觀:Cerebras 在推理延遲上碾压式領先,但功耗和造價也是碾压式地高。這不是一場「誰的晶片更好」的比賽,而是「哪種架構更適合你的場景」的選擇題——即時推理選 Cerebras,大規模訓練和通用運算選 Nvidia,大抵如此。

Nvidia 的 CUDA 護城河到底有多深?2026 年市佔數據拆解

先說結論:Nvidia 在 AI 資料中心晶片市場的份額,2026 年大概在 75%–86% 之間浮動,取決於你怎麼定義「AI 晶片」。硅分析師(Silicon Analysts)給的數字是 80-90%(2025)→75%(2026 預測),因為 AMD 和自研 ASIC 正在慢慢吃掉邊緣份額;但 Motley Fool 的估算更激進——2026 年 Nvidia AI 晶片營收 1,940 億美元,市佔 86%。

不管取哪個數字,核心事實不變:Nvidia 的單季資料中心營收就比任何競爭對手的全年營收還多。FY2026 Q1 資料中心營收 391 億美元;FY2025 全年資料中心營收 1,152 億美元,年增 142%。這不是「領先」兩個字能概括的——這是一種結構性的壟斷。

壟斷的根基是 CUDA。從 2007 年開始,Nvidia 花了快 20 年把 CUDA 打造成平行運算的事實標準。PyTorch、TensorFlow 預設後端就是 CUDA;全球有超過 400 萬開發者在 CUDA 生態系裡寫程式;遷移成本高到幾乎所有企業寧可繼續付 Nvidia 的溢價也不願重寫整個 AI pipeline。這就是為什麼 Cerebras 得搞自己的編譯器和軟體棧——硬體再快,開發者不願意學新工具就是白搭。

🎯 Pro Tip 專家見解:別只看 GPU 硬體的市佔率,更要追蹤軟體生態系的鎖定效應。Nvidia 的競爭優勢本質上是一個「開發者網路效應」問題——每多一個使用 CUDA 的開發者,遷移成本就指數級上升。Cerebras 的雲端推理 API 其實是在繞過這個問題:客戶不需要學新框架,直接用 API 就能享受速度優勢。這是一個聰明的側翼攻擊策略。

但護城河也有裂縫。2025 年超大型雲端供應商(Hyperscalers)在 AI 資本支出上砸了超過 3,800 億美元,同時加速自研晶片——Google 的 TPU、Amazon 的 Trainium、Microsoft 的 Maia、Meta 的 MTIA——這些自研 ASIC 在特定工作負載上提供 40-65% 的總持有成本(TCO)優勢。Nvidia 的市佔率絕對值還在增長,但百分比正在被稀釋。

2024–2026 AI 資料中心晶片市佔率變化此圖表展示 Nvidia、AMD、Cerebras 及其他廠商在 AI 資料中心晶片市場的市佔率從 2024 到 2026 年的預測變化AI 資料中心晶片市佔率 2024→2026(預測)202420252026 (預測)Nvidia 88%Nvidia 83%Nvidia 75-81%AMD 5%AMD 8%AMD ~10%Cerebras <1%Cerebras ~1%Cerebras ~2-3%其他 7%其他 9%其他 8-13%⚡ Cerebras 市佔絕對值仍小,但增速驚人Nvidia 百分比下滑 ≠ 營收下滑,總市場正在指數膨脹資料來源:Silicon Analysts、Motley Fool、CompaniesHistory | 百分比為估算值2026 全球 AI 市場規模約 $514.5B(CompaniesHistory),半導體市場突破 $1T(IDC)

一個容易被忽略的數字:2026 年全球半導體市場預計突破 1 兆美元(IDC),其中 AI 基礎設施投資是最大驅動力。Deloitte 的預測更保守但同樣驚人——9,750 億美元,年增 26%。這意味著 Nvidia 的市佔百分比可能在跌,但絕對營收金額只會更大。這是一個正在膨脹的餅,不夾的一方才真的吃虧。

Cerebras IPO 估值 564 億美元是泡沫還是合理定價?

2026 年 5 月 14 日,Cerebras 以 CBRS 代號在 Nasdaq 掛牌,IPO 定價每股 185 美元,募集 55.5 億美元——2026 年迄今最大規模的科技 IPO。上市首日開盤價 350 美元,收盤 311 美元,漲幅 68%,完全稀釋估值 564 億美元(CNBC / TechCrunch 報導)。

這數字合理嗎?用最粗暴的方式算:2025 年營收 5.1 億美元,564 億估值意味著 P/S 比率約 110 倍。對比 Nvidia 在 2023 年 AI 熱潮起飛時的 P/S 也大約 20-25 倍。Cerebras 的溢價來自三個故事:

  • OpenAI 合約:據 Tech Insider 報導,Cerebras 簽下了一份價值 100 億美元的 OpenAI 合約(另有來源稱 200 億),750MW 的算力供應協議。這是改變遊戲規則的單子——如果 OpenAI 的推理需求持續指數級增長,Cerebras 就有了穩定的收入引擎。
  • AWS 合作:2026 年與 Amazon Web Services 簽約,進入全球最大雲端平台的供應鏈。
  • 推理市場的結構性缺口:AI 產業正從「訓練為王」轉向「推理為王」——模型訓練一次,推理數十億次。即時推理的延遲要求是 GPU 架構很難物理突破的天花板,而這正是 Cerebras 晶圓級架構的殺手場景。

🎯 Pro Tip 專家見解:估值的核心爭議不在於 Cerebras 的技術是否牛逼(確實牛逼),而在於客戶集中度風險。S-1 文件顯示,MBZUAI 佔 2025 年營收的 62%,G42 佔 24%——兩個客戶就佔了 86% 的營收。如果 OpenAI 和 AWS 合約能成功分散客戶結構,估值就有支撐;但如果執行出岔子,這 110 倍 P/S 就是懸崖邊的定價。投資人必須追蹤 Cerebras 的季度財報中客戶分散化的進度。

值得注意的是,Cerebras 的淨利率達 47%(TradingKey 數據),這在硬體公司中極為罕見——大部分半導體公司的淨利率在 20-35% 之間。高淨利率的背後是雲端推理 API 的高毛利模式,但能否維持取決於規模化後的資料中心運營成本。

AI 晶片市場 2027–2035:從千億到兆美元的產業鏈重組

現在把時間軸拉長。Precedence Research 預測,全球 AI 晶片市場將從 2026 年的 1,217 億美元增長到 2035 年的 1.1 兆美元,CAGR 27.88%。IDC 更預測全球半導體市場 2026 年就突破 1 兆美元,而 Deloitte 認為到 2036 年可能達到 2 兆美元。

這些數字意味著什麼?意味著我們正在見證一個產業的重組級躍遷

  • 訓練 → 推理的範式轉移:2024-2025 年的 AI 投資主力是訓練基礎模型,但 2026 年以後推理算力的需求將遠超訓練。每部署一個 GPT-4 級別的模型,推理算力需求是訓練的 10-100 倍。Cerebras 的推理速度優勢在這個範式下會被放大。
  • 通用 GPU → 專用 ASIC 的分化:超大型雲端供應商的自研晶片(TPU、Trainium、Maia)在特定場景的 TCO 優勢達 40-65%,Nvidia 的通用 GPU 不再是唯一選項。Cerebras 的 WSE-3 本質上也是一顆超專用的推理 ASIC——不是所有場景都需要它,但需要它的場景沒有替代品。
  • 地緣政治的供應鏈風險:Cerebras 和 Nvidia 都依賴 TSMC 代工。美國對先進製程的出口管制、台海局勢的不確定性,都在為 AI 晶片供應鏈注入變數。Intel 的代工服務如果能成熟,會是替代方案,但目前良率和產能都跟不上。
  • 能源瓶頸:AI 資料中心的電力需求正在成為真正的硬約束。一個 750MW 的算力集群(Cerebras 為 OpenAI 部署的規模)大約等於一個中型城市的用電量。核能、地熱和離網可再生能源將成為 AI 基建的新賽道。
AI 晶片市場規模預測 2025–2035此圖表展示全球 AI 晶片市場從 2025 年到 2035 年的預測增長軌跡,從 944 億美元增長至超過 1 兆美元全球 AI 晶片市場規模預測 2025–203520252026202720282029203020312032203320342035$94B$122B$156B$199B$254B$325B$415B$530B$678B$866B$1.1T資料來源:Precedence Research (CAGR 27.88%) | 金額單位:美元

投資者決策框架:什麼樣的佈局策略能吃到 AI 基建紅利?

不廢話,直接給框架。Yahoo Finance 的報導核心其實在問一個問題:在 AI 晶片這條賽道上,你該押已經稱王的 Nvidia,還是賭正在破局的 Cerebras?答案不是二選一,而是根據風險偏好做配置。

🔵 保守型配置:重倉 Nvidia(70-80%)+ 小倉 Cerebras(5-10%)

邏輯很簡單——Nvidia 是 AI 基建的指數基金。只要 AI 產業還在增長,Nvidia 就是最大的受惠者。CUDA 生態系的鎖定效應在短期內(2-3 年)不會被打破。Blackwell 架構的出貨量已經售罄到 2026 年下半年。風險?估值太高(市值超過 3 兆美元),以及超大客戶自研晶片的長期替代效應。

🟣 積極型配置:Nvidia(40-50%)+ Cerebras(15-25%)+ AMD/自研晶片概念股(10-15%)

如果你相信推理市場會指數級爆發,Cerebras 的晶圓級架構就是那個不對稱的 bet。風險是客戶集中度——但 OpenAI 和 AWS 的合約如果執行到位,Cerebras 的營收可能在 2-3 年內翻 5-10 倍。AMD 的 MI300X 正在搶食 Nvidia 的中低階市場,也是值得追蹤的標的。

🟢 最激進配置:Cerebras 重倉(30%+)

這是純粹的「顛覆者賭局」。Cerebras 的技術路線是正確的(推理場景的延遲優勢無可替代),但執行風險極高——TSMC 供應鏈單一、客戶集中、25kW 功耗帶來的散熱和能源成本、以及 CUDA 生態系的高牆。如果 Cerebras 能在 2027 年前把客戶從 4 家擴展到 20+ 家,這個 bet 就贏了。

🎯 Pro Tip 專家見解:最聰明的玩法不是在 Nvidia 和 Cerebras 之間做選擇,而是沿著 AI 基建的整條價值鏈佈局。晶片是上游,但別忘了中游的資料中心運營商(CoreWeave、Equinix)和下游的推理 API 服務。Cerebras 的雲端推理 API 本身就是一個「晶片公司往下游延伸」的典型案例——未來的 AI 基建贏家可能不是賣晶片的人,而是賣推理服務的人。

一個值得追蹤的指標:Cerebras 的推理容量增速。從 2024 年推出雲端 API 到 2025 年 3 月宣布六座新資料中心、4,000 萬 tokens/秒的推理容量,這個擴張速度是判斷 Cerebras 是否能從「技術酷東西」變成「商業印鈔機」的關鍵風向球。

❓ 常見問題 FAQ

Cerebras 和 Nvidia 的 AI 晶片架構有什麼根本差異?

Nvidia 使用多晶片 GPU 叢集架構,透過 NVLink 和 InfiniBand 互聯,彈性高但通訊延遲是物理瓶頸。Cerebras 使用晶圓級引擎(WSE-3),一整片晶圓就是一顆處理器,4 兆電晶體、44GB 片上 SRAM,模型直接載入單晶片記憶體,無需跨節點通訊,推理延遲降低 10-21 倍。但 WSE-3 功耗 25kW、造價高達 300 萬美元/節點,適合推理密集場景而非通用運算。

Cerebras 的 IPO 估值 564 億美元是否合理?

Cerebras 2025 年營收 5.1 億美元,IPO 完全稀釋估值 564 億美元,P/S 比率約 110 倍,遠高於 Nvidia 在 AI 熱潮起飛時的 20-25 倍。溢價來自 OpenAI(100 億美元合約)和 AWS 簽約帶來的增長預期,以及推理市場的結構性爆發。但客戶集中度風險(MBZUAI 佔 62%、G42 佔 24%)和 TSMC 單一供應鏈是重大不確定因素。估值是否合理取決於 Cerebras 能否在 2027 年前實現客戶分散化。

2026 年 AI 晶片市場的規模和主要玩家市佔率如何?

根據 Precedence Research,2026 年全球 AI 晶片市場規模約 1,217 億美元;IDC 預測全球半導體市場將突破 1 兆美元。Nvidia 仍佔 AI 資料中心晶片市場的 75-86%,單季資料中心營收達 391 億美元。AMD 市佔約 10%,Cerebras 約 2-3% 但增速最快。超大型雲端供應商的自研 ASIC(TPU、Trainium 等)正在稀釋 Nvidia 的百分比份額,但整體市場的指數膨脹意味所有玩家的絕對營收都在增長。

Share this content: