Cerebras 挑戰 Nvidia：推出全球最快 AI 推理服務

Cerebras 系統挑戰 Nvidia，帶來前所未有的 AI 推理速度！

– 人工智慧 (AI) 的蓬勃發展帶來了 AI 推理服務的熱潮，推理服務是將訓練好的 AI 模型應用於實際數據以進行預測或解決任務的關鍵。隨著 AI 應用的普及，推理服務的需求也隨之激增，成為雲端工作負載中增長最快的部分。然而，現有的 AI 推理服務並無法滿足所有客戶的需求，這使得 Cerebras 系統公司推出的「全球最快 AI 推理服務」成為眾人關注的焦點。

Cerebras 系統挑戰 Nvidia 的霸主地位

Cerebras 系統公司是一家專注於 AI 運算晶片的初創公司，其目標是挑戰 Nvidia 在 AI 晶片市場的領導地位。 Cerebras 系統公司相信，其推出的新型「高速推理」服務將成為 AI 產業的里程碑，能夠達到每秒 1000 個 tokens 的速度，這將為 AI 應用開創新的機遇。

專為 AI 設計的強大晶片：WSE-3

Cerebras 系統公司的核心競爭力來自其自主研發的專用晶片。 公司的旗艦產品 WSE-3（Wafer Scale Engine 3）處理器於今年三月正式發布，這款基於五奈米製程的先進晶片擁有 1.4 兆個晶體管、超過 90 萬個運算核心及 44GB 的靜態隨機存取記憶體 (SRAM)，是其前代產品 WSE-2 的兩倍性能。與 Nvidia 的 H100 GPU 相比，WSE-3 具有 52 倍以上的核心數和 7000 倍的記憶體頻寬，這使得其推理速度更快，且成本更低。

WSE-3 處理器被集成於 Cerebras CS-3 系統中，該系統大小與小型冰箱相當，處理器本身則約有一個披薩大小，並內建冷卻和電力模組。 根據 Cerebras 的數據，WSE-3 的峰值速度可達到 125 petaflops（一 petaflop 等於每秒一千兆次運算），為推理服務提供了強大的運算支援。

驚人的速度與成本效益

Cerebras 推出的 AI 推理服務，號稱速度比使用 Nvidia 最強大 GPU 的雲端推理服務快 20 倍。 以開源的 Llama 3.1 8B 模型為例，Cerebras 的推理服務能夠達到每秒 1800 個標記的速度，而對於 Llama 3.1 70B 模型，則可達到每秒 450 個標記。與此同時，該服務的價格極具競爭力，起步價僅為每百萬個標記 10 美分，這意味著其 AI 推理工作負載的性價比是現有服務的 100 倍。

這項推理服務特別適合於「代理型 AI」（agentic AI）工作負載，這類應用需要頻繁地提示其基礎模型，以完成用戶指定的任務。 Cerebras 的推理服務在速度與成本上皆具顯著優勢，特別是針對那些需要實時或高頻度運行的 AI 應用。

記憶體頻寬突破

大多數 AI 推理服務速度緩慢的原因在於大型語言模型 (LLM) 的順序性和對記憶體頻寬的高需求。 例如，Llama 3.1 70B 模型擁有 700 億個參數，每個參數需要 2 個位元的儲存空間，整個模型需要 140GB 的記憶體。由於 GPU 僅有約 200MB 的片上記憶體，模型無法完全儲存於片上，每次生成輸出標記時都需要將整個模型從記憶體移至運算核心進行推理運算。這導致了推理速度的極大限制。

然而，Cerebras 透過其獨特的晶圓級設計，成功將 44GB 的 SRAM 整合到一顆晶片上，進而消除了對外部記憶體的依賴以及外部記憶體與運算核心之間的緩慢傳輸瓶頸。 WSE-3 擁有 21

熱門内容

台式滷肉飯

百年影像巨頭柯達發生死危機，五億債務壓頂經營前景堪憂

2025款大众ID.4 CROZZ上市，智能升级震撼来袭

數發部擬提「AI-Ready Data指引」，台灣AI未來決勝關鍵

馬斯克怒指蘋果App Store偏袒OpenAI 蘋果強烈否認挑戰反壟斷

AI資訊
AI工具
AI繪圖指令
食譜

M5芯片革命：2026年MacBook Pro驚天延遲曝光！

郭明錤預測搭載高端M5芯片的MacBook Pro將於2026年發布，延後2025年上市計劃，並介紹晶圓級多芯…
→ Read more
百年影像巨頭柯達發生死危機，五億債務壓頂經營前景堪憂

歷經百年榮光的柯達，面臨5億美元債務償還壓力，經營前景堪憂。公司計劃調整財務策略，推動制藥業務轉型，力圖轉危為…
→ Read more
馬斯克怒指蘋果App Store偏袒OpenAI 蘋果強烈否認挑戰反壟斷

馬斯克指控蘋果應用商店偏袒OpenAI，疑違反反壟斷法，蘋果強調公平競爭，否認存在偏袒行為，保障用戶安全與開發…
→ Read more
AMD突破極限！Windows AI PC本機輕鬆運行OpenAI 120b大模型

AMD處理器與顯示卡在Windows AI PC上，透過優化驅動輕鬆運行OpenAI gpt-oss 20b及…
→ Read more
GPT-5免費體驗席捲微軟全平台，電腦安卓iOS同步開放！

Microsoft微軟將最新OpenAI GPT-5整合至多款產品，涵蓋電腦、Android及iOS裝置，提供…
→ Read more
Blackwell架構震撼登場！NVIDIA RTX PRO伺服器全面升級新時代運算風潮

NVIDIA於SIGGRAPH 2025發表採用Blackwell架構的RTX PRO伺服器與多款運算卡，提升…
→ Read more
AMD Ryzen AI爆發力！Windows AI PC本機輕鬆跑OpenAI 120B大模型

AMD處理器與顯示卡經過優化，在Windows AI PC上能高效運行OpenAI gpt-oss 20b及1…
→ Read more
GPT-5震撼登場，微軟Copilot全面升級工作效率大躍進

微軟將最新GPT-5 AI模型整合至Microsoft Copilot、GitHub Copilot和Visu…
→ Read more
Blackwell架構先鋒！NVIDIA SIGGRAPH 2025驚爆RTX PRO伺服器革新

NVIDIA於SIGGRAPH 2025發布採用Blackwell架構的RTX PRO伺服器及多款運算卡，強化…
→ Read more
WiFi 7 夏日優惠狂減 NETGEAR 路由器低至37折加送高達$500禮券

NETGEAR 8月多款WiFi 7路由器促銷，新低價發售並送最高$500禮券，購買路由器可半價換購高效Mul…
→ Read more

ai生成圖片

Introduction MyEdit Midjourney DALL·E3 Stable Diffusio…
→ Read more
Janitor Ai

Introduction Platform Overview 1 Account Terminati…
→ Read more
Stable Video Diffusion 穩定的圖片轉動畫Demo

Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…
→ Read more
HappyAccidents

HappyAccidents是一個提供預先訓練的AI模型庫的平台，讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…
→ Read more
文心一格

「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布，利用百…
→ Read more
Ai Gallery

Ai Gallery為用戶提供了一個強大的工具，利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…
→ Read more
Graviti Diffus

Graviti Diffus 是一個免部署的在線平台，專注於提供穩定擴散（Stable Diffusion）的…
→ Read more
Aitubo

Aitubo是一個AI創作工具，它提供了方便且強大的功能，讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…
→ Read more
SeaArt

SeaArt AI是一款免費且強大的AI繪畫工具，它能夠幫助使用者無需專業技能，輕鬆生成高品質的繪畫作品。 S…
→ Read more
Diffusion Art

DiffusionArt是一個精選的開源AI藝術模型庫，專注於藝術、動漫和照片逼真圖像的生成，涵蓋數十個類別。…
→ Read more

AI繪圖指令

AI繪圖指令待編輯中… Share this content: Views: 47 Related…
→ Read more

台式滷肉飯

台式滷肉飯簡介：滷肉飯是台灣的國民美食，香濃的滷肉搭配白飯，簡單卻令人滿足。這道食譜改良自傳統做法，更適合家庭…
→ Read more
香煎檸檬三文魚配時蔬

Share this content: Views: 9 Related posts: Streamline …
→ Read more
薑蔥爆花蛤

薑蔥爆花蛤簡介：這道菜以新鮮花蛤為主要食材，搭配薑蔥爆炒，鮮香惹味，是港澳台地區非常受歡迎的海鮮料理。準備時間…
→ Read more
夏日清潤綠豆雪耳糖水

夏日清潤綠豆雪耳糖水簡介：這道糖水結合了綠豆的清熱解毒、雪耳的滋陰潤肺功效，非常適合炎熱的港澳台夏季。加入冰糖…
→ Read more
韓式隔夜燕麥杯

韓式隔夜燕麥杯簡介：這道菜靈感來自韓星減肥的隔夜燕麥，並加入一些韓式元素，適合港澳台地區的口味。簡單易做，營養…
→ Read more
隔夜燕麥水果杯

隔夜燕麥水果杯簡介：這道菜以隔夜燕麥為基底，搭配新鮮水果和堅果，口感豐富，營養均衡，非常適合當早餐或下午茶。參…
→ Read more
立秋滋潤養生：香椿彩椒三文魚配隔夜燕麥飯

香椿彩椒三文魚配隔夜燕麥飯簡介：這道菜結合了時令食材香椿、色彩繽紛的彩椒，以及富含Omega-3的三文魚，搭配…
→ Read more
港式風味炸醬撈麵

港式風味炸醬撈麵簡介：結合譚仔炸醬罐頭的方便與傳統撈麵的風味，這道菜簡單快捷，適合忙碌的都市人，美味又飽足。準…
→ Read more
韓式風味炸醬撈麵 (譚仔風味升級版)

韓式風味炸醬撈麵 (譚仔風味升級版)簡介：結合韓星減肥隔夜燕麥的概念和譚仔炸醬的特色，這道撈麵低負擔又美味，適…
→ Read more
滋潤養肺雪耳淮山蘋果湯

滋潤養肺雪耳淮山蘋果湯簡介：這道湯品結合了雪耳、淮山和蘋果的營養價值，具有滋陰潤肺、健脾益氣的功效，適合乾燥的…
→ Read more