DeepSeek AI訓練成本暴跌至29.4萬美元，震撼全球科技圈！ — image credit : pexels

“`html

令人震驚的低成本！中國 DeepSeek R1 模型訓練僅需 29.4 萬美元

在人工智慧（AI）領域，模型訓練的成本一直是各家廠商關注的焦點。近日，中國 AI 開發商 DeepSeek 公布其 R1 模型的訓練成本僅為 29.4 萬美元，這個數字遠低於美國競爭對手所公布的數據，引發業界高度關注。這不僅顯示了 DeepSeek 在 AI 技術上的突破，也預示著 AI 競賽的格局可能發生變化。低成本的 AI 系統，無疑將加速 AI 技術的普及和應用，對各行各業都將產生深遠的影響。

DeepSeek R1 模型：低成本背後的秘密

R1 模型的核心競爭力是什麼？
DeepSeek 的 R1 模型專注於推論能力，旨在以更低的成本實現高效能。他們透過技術創新和優化，大幅降低了訓練所需的算力和資源。

29.4 萬美元的訓練成本是如何實現的？
DeepSeek 在《自然》雜誌的論文中指出，R1 模型使用了 512 顆 NVIDIA H800 晶片進行訓練，總計耗時 80 小時。此外，他們也承認在研發初期使用了 A100 晶片進行小模型實驗。

這對 NVIDIA 等 AI 晶片廠商有什麼影響？
DeepSeek 的低成本 AI 系統，可能會對 NVIDIA 等 AI 晶片廠商的市場地位產生一定影響。市場可能會重新評估 AI 模型的訓練成本，進而影響對高階晶片的需求。

中美 AI 競賽：成本、技術與策略

DeepSeek 低成本 R1 模型的出現，無疑為中美 AI 競賽增添了新的變數。美國 AI 巨頭 OpenAI 的執行長 Sam Altman 曾表示，基礎模型的訓練成本遠高於 1 億美元。相比之下，DeepSeek 的 29.4 萬美元成本顯得極具競爭力。這也引發了關於技術路線、算力資源以及數據策略等方面的討論。

關於「提煉」（Distillation）技術的爭議

美國白宮高階顧問曾指控 DeepSeek 將 OpenAI 的模型「提煉」成自己的模型。DeepSeek 對此首度回應，認為提煉技術能夠在大幅降低訓練和運行成本的同時，帶來更佳的模型效能，讓更多人能夠使用 AI 技術。DeepSeek 也承認，在部分自家提煉版本模型中使用了 Meta 的開源 Llama AI 模型。