
DeepSeek 的崛起正掀起全球科技圈的熱議,這款由中國人工智慧實驗室開發的聊天機器人應用程式,在短短時間內攻占了 Apple App Store 和 Google Play 的榜首,引發了人們對中美 AI 競爭格局的關注。DeepSeek 的成功不僅僅是技術上的突破,更代表了中國在 AI 領域的崛起和發展潛力。
DeepSeek 的起源與發展
DeepSeek 背後的推手是中國量化對沖基金 High-Flyer Capital Management,該公司自 2015 年成立以來一直致力於運用 AI 技術進行交易。High-Flyer 的創始人梁文峰是一位 AI 愛好者,他於 2019 年創立了 High-Flyer Capital Management,專注於開發和部署 AI 演算法。2023 年,High-Flyer 成立了 DeepSeek 實驗室,專注於 AI 工具的研究,並於同年將其分拆成獨立的公司。DeepSeek 從一開始就建立了自己的數據中心集群用於模型訓練,並積極從中國頂尖大學招募博士學位的 AI 研究人員。
DeepSeek 在模型訓練方面面臨著美國出口禁令的影響,這導致他們不得不使用 Nvidia H800 芯片,該芯片性能不及美國公司使用的 H100 芯片。儘管如此,DeepSeek 的技術團隊仍然表現出色,他們積極招募 AI 研究人員,並聘用非電腦科學背景的員工,幫助其技術更好地理解各種主題。
DeepSeek 的模型實力
DeepSeek 在 2023 年 11 月推出了首批模型,包括 DeepSeek Coder、DeepSeek LLM 和 DeepSeek Chat。然而,直到 2024 年春季,DeepSeek 推出下一代 DeepSeek-V2 模型家族時,才開始引起 AI 行業的關注。DeepSeek-V2 是一種通用的文本和圖像分析系統,在各種 AI 基準測試中表現出色,而且運行成本遠低於當時的同類模型。它迫使中國國內競爭對手,包括字節跳動和阿里巴巴,降低其部分模型的價格,甚至將其他模型完全免費提供。
DeepSeek V3 於 2024 年 12 月推出,其內部基準測試表明,它在性能上超越了 Meta 和 OpenAI 等公司的模型。DeepSeek 的 R1 “推理” 模型於 2025 年 1 月推出,DeepSeek 聲稱其在關鍵的推理任務中表現出色。R1 作為推理模型,可以有效地自我事實核查,這有助於它避免一些通常會讓模型陷入困境的陷阱。雖然推理模型的運作時間較長,但它們在物理學、科學和數學等領域更加可靠。
DeepSeek 的挑戰與機遇
DeepSeek 的商業模式尚不清楚,但其產品和服務的價格遠低於市場水平,甚至免費提供部分服務。DeepSeek 聲稱其效率突破使他們能夠保持極低的成本競爭力。然而,一些專家對該公司提供的數據持懷疑態度。
作為中國開發的 AI,DeepSeek 的模型受到中國網路監管機構的監管,以確保其響應內容符合 “核心社會主義價值觀”。例如,DeepSeek 的聊天機器人應用程式不會回答有關天安門廣場或台灣自治的問題。
DeepSeek 的影響與未來展望
DeepSeek 的崛起表明中國在 AI 領域的競爭力正在迅速提高,並對全球 AI 產業產生了巨大影響。DeepSeek 的低成本模型正在挑戰傳統 AI 公司的定價策略,並推動了整個產業的發展。DeepSeek 的成功也表明,AI 技術的發展不再是西方國家的專利,中國也正在成為 AI 領域的領導者。
相關連結:
Share this content: