
“`html
近年來,中國人工智慧實驗室DeepSeek異軍突起,其聊天機器人應用程式在Apple App Store和Google Play上名列前茅,引發了廣泛關注。DeepSeek的AI模型以其高效的計算技術訓練,促使華爾街開始重新評估美國在AI領域的領先地位,並質疑AI晶片的需求是否能持續。本文將深入探討DeepSeek的崛起之路,以及其對全球AI產業可能產生的影響。
DeepSeek的崛起:一匹不容忽視的黑馬
DeepSeek背後有著雄厚的資金支持,它由High-Flyer Capital Management投資,這是一家中國量化對沖基金,利用AI進行交易決策。High-Flyer由AI愛好者梁文峰於2015年共同創立。 2019年,梁文峰推出了High-Flyer Capital Management,專注於開發和部署AI演算法。 2023年,High-Flyer成立了DeepSeek實驗室,專注於AI工具的研究,與其金融業務分開。之後,DeepSeek從實驗室分拆成獨立公司,名稱也沿用DeepSeek。從一開始,DeepSeek就建立了自己的資料中心叢集用於模型訓練。
技術實力:高效的模型與創新
DeepSeek於2023年11月推出了第一批模型,包括DeepSeek Coder、DeepSeek LLM和DeepSeek Chat。但直到去年春天,該公司發布了下一代DeepSeek-V2系列模型後,AI產業才開始真正關注它。DeepSeek-V2是一種通用的文字和圖像分析系統,在各種AI基準測試中表現出色,而且運行成本遠低於當時的同類模型。這迫使包括字節跳動和阿里巴巴在內的DeepSeek國內競爭對手降低了其部分模型的使用價格,並使其他模型完全免費。
DeepSeek V3和R1模型:令人驚豔的性能
DeepSeek V3於2024年12月推出,進一步提升了DeepSeek的知名度。根據DeepSeek的內部基準測試,DeepSeek V3的性能優於可下載的開放模型和只能透過API存取的封閉模型,例如OpenAI的GPT-4。同樣令人印象深刻的是DeepSeek的R1“推理”模型。DeepSeek聲稱R1在關鍵推理任務上的表現與OpenAI的GPT-4o模型一樣出色。作為一種推理模型,R1可以有效地進行自我事實核查,這有助於它避免一些常見的錯誤。推理模型通常比非推理模型需要更長的時間才能得出解決方案,但它們在物理、科學和數學等領域往往更可靠。
潛在的隱憂:社會主義核心價值觀的限制
然而,DeepSeek V3、R1和DeepSeek的其他模型也存在一些問題。作為中國開發的AI,它們受到中國網路監管機構的監管,以確保其回應“體現社會主義核心價值觀”。例如,在DeepSeek的聊天機器人應用程式中,R1不會回答有關天安門廣場或台灣自治權的問題。
市場表現:流量增長與競爭
DeepSeek在2024年3月的使用者數量超過了1650萬。 Similarweb的編輯David Carr表示,儘管DeepSeek的流量較2月份下降了25%,但在3月份仍排名第二。儘管如此,與ChatGPT相比,DeepSeek的規模仍然相形見絀,ChatGPT在3月份的每週活躍使用者數量超過了5億。 5月,DeepSeek在開發者平台Hugging Face上發布了更新版本的R1推理AI。
DeepSeek的獨特策略:顛覆性方法
DeepSeek的商業模式具有顛覆性,它專注於提供高效且低成本的AI模型,這對市場上的其他玩家構成了挑戰。儘管受到美國出口禁令的影響,DeepSeek仍能透過使用Nvidia H800晶片(一種不如H100的晶片)來訓練其模型。此外,DeepSeek積極從中國頂尖大學招募AI博士研究人員,並且還聘用
相關連結:
Share this content: