dataengine是這篇文章討論的核心


Meta偷偷組建「AI資料引擎」軍團!揭秘科技巨頭如何悄悄改寫超智慧未來
Photo by Google DeepMind on Pexels – 神經網路的抽象視覺化呈現

Meta偷偷組建「AI資料引擎」軍團!揭秘科技巨頭如何悄悄改寫超智慧未來

⚡ 快速精華

  • 💡 核心結論: Meta成立全新應用型AI工程部門,建立”資料引擎飛輪”系統,這不是組織調整而是超智慧研发的關鍵基礎建設。
  • 📊 關鍵數據: 全球AI市場預計2026年達到$317亿-$514亿美元,到2034年有望突破$2.48兆美元。AI加速器市場2027年將達$4000亿美元
  • 🛠️ 行動指南: 關注Meta數據引擎供應鏈機會,評估企業級AI工具整合契機,提前佈局agentic AI生態位。
  • ⚠️ 風險預警: Meta Reality Labs累計虧損近$636億美元,AI軍備竞赛可能引發監管反彈,超智慧開發存在倫理困境。

引言:是時候重新理解Meta的AI下盤功夫了

當所有人焦點都在Meta推出LLaMA系列模型或者 intensive marketing 的AI功能時,《華爾街日報》拿到的那份內部備忘錄真是狠。它揭示了一個完全不同的維度——Meta正在悄悄建立一個全新的「應用型AI工程」部門,目標直指所谓的”超級智慧”(Superintelligence)。這種做法根本不像一般公司的產品開發,反而比較接近美國NASA當年建立任務控制中心的架構。

別再以為Meta只是在跟風做AI應用了。根據多方情報交叉比對,Meta在2025年夏季重組AI研發體系時,成立了Meta Superintelligence Lab (MSL),挖來Scale AI創辦人Alexandr Wang擔任首任CAIO( Chief AI Officer)。現在這個新部門由Maher Saba領導,向技術長Andrew Bosworth匯報。這不是普通的汇报线,而是將AI工程能力直接接入超智慧實驗室的”資料供給系統”。

最關鍵的是,Wang和Saba的協作模式被設計成”雙引擎”:Wang的MSL專注於前沿模型研發(如內部代號Avocado和Mango的新架構),Saba的團隊則負責把真實世界的資料、使用者反饋和評估結果轉化成”訓練燃料”。這種分工實際上是在打造一個自動化的資料回圈,讓模型進步的速度呈現指數級成長。

飛輪效應:資料引擎如何驅動超級智慧

當談到AI模型訓練時,大多數人只想到算力堆砌和參數量爆炸。Saba在內部備忘錄裡點的明:“我們要建立的是能幫助模型進步得更快的資料引擎”。這句話背後藏著Meta超直白的策略邏輯——訓練数据才是比GPU更稀缺的資源

看看實際數據就懂:根據Bain & Company的預測,AI產品和服務市場到2027年可能達到$780億-$990億美元。而AMD甚至預估AI加速器單一市場規模到2027年將飆升至$4000億美元。這些都是硬體成本,但Meta想控制的是另外一個層次——訓練->部署->收集->再訓練的完整資料生命週期。

Meta AI資料引擎飛輪效應示意圖 四個階段構成的循環:資料收集 -> 模型訓練 -> 產品部署 -> 使用者反饋,形成持續增強的飛輪,中心為Meta的AI生態系統 資料引擎飛輪

資料收集

模型訓練

產品部署

使用者反饋 (訓練->部署->收集->再訓練)

Meta Superintelligence Lab

Pro Tip: 這套飛輪系統的核心優勢在於Meta自家社交生態的獨特數據源——Facebook、Instagram、WhatsApp每日產生的 engagment 信號、內容生成行為,以及Reality Labs的AR/VR交互數據,都是其他AI laboratory他們拿不到的「真實世界」訓練素材。Wang之前創辦Scale AI就是做data labeling,現在把這套流程內化,等於是把數據供應鏈掌握在自己手裡。

從投資角度來看,資料引擎策略改變了AI競賽的遊戲規則。傳統上大家競相購買更多GPU,但Meta這一手顯示他們認為持續的data pipeline才是護城河。Statista預測AI市場規模將從2025年的$245B增長到2026年的$318B,MetaWant分的不僅是這份蛋糕,而是確保自己永遠有最新鮮的原料供應。

組織密碼:扁平成50人隊列的作戰單位

聽到每個主管管理約50名員工這個數字時,我腦袋裡馬上跳出Amazon的兩個pizza團隊原則。Meta內部這次 apparently 採用了極度扁平的管理結構,這種架構在 Reality Labs 裡已經運行了幾年,但最近擴展到整個AI研发體系。

為什麼要刻意維持這種規模?根據Business Insider的報導,這種設計是為了保持”小团队的執行速度”同時又能享有”大型企業的資源優勢”。Saba領導的團隊分為兩個子團隊:一個專門建立介面與內部工具,另一個執行任務、生成資料並提供評估結果。這種分工模式讓人想到Google早期的”20%時間”創新文化,只不過現在被制度化到超智慧研發流程中。

還有一個微妙之處在於汇报线:Saba向CTO Andrew Bosworth匯報,而Wang的MSL則是獨立運作但緊密協作。根據LinkedIn上的情報,这两位老大會定期開會sync資料流和模型迭代的roadmap。這種結構確保了研究(Wang)和工程(Saba)不會脫節,也解釋了為什麼Zuckerburg會在X平台上親自闢謠Wang影響力被削弱的傳聞——這個雙體系的平衡太關鍵了

從組織行為學角度觀察,Meta這次重組有意避開了”象牙塔式”的研究部門病。很多公司的AI lab淪為論文工廠,但Meta把”應用型工程”直接embed到超智慧研發流程中,確保每個模型迭代都有實戰測試環境。

和微軟、Google的不同策略:為何Meta選擇內部孵化

當你以為所有科技巨頭都走”砸錢買外部天才或併購”路線時,Meta這次展現了完全不同的打法。對比微軟對OpenAI的百億美元投資,或者Google DeepMind的內部研究+外部收購混合模式,Meta選擇的是”內部孵化+精英小隊”。

那么在内部备忘录中明確提到:新部門任務是”建立使模型進步得更快的資料引擎”。這意味著Meta不欲依賴第三方數據供應商(如Scale AI原本的業務),而是要把所有環節in-house。根據The New York Times報導,Meta對Scale AI的投資包含$143億美元的條款,一部分原因就是確保Wang帶領的MSL能優先獲得Scale的數據標註能力,同時也防止競爭對手取得。

這種策略的風險/reward是什麼? 好處是完全掌控技術棧,不用看partner臉色;壞處是發展速度可能受限於內部流程。但Meta顯然評估後認為,超智慧(Superintelligence)這種核心技術不能被外部公司綁住。而且Wang本身就來自外部创业公司,這combination讓Meta得以”內部建設外部效率”。

另外一個獨特之處在於,Meta把這個架構放在Reality Labs部門底下。這不是隨機選擇——Reality Labs聚集了元宇宙、AR眼鏡等下一代交互平台,這代表Meta要把AI能力直接嵌入未來的硬體產品,而不是像Google那样主要做雲端服務。

2026-2030時間線:超智慧竞赛的倒計時

Mark Zuckerburg公開表示將在”未來數月”推出新模型與產品。但業內資深人士指出,真正的里程碑是2027年——專家普遍預測人工超智慧(ASI)可能在此時點前後出現。根據AI-2027的報告,”early 2027年可能創造出專家層級的人类AI系統,並在同年自動化AI研究,導致年底達到ASI”。

Meta超智慧路線圖與市場規模預測 時間軸從2025到2030,標示Meta內部項目(Avocado/Mango)與AI市場規模增長曲線(單位:十億美元)

2025 2026 2027 2028 2029 2030 2034

MSL成立

Avocado內測

Mango上線

ASI目標

市場規模↓ (十億美元) 2,480B

Meta的內部時間表顯然比外界預期的更激進。關鍵數據點: Forturne Business Insights預測全球AI市場將從2026年的$3759億美元增長到2034年的$2.48兆美元,複合年增長率達26.6%。如果Meta能在2027年前後實現ASI突破,他們將抢在行業爆發前完成技術壟斷。

但要注意的是,Meta Reality Labs部門累計虧損已經達到驚人的$635.9億美元。投資人會不會有耐心讓Zuckerburg繼續燒錢,要看2026-2027年能不能看到明確的商業化路徑。目前外界普遍猜測Meta可能將超智慧能力整合到社交產品中,或是透過AR眼鏡直接交付給消費者。

常見問題

什麼是Meta的”資料引擎”策略?

Meta的資料引擎策略強調建立自動化的訓練數據收集與評估迴圈。Saba領導的團隊負責將真實世界的使用者互動、產品使用數據轉換成模型訓練素材,形成”收集->訓練->部署->反饋”的飛輪,加速模型迭代速度。

Alexandr Wang在Meta的角色是什麼?

Alexandr Wang是Meta首位首席AI官,領導Meta Superintelligence Labs (MSL)。他負責前沿模型研發(如Avocado和Mango),並與Saba的應用工程團隊協作,確保研究轉化為實際產品能力。Wang的背景是數據標註公司Scale AI,這讓Meta能快速建立內部訓練數據管道。

Meta的超智慧計劃和OpenAI、Google有什麼不同?

Meta選擇內部孵化而非外部投資,並將AI能力直接整合到 Reality Labs 的硬體生態(如AR眼鏡)。相較OpenAI專注於API服務和Google的雲端AI產品,Meta的優勢在於擁有數十億用戶的即時行為數據,這為”資料引擎飛輪”提供獨的養分。

Share this content: