
“`html
AGI曙光乍現?榮耀與阿里揭示AI從“思考”到“行動”的關鍵飛躍
通用人工智慧(AGI)的浪潮正以前所未有的速度逼近,我們是否已站在技術奇點的邊緣?在2025上海世界移動通信大會上,榮耀與阿里巴巴的重量級人物不約而同地指出,AGI的真正突破點不再僅僅局限於實驗室模型的精進,而是能否成功跨越從“思考”到“行動”的巨大鴻溝。持續探索多模態大模型的發展,將成為推動AGI走向現實的關鍵引擎。
讓AI真正走入生活:從三個轉變到三個打通
榮耀CEO李健提出了“三個轉變、三個打通、三個開放”的策略。他借鑒OpenAI CEO奧特曼的AGI五層框架理論,認為目前AI正處於從第二層向第三層過渡的關鍵階段。在AGI第二層,AI具備基本的邏輯推理能力,可以分析複雜信息並進行推斷,例如現有的編程助手和數學推理工具。而第三層的AI則能理解複雜指令,並在多任務環境中自主決策和靈活應對。
- AI的競爭焦點從模型能力轉向落地能力。
- AI的價值定位從工具效率轉向結果閉環。真正的AI應用,應該是主動替用戶完成任務,形成完整流程,並能自主學習和進化,越用越好。
- 從雲端計算轉向貼身存在。AI產品不應該是“你去找它”,而是“它就在你身邊”。
硬件是核心載體,不再只是承載模型的外殼,而是內在人格的延伸,與用戶共處、共感、共生。AI Agent 則是核心入口,它不是執行任務的應用,而是理解用戶意圖、自主執行任務、與結果交互閉環的生態入口,是用户的知己、智囊、夥伴。
李健認為,應有效打通場景、性能和信任這三方面,形成有效閉環。打破數據孤島、服務孤島、設備孤島,打通場景閉環;用端雲協同、軟硬協同、算網協同打通性能閉環;最後以技術共創、標準共建、行業共治打通信任閉環。
為加速AI落地,實現需求閉環,應秉持開放的規範、開放的思想和開放的理念,基於GSMA平台,共建開放的AI終端生態聯盟,集結AI模型企業、運營商、AI終端企業、互聯網企業四方力量,通過緊密協作與優勢互補,引領全行業變革。
多模態大模型:通往AGI的必經之路,但也充滿挑戰
阿里巴巴集團副總裁許主洪認為,通過整合文本、圖像、音頻、視頻等多種信息,多模態大模型可以提供更豐富的上下文理解能力,提升整體模型性能與準確度、降低幻覺。此外,多模態也會帶來更自然的人機交互體驗和更豐富的應用場景。
多模態理解任務需要解決多模態模態編碼、對齊、融合、語義理解和推理等問題。多模態生成任務則需要解決如何有效遵循輸入指令,如何生成和輸出高品質的多模態內容,比如圖片、視頻、語音等。
目前主流的技術是基於預訓練大語言模型(LLM)作為主幹網絡來連接和融合多種模態。不同的多模態大模型主要的差異是在連接
相關連結:
Share this content: