Deep Cogito 突破性開源模型,顛覆 AI 市場格局

AI, Cogito v1, Deep Cogito, Distillation, Open Source AI Model
image credit : pexels

在人工智慧領域中,大型語言模型(LLM)的發展日新月異,其應用也逐漸擴展至各個領域。然而,高昂的開發成本一直是阻礙 LLM 大規模應用的主要因素。為此,開源 LLM 近年來備受關注,DeepSeek 的出現更進一步推動了開源 LLM 的發展。最近,舊金山的人工智慧新創公司 Deep Cogito 推出了全新開源大型語言模型(LLM)系列 Cogito v1,其表現令人驚艷,甚至直逼先進的閉源模型。

Deep Cogito 的 Cogito v1:開源 LLM 的突破性進展

  • Cogito v1 的訓練方法與特色
    Cogito v1 基於 Meta 的 Llama 3.2 模型微調而成,採用獨特的蒸餾和增強(IDA)訓練方法。與傳統的人類回饋強化學習(RLHF)或教師模型蒸餾不同,IDA 分配更多計算資源來產生解決方案,然後將推理過程蒸餾到模型參數中,建立回饋循環。這種方法類似於 Google AlphaGo 的自我對弈,但應用於自然語言處理。
  • Cogito v1 的性能表現
    Cogito v1 模型在通用知識、數學推理和多語言任務方面表現出色。在 MMLU 測試中,Cogito 3B(標準模式)的得分比 LLaMA 3.2 3B 高 6.7 個百分點,在推理模式下,Cogito 3B 的得分更是超過自身的標準模式,展現了 IDA 基於推理的優勢。Cogito 8B(標準模式)在 MMLU 的得分也比 LLaMA 3.1 8B 高出 12.8 個百分點。
  • Cogito v1 的工具調用功能
    Cogito v1 原生支援工具調用,這是代理和 API 整合系統日益重視的功能。Cogito 3B 支援四種工具調用模式,而 LLaMA 3.2 3B 則不支援。在工具調用測試中,Cogito 3B 表現優異,簡單工具調用得分為 92.8%,多重工具調用得分更超過 91%。
  • Cogito v1 的影響與應用

    企業的機會與挑戰

  • 降低 AI 應用門檻
    Cogito v1 的開源商業許可特性,使企業能夠低成本部署高性能 AI 模型,無需負擔昂貴的專有模型訂閱費。這對於中小企業而言,降低了 AI 應用的門檻,使其更容易實現業務自動化和智慧化。
  • 更靈活的 AI 應用場景
    Cogito v1 的混合推理能力為企業提供了更靈活的 AI 應用場景。在需要快速回應的客戶服務場景中,標準模式可以提供即時答案;而在涉及複雜問題解決或決策支援的場景中,推理模式能夠提供更深入的分析和更可靠的結果。企業可以根據不同業務需求,靈活切換模型的工作模式,提高整體效率和準確性。
  • 更強大的 AI 開發能力
    Cogito v1 的工具調用原生支援,使企業開發更複雜 AI 應用時更方便。企業可以將 Cogito 模型與系統和 API 整合,開發更強操作功能的 AI 助理或代理人,從查詢資訊到操作無縫過渡。客服 AI 不僅可以回答問題,還能直接查詢訂單系統、更新客戶資訊或觸發特定流程。
  • 自定義 AI 系統的可能性
    對於有技術力的企業,Deep Cogito 的蒸餾和增強(IDA)訓練方法提供了一個值得研究的方向。企業可以嘗試使用類似方法,根據特定範疇數據和任務最佳化基礎模型,開發更適合業務場景的專業 AI 系統。
  • 開源 AI 的未來趨勢

  • 性能差距縮小,開源生態系統成熟
    Cogito v1 的出現和其技術路線反映了 AI 界幾個關鍵趨勢。首先,開源 LLM 的性能差距快速縮小,甚至在某些方面超越了

    相關連結:

    siuleeboss

    Share this content:

  • 熱門内容

    • AI資訊
    • AI工具
    • AI繪圖指令
    • 食譜
    • ai生成圖片

      Introduction MyEdit  Midjourney DALL·E3 Stable Diffusio…

      Read more


    • Janitor Ai

      Introduction Platform Overview 1 Account Terminati…

      Read more


    • Stable Video Diffusion 穩定的圖片轉動畫Demo

      Stable Video Diffusion 穩定的圖片轉動畫Demo

      Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…

      Read more


    • HappyAccidents

      HappyAccidents

      HappyAccidents是一個提供預先訓練的AI模型庫的平台,讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…

      Read more


    • 文心一格

      文心一格

      「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布,利用百…

      Read more


    • Ai Gallery

      Ai Gallery

      Ai Gallery為用戶提供了一個強大的工具,利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…

      Read more


    • Graviti Diffus

      Graviti Diffus

      Graviti Diffus 是一個免部署的在線平台,專注於提供穩定擴散(Stable Diffusion)的…

      Read more


    • Aitubo

      Aitubo

      Aitubo是一個AI創作工具,它提供了方便且強大的功能,讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…

      Read more


    • SeaArt

      SeaArt

      SeaArt AI是一款免費且強大的AI繪畫工具,它能夠幫助使用者無需專業技能,輕鬆生成高品質的繪畫作品。 S…

      Read more


    • Diffusion Art

      Diffusion Art

      DiffusionArt是一個精選的開源AI藝術模型庫,專注於藝術、動漫和照片逼真圖像的生成,涵蓋數十個類別。…

      Read more


    • 懷舊粵式乾炒牛河

      懷舊粵式乾炒牛河簡介:這道菜是經典的粵菜代表,以河粉、牛肉為主料,搭配豆芽、蔥等配料,經過猛火快炒,鑊氣十足,…

      Read more


    • 味噌鮭魚烤菇

      味噌鮭魚烤菇簡介:這道菜結合了日式味噌的風味和烤箱的烹調方式,將鮭魚和菇類烤至香氣四溢,低卡高蛋白,健康美味,…

      Read more


    • 一周護腎湯水

      一周護腎湯水簡介:根據中醫師的建議,這款護腎湯水能幫助排毒,滋養腎臟。適合港澳台地區的濕熱氣候,每週飲用一次,…

      Read more


    • 味噌鮭魚烤菇

      味噌鮭魚烤菇簡介:這道菜結合了日式味噌的風味和烤箱的烹調方式,將鮭魚和菇類烤至香氣四溢,低卡高蛋白,健康美味。…

      Read more


    • 韓式風味乳酪杯

      韓式風味乳酪杯簡介:這款乳酪杯結合了韓式風味和乳酪的健康,以乳酪為基底,搭配水果和韓式辣醬,口感豐富,酸甜辣交…

      Read more


    • 薑絲蒜蓉炒時蔬

      薑絲蒜蓉炒時蔬簡介:這道菜選用當季新鮮蔬菜,以薑絲和蒜蓉爆香,簡單快炒,保留蔬菜的原汁原味和營養。清淡爽口,適…

      Read more


    • 花膠魚翅撈飯 (深水埗風味)

      花膠魚翅撈飯 (深水埗風味)簡介:這道撈飯是深水埗母子檔的招牌菜,用料十足,花膠和魚翅帶來豐富的膠原蛋白,搭配…

      Read more


    • 花膠瑤柱蛋白炒飯

      花膠瑤柱蛋白炒飯簡介:這道炒飯將花膠、瑤柱的鮮味融入炒飯中,搭配蛋白,口感豐富,營養均衡,適合各個季節享用。參…

      Read more


    • 夏日清新西蘭花蝦仁豆腐羹

      夏日清新西蘭花蝦仁豆腐羹簡介:這道羹品結合了西蘭花的營養、蝦仁的鮮美和豆腐的嫩滑,口感清爽,非常適合炎熱的夏季…

      Read more


    • 香煎乳酪吐司配時令水果

      香煎乳酪吐司配時令水果簡介:這道菜結合了乳酪的豐富蛋白質和鈣質,搭配吐司提供碳水化合物,再佐以當季水果,提供維…

      Read more