Anthropic投資新AI評測基準:提升AI模型安全與效能

Featured Image
Anthropic計劃資助一個更全面的新一代AI基準
Anthropic計劃資助一個更全面的新一代AI基準,旨在評估AI模型的性能和影響,包括其自家的生成模型Claude。Anthropic在週一公布了這項計劃,將向第三方機構提供資助,這些機構能夠“有效測量AI模型的先進能力”,根據該公司在其官方博客上的聲明。有興趣的人可以提交申請,並根據滾動的方式進行評估。Anthropic在其官方博客上寫道:“我們對這些評估的投資旨在提升整個AI安全領域,提供有價值的工具,使整個生態系統受益。”“開發高質量、與安全相關的評估仍然具有挑戰性,需求正在超過供應。”正如我們之前所提到的,AI存在著基準問題。如今,最常被引用的AI基準無法很好地捕捉到普通人使用所測試的系統的方式。此外,一些基準問題,尤其是在現代生成AI誕生之前發布的那些基準問題,是否真正測量了它們所聲稱測量的內容,給人們帶來了疑問。Anthropic提出的非常高層次的解決方案是通過新的工具、基礎設施和方法創建具有挑戰性的基準,重點關注AI安全和社會影響。該公司特別要求進行測試,評估模型在執行網絡攻擊、“增強”大規模殺傷性武器(例如核武器)以及操縱或欺騙人們(例如通過深度偽造或錯誤信息)方面的能力。對於涉及國家安全和國防的AI風險,Anthropic表示將致力於開發一種“早期警報系統”,以識別和評估風險,盡管在博客文章中並未透露此類系統可能包含的內容。Anthropic還表示,該公司打算通過這一新計劃支持基準和“端到端”任務的研究,這些任務探索了AI在科學研究、多語言對話以及減少根深蒂固的偏見和自我審查毒性方面的潛力。Anthropic設想了新的平台,允許主題專家開發自己的評估並進行涉及“數千”用戶的模型大規模試驗。該公司表示已經聘請了一名全職協調員來負責該計劃,並可能購買或擴展具有潛力的項目。Anthropic在文章中寫道:“我們提供一系列根據每個項目的需求和階段量身定制的資金選擇。”然而,Anthropic的發言人拒絕提供有關這些選項的任何進一步細節。“團隊將有機會直接與Anthropic的領域專家(包括紅隊、微調、信任和安全等相關團隊)進行互動。”Anthropic支持新的AI基準的努力是值得稱讚的,前提是當然有足夠的資金和人力支持。但考慮到該公司在AI競賽中的商業野心,這可能是一個難以完全信任的項目。在博客文章中,Anthropic對於想要確定的事實相當透明

Share this content:

熱門内容

  • AI資訊
  • AI工具
  • AI繪圖指令
  • 食譜
  • ai生成圖片

    Introduction MyEdit  Midjourney DALL·E3 Stable Diffusio…

    Read more


  • Janitor Ai

    Introduction Platform Overview 1 Account Terminati…

    Read more


  • Stable Video Diffusion 穩定的圖片轉動畫Demo

    Stable Video Diffusion 穩定的圖片轉動畫Demo

    Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…

    Read more


  • HappyAccidents

    HappyAccidents

    HappyAccidents是一個提供預先訓練的AI模型庫的平台,讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…

    Read more


  • 文心一格

    文心一格

    「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布,利用百…

    Read more


  • Ai Gallery

    Ai Gallery

    Ai Gallery為用戶提供了一個強大的工具,利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…

    Read more


  • Graviti Diffus

    Graviti Diffus

    Graviti Diffus 是一個免部署的在線平台,專注於提供穩定擴散(Stable Diffusion)的…

    Read more


  • Aitubo

    Aitubo

    Aitubo是一個AI創作工具,它提供了方便且強大的功能,讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…

    Read more


  • SeaArt

    SeaArt

    SeaArt AI是一款免費且強大的AI繪畫工具,它能夠幫助使用者無需專業技能,輕鬆生成高品質的繪畫作品。 S…

    Read more


  • Diffusion Art

    Diffusion Art

    DiffusionArt是一個精選的開源AI藝術模型庫,專注於藝術、動漫和照片逼真圖像的生成,涵蓋數十個類別。…

    Read more


  • 秋分養生百合蓮子湯

    秋分養生百合蓮子湯簡介:秋分時節,氣候乾燥,適合食用滋潤養生的湯品。這道百合蓮子湯,清甜滋潤,有助於清肺止咳,…

    Read more


  • 薑蔥蠔油炆雞翼

    薑蔥蠔油炆雞翼簡介:這是一道充滿港式風味的家常菜,雞翼經過炆煮,鮮嫩入味,醬汁濃稠,非常下飯。適合秋冬季節食用…

    Read more


  • 蔓越莓咖哩牛肉烏冬

    蔓越莓咖哩牛肉烏冬簡介:結合日式烏冬、美式蔓越莓、及好市多牛小排,創造出意想不到的酸甜辛辣滋味,濃郁咖哩搭配Q…

    Read more


  • 懷舊粵式乾炒牛河

    懷舊粵式乾炒牛河簡介:這道菜是經典的粵菜代表,以河粉、牛肉為主料,搭配豆芽、蔥等配料,經過猛火快炒,鑊氣十足,…

    Read more


  • 味噌鮭魚烤菇

    味噌鮭魚烤菇簡介:這道菜結合了日式味噌的風味和烤箱的烹調方式,將鮭魚和菇類烤至香氣四溢,低卡高蛋白,健康美味,…

    Read more


  • 一周護腎湯水

    一周護腎湯水簡介:根據中醫師的建議,這款護腎湯水能幫助排毒,滋養腎臟。適合港澳台地區的濕熱氣候,每週飲用一次,…

    Read more


  • 味噌鮭魚烤菇

    味噌鮭魚烤菇簡介:這道菜結合了日式味噌的風味和烤箱的烹調方式,將鮭魚和菇類烤至香氣四溢,低卡高蛋白,健康美味。…

    Read more


  • 韓式風味乳酪杯

    韓式風味乳酪杯簡介:這款乳酪杯結合了韓式風味和乳酪的健康,以乳酪為基底,搭配水果和韓式辣醬,口感豐富,酸甜辣交…

    Read more


  • 薑絲蒜蓉炒時蔬

    薑絲蒜蓉炒時蔬簡介:這道菜選用當季新鮮蔬菜,以薑絲和蒜蓉爆香,簡單快炒,保留蔬菜的原汁原味和營養。清淡爽口,適…

    Read more


  • 花膠魚翅撈飯 (深水埗風味)

    花膠魚翅撈飯 (深水埗風味)簡介:這道撈飯是深水埗母子檔的招牌菜,用料十足,花膠和魚翅帶來豐富的膠原蛋白,搭配…

    Read more