Anthropic投資新AI評測基準:提升AI模型安全與效能

Featured Image
Anthropic計劃資助一個更全面的新一代AI基準
Anthropic計劃資助一個更全面的新一代AI基準,旨在評估AI模型的性能和影響,包括其自家的生成模型Claude。Anthropic在週一公布了這項計劃,將向第三方機構提供資助,這些機構能夠“有效測量AI模型的先進能力”,根據該公司在其官方博客上的聲明。有興趣的人可以提交申請,並根據滾動的方式進行評估。Anthropic在其官方博客上寫道:“我們對這些評估的投資旨在提升整個AI安全領域,提供有價值的工具,使整個生態系統受益。”“開發高質量、與安全相關的評估仍然具有挑戰性,需求正在超過供應。”正如我們之前所提到的,AI存在著基準問題。如今,最常被引用的AI基準無法很好地捕捉到普通人使用所測試的系統的方式。此外,一些基準問題,尤其是在現代生成AI誕生之前發布的那些基準問題,是否真正測量了它們所聲稱測量的內容,給人們帶來了疑問。Anthropic提出的非常高層次的解決方案是通過新的工具、基礎設施和方法創建具有挑戰性的基準,重點關注AI安全和社會影響。該公司特別要求進行測試,評估模型在執行網絡攻擊、“增強”大規模殺傷性武器(例如核武器)以及操縱或欺騙人們(例如通過深度偽造或錯誤信息)方面的能力。對於涉及國家安全和國防的AI風險,Anthropic表示將致力於開發一種“早期警報系統”,以識別和評估風險,盡管在博客文章中並未透露此類系統可能包含的內容。Anthropic還表示,該公司打算通過這一新計劃支持基準和“端到端”任務的研究,這些任務探索了AI在科學研究、多語言對話以及減少根深蒂固的偏見和自我審查毒性方面的潛力。Anthropic設想了新的平台,允許主題專家開發自己的評估並進行涉及“數千”用戶的模型大規模試驗。該公司表示已經聘請了一名全職協調員來負責該計劃,並可能購買或擴展具有潛力的項目。Anthropic在文章中寫道:“我們提供一系列根據每個項目的需求和階段量身定制的資金選擇。”然而,Anthropic的發言人拒絕提供有關這些選項的任何進一步細節。“團隊將有機會直接與Anthropic的領域專家(包括紅隊、微調、信任和安全等相關團隊)進行互動。”Anthropic支持新的AI基準的努力是值得稱讚的,前提是當然有足夠的資金和人力支持。但考慮到該公司在AI競賽中的商業野心,這可能是一個難以完全信任的項目。在博客文章中,Anthropic對於想要確定的事實相當透明

Share this content:

熱門内容

  • AI資訊
  • AI工具
  • AI繪圖指令
  • 食譜
  • ai生成圖片

    Introduction MyEdit  Midjourney DALL·E3 Stable Diffusio…

    Read more


  • Janitor Ai

    Introduction Platform Overview 1 Account Terminati…

    Read more


  • Stable Video Diffusion 穩定的圖片轉動畫Demo

    Stable Video Diffusion 穩定的圖片轉動畫Demo

    Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…

    Read more


  • HappyAccidents

    HappyAccidents

    HappyAccidents是一個提供預先訓練的AI模型庫的平台,讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…

    Read more


  • 文心一格

    文心一格

    「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布,利用百…

    Read more


  • Ai Gallery

    Ai Gallery

    Ai Gallery為用戶提供了一個強大的工具,利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…

    Read more


  • Graviti Diffus

    Graviti Diffus

    Graviti Diffus 是一個免部署的在線平台,專注於提供穩定擴散(Stable Diffusion)的…

    Read more


  • Aitubo

    Aitubo

    Aitubo是一個AI創作工具,它提供了方便且強大的功能,讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…

    Read more


  • SeaArt

    SeaArt

    SeaArt AI是一款免費且強大的AI繪畫工具,它能夠幫助使用者無需專業技能,輕鬆生成高品質的繪畫作品。 S…

    Read more


  • Diffusion Art

    Diffusion Art

    DiffusionArt是一個精選的開源AI藝術模型庫,專注於藝術、動漫和照片逼真圖像的生成,涵蓋數十個類別。…

    Read more


  • 雞翅的十種簡單做法

    雞翅的十種簡單做法

    雞翅不僅美味可口,而且烹飪方法多樣,是家庭聚餐和派對的理想選擇。以下是十種簡單易做的雞翅料理,包括醬汁配方、烹…

    Read more


  • 新手廚房急速入門:從零開始的烹飪之旅

    新手廚房急速入門:從零開始的烹飪之旅

    无论是刚搬出去独立生活的大学生,还是想要为家人烹饪美味佳肴的新手主妇,掌握基本的厨艺都是一项重要的生活技能。本…

    Read more


  • 蜜汁檸檬雞翼

    蜜汁檸檬雞翼

    蜜汁檸檬雞翼簡介:這道菜以雞翼為主要食材,搭配蜜汁和檸檬的酸甜滋味,口感香脆多汁,讓人食指大動。準備時間:15…

    Read more


  • 清爽涼拌黃瓜

    清爽涼拌黃瓜

    清爽涼拌黃瓜簡介:這道涼拌黃瓜清爽爽脆,適合夏天食用,消暑解渴。準備時間:10分鐘烹飪時間:0分鐘食用人數:2…

    Read more


  • 清炒秋葵

    清炒秋葵

    清炒秋葵簡介:這道菜以新鮮的秋葵為主要食材,簡單清炒保留了秋葵的鮮甜口感,是一道清爽可口的家常菜。準備時間:1…

    Read more


  • 清炒時蔬

    清炒時蔬

    清炒時蔬簡介:這道菜以時令蔬菜為主要食材,經過清炒後,保留了蔬菜的鮮甜口感,營養豐富,清淡可口。準備時間:10…

    Read more


  • 涼拌海帶絲

    涼拌海帶絲

    涼拌海帶絲簡介:這道清涼爽口的涼拌海帶絲適合夏日食用,不僅口感爽脆,而且營養豐富。準備時間:15分鐘烹飪時間:…

    Read more


  • 清炒芥蘭

    清炒芥蘭

    清炒芥蘭簡介:這道菜以新鮮的芥蘭為主要食材,經過快速清炒後,保留了蔬菜的鮮甜味道,是一道營養豐富的健康菜品。準…

    Read more


  • 清炒西蘭花

    清炒西蘭花

    清炒西蘭花簡介:這道菜採用新鮮的西蘭花,經過簡單清炒後,保留了原汁原味,清爽可口,是一道健康又美味的家常菜。準…

    Read more


  • 夏日涼拌黃瓜

    夏日涼拌黃瓜

    夏日涼拌黃瓜簡介:清爽涼口的夏日小食,適合作為開胃菜或下酒菜,簡單易做,清涼解渴。準備時間:10分鐘烹飪時間:…

    Read more