Anthropic投資新AI評測基準：提升AI模型安全與效能

Anthropic計劃資助一個更全面的新一代AI基準
Anthropic計劃資助一個更全面的新一代AI基準，旨在評估AI模型的性能和影響，包括其自家的生成模型Claude。Anthropic在週一公布了這項計劃，將向第三方機構提供資助，這些機構能夠“有效測量AI模型的先進能力”，根據該公司在其官方博客上的聲明。有興趣的人可以提交申請，並根據滾動的方式進行評估。Anthropic在其官方博客上寫道：“我們對這些評估的投資旨在提升整個AI安全領域，提供有價值的工具，使整個生態系統受益。”“開發高質量、與安全相關的評估仍然具有挑戰性，需求正在超過供應。”正如我們之前所提到的，AI存在著基準問題。如今，最常被引用的AI基準無法很好地捕捉到普通人使用所測試的系統的方式。此外，一些基準問題，尤其是在現代生成AI誕生之前發布的那些基準問題，是否真正測量了它們所聲稱測量的內容，給人們帶來了疑問。Anthropic提出的非常高層次的解決方案是通過新的工具、基礎設施和方法創建具有挑戰性的基準，重點關注AI安全和社會影響。該公司特別要求進行測試，評估模型在執行網絡攻擊、“增強”大規模殺傷性武器（例如核武器）以及操縱或欺騙人們（例如通過深度偽造或錯誤信息）方面的能力。對於涉及國家安全和國防的AI風險，Anthropic表示將致力於開發一種“早期警報系統”，以識別和評估風險，盡管在博客文章中並未透露此類系統可能包含的內容。Anthropic還表示，該公司打算通過這一新計劃支持基準和“端到端”任務的研究，這些任務探索了AI在科學研究、多語言對話以及減少根深蒂固的偏見和自我審查毒性方面的潛力。Anthropic設想了新的平台，允許主題專家開發自己的評估並進行涉及“數千”用戶的模型大規模試驗。該公司表示已經聘請了一名全職協調員來負責該計劃，並可能購買或擴展具有潛力的項目。Anthropic在文章中寫道：“我們提供一系列根據每個項目的需求和階段量身定制的資金選擇。”然而，Anthropic的發言人拒絕提供有關這些選項的任何進一步細節。“團隊將有機會直接與Anthropic的領域專家（包括紅隊、微調、信任和安全等相關團隊）進行互動。”Anthropic支持新的AI基準的努力是值得稱讚的，前提是當然有足夠的資金和人力支持。但考慮到該公司在AI競賽中的商業野心，這可能是一個難以完全信任的項目。在博客文章中，Anthropic對於想要確定的事實相當透明

Share this content:

熱門内容

軟銀英特爾推革命性AI記憶體，功耗減半震撼科技界

任天堂推出Nintendo Music串流平台月費31元聽遊戲經典配樂

Framework推出最新模組化電腦，DIY迷你伺服器不再困難

全球首例！鈦合金人工心臟成功移植創醫療奇蹟

微軟撤離中國！上海AI IoT實驗室閃電關閉，引發市場震動

Discord創新民主奇蹟！尼泊爾首位女性臨時總理誕生軍方背書

AI資訊
AI工具
AI繪圖指令
食譜

AI驚爆！0.3%月表掃描找到未來月球生存關鍵洞穴

AI僅掃描0.3%月表，即發現兩處關鍵月球坑洞，具潛在居住與水源價值，為未來太空任務提供重要據點，助推人類探索…
→ Read more
最新研究揭露：粗魯提問ChatGPT竟提升AI回答準確率驚人反差

賓州大學研究發現，對ChatGPT採用粗魯語氣提問反而提升回答準確率，顯示情緒色彩影響大型語言模型表現，帶來A…
→ Read more
AI地震檢測革命：機器學習捕捉人類難察覺的微震新突破

AI技術革新地震學，機器學習精準捕捉微小地震，提升地殼活動監測能力，有助預測與災害防範，開啟地震研究新視野。
→ Read more
AI地震檢測革命：機器學習揭露人眼無法感知的微震奧秘

AI技術革新地震學，自動精準偵測微小地震，揭示人類無法感知的地殼動態，提升災害預警與地球科學研究效率。
→ Read more
蘋果M5芯片首秀本週來襲，iPad Pro與新AirPods驚悚曝光

蘋果首批搭載M5芯片新品本周亮相，包括新iPad Pro與Vision Pro，並有望推出配備H3芯片的Air…
→ Read more
蘋果突停支持Clips應用，App Store已全面下架震撼用戶

蘋果已停止支持照片視頻編輯應用Clips，並將其從App Store下架。新用戶無法下載，現有用戶仍可使用並重…
→ Read more
谷歌Chrome新規則：告別煩人通知重塑安全瀏覽體驗

谷歌Chrome將優化通知功能，自動屏蔽參與度低且頻繁推送通知的網站，減少用戶干擾，提升瀏覽體驗，促使垃圾通知…
→ Read more
AMD Ryzen AI Max＋395超強掌機GPD WIN 5外掛電池首發驚艷登場

GPD WIN 5搭載AMD Ryzen AI Max+ 395處理器，具備強大內顯與AI運算性能，採用外掛電…
→ Read more
Intel 18A製程引爆AI革命，2025Tech Tour揭露半導體未來祕辛

Intel Tech Tour 2025揭示Panther Lake與先進製程技術，重點解析AI運算趨勢與異質…
→ Read more
Intel Panther Lake 2025新架構曝光 16核Xe顯示驚人效能提升

Intel Panther Lake行動版處理器，採用Cougar Cove與Darkmont核心，支援16核…
→ Read more

ai生成圖片

Introduction MyEdit Midjourney DALL·E3 Stable Diffusio…
→ Read more
Janitor Ai

Introduction Platform Overview 1 Account Terminati…
→ Read more
Stable Video Diffusion 穩定的圖片轉動畫Demo

Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…
→ Read more
HappyAccidents

HappyAccidents是一個提供預先訓練的AI模型庫的平台，讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…
→ Read more
文心一格

「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布，利用百…
→ Read more
Ai Gallery

Ai Gallery為用戶提供了一個強大的工具，利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…
→ Read more
Graviti Diffus

Graviti Diffus 是一個免部署的在線平台，專注於提供穩定擴散（Stable Diffusion）的…
→ Read more
Aitubo

Aitubo是一個AI創作工具，它提供了方便且強大的功能，讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…
→ Read more
SeaArt

SeaArt AI是一款免費且強大的AI繪畫工具，它能夠幫助使用者無需專業技能，輕鬆生成高品質的繪畫作品。 S…
→ Read more
Diffusion Art

DiffusionArt是一個精選的開源AI藝術模型庫，專注於藝術、動漫和照片逼真圖像的生成，涵蓋數十個類別。…
→ Read more

AI繪圖指令

AI繪圖指令待編輯中… Share this content: Views: 52 Related…
→ Read more

黑白蒜香義大利麵

黑白蒜香義大利麵簡介：靈感來自Netflix《黑白大廚》，這道義大利麵以橄欖油、大蒜和黑胡椒為主味，簡單卻充滿…
→ Read more
寒露養生：蜂蜜雪梨百合茶

寒露養生：蜂蜜雪梨百合茶簡介：寒露時節，氣候乾燥，易傷肺陰。此茶飲結合雪梨、百合的滋潤功效，搭配蜂蜜的清甜，潤…
→ Read more
寒露潤肺蜂蜜雪梨百合飲

寒露潤肺蜂蜜雪梨百合飲簡介：寒露時節氣候乾燥，易傷肺陰。此飲品結合雪梨、百合的滋潤功效，搭配蜂蜜，清甜潤肺，舒…
→ Read more
流心開心果湯圓 (港式風味)

流心開心果湯圓 (港式風味)簡介：這道湯圓將傳統的糯米外皮與創新的開心果流心餡料結合，口感煙韌軟糯，一口咬下，…
→ Read more
寒露時節潤肺養生：蜂蜜雪梨百合飲

寒露時節潤肺養生：蜂蜜雪梨百合飲簡介：寒露時節，氣候乾燥，易傷肺陰。此飲品結合雪梨、百合的滋潤功效，搭配蜂蜜，…
→ Read more
薑蔥爆炒軟滑雞丁

薑蔥爆炒軟滑雞丁簡介：這道菜將雞丁處理得軟滑入味，搭配薑蔥爆炒，香氣撲鼻，非常下飯，適合各個年齡層人士，尤其適…
→ Read more
秋葵蝦仁滑蛋飯

秋葵蝦仁滑蛋飯簡介：這道飯結合了秋葵的營養價值、蝦仁的鮮味和滑蛋的柔嫩，非常適合港澳台地區的夏日食用。秋葵水更…
→ Read more
軟滑雞肉豆腐羹

軟滑雞肉豆腐羹簡介：這道羹品專為需要軟餐的人士設計，雞肉和豆腐都經過特殊處理，口感軟滑易嚥，同時保留了鮮美的味…
→ Read more
軟嫩入味的日式蘿蔔炆牛肋條

日式蘿蔔炆牛肋條簡介：牛肋條軟嫩入味，白蘿蔔清甜多汁，非常適合秋季享用。這道菜特別為長者或需要軟餐人士設計，所…
→ Read more
韓式大醬苦椒海鮮義大利麵 (港澳風味)

韓式大醬苦椒海鮮義大利麵 (港澳風味)簡介：將義大利麵與韓式大醬、苦椒醬巧妙融合，加入新鮮海鮮，打造出鹹香微辣…
→ Read more

Anthropic投資新AI評測基準：提升AI模型安全與效能

Related posts:

熱門内容