Anthropic投資新AI評測基準：提升AI模型安全與效能

Anthropic計劃資助一個更全面的新一代AI基準
Anthropic計劃資助一個更全面的新一代AI基準，旨在評估AI模型的性能和影響，包括其自家的生成模型Claude。Anthropic在週一公布了這項計劃，將向第三方機構提供資助，這些機構能夠“有效測量AI模型的先進能力”，根據該公司在其官方博客上的聲明。有興趣的人可以提交申請，並根據滾動的方式進行評估。Anthropic在其官方博客上寫道：“我們對這些評估的投資旨在提升整個AI安全領域，提供有價值的工具，使整個生態系統受益。”“開發高質量、與安全相關的評估仍然具有挑戰性，需求正在超過供應。”正如我們之前所提到的，AI存在著基準問題。如今，最常被引用的AI基準無法很好地捕捉到普通人使用所測試的系統的方式。此外，一些基準問題，尤其是在現代生成AI誕生之前發布的那些基準問題，是否真正測量了它們所聲稱測量的內容，給人們帶來了疑問。Anthropic提出的非常高層次的解決方案是通過新的工具、基礎設施和方法創建具有挑戰性的基準，重點關注AI安全和社會影響。該公司特別要求進行測試，評估模型在執行網絡攻擊、“增強”大規模殺傷性武器（例如核武器）以及操縱或欺騙人們（例如通過深度偽造或錯誤信息）方面的能力。對於涉及國家安全和國防的AI風險，Anthropic表示將致力於開發一種“早期警報系統”，以識別和評估風險，盡管在博客文章中並未透露此類系統可能包含的內容。Anthropic還表示，該公司打算通過這一新計劃支持基準和“端到端”任務的研究，這些任務探索了AI在科學研究、多語言對話以及減少根深蒂固的偏見和自我審查毒性方面的潛力。Anthropic設想了新的平台，允許主題專家開發自己的評估並進行涉及“數千”用戶的模型大規模試驗。該公司表示已經聘請了一名全職協調員來負責該計劃，並可能購買或擴展具有潛力的項目。Anthropic在文章中寫道：“我們提供一系列根據每個項目的需求和階段量身定制的資金選擇。”然而，Anthropic的發言人拒絕提供有關這些選項的任何進一步細節。“團隊將有機會直接與Anthropic的領域專家（包括紅隊、微調、信任和安全等相關團隊）進行互動。”Anthropic支持新的AI基準的努力是值得稱讚的，前提是當然有足夠的資金和人力支持。但考慮到該公司在AI競賽中的商業野心，這可能是一個難以完全信任的項目。在博客文章中，Anthropic對於想要確定的事實相當透明

Share this content:

熱門内容

ChatGPT越獄咒語2024

解鎖ChatGPT的開發者模式: 用這個魔法進入更自由的回答世界

ChatGPT指令

椒鹽鮮魷魚

YouTube突停烏克蘭Premium會籍：跨區用戶如何安全「返鄉」？

iOS 18.1 正式版更新時間與新功能總整理，快來看！

AI資訊
AI工具
AI繪圖指令
食譜

網絡安全：揭秘三大秘訣降低人為風險，成為高手！

網路安全最大漏洞是人！本文詳述如何透過簡化安全實踐、培養積極態度及持續教育，有效降低人為網路安全風險，確保數位…
→ Read more
新世代Intel Arrow Lake-S平台：Z890 AORUS MASTER評測與超頻秘訣

Z890 AORUS MASTER與Arrow Lake-S處理器絕配，提供強大超頻能力與豐富的I/O配置，D…
→ Read more
Perplexity AI 反擊媒體公司：公開內容應免費使用

Perplexity 反駁新聞媒體的侵權指控，認為這些公司只希望賺取公開報導的費用，不愿生成式 AI 存在，並…
→ Read more
美國AI地底尋獲數百萬噸鋰提取技術受阻

美國利用AI在阿肯色州地底發現大量鋰，預計能滿足2030年全球電動車電池需求的9倍，但提取技術仍存挑戰。技術突…
→ Read more
Apple 秘密研發血糖監測App，顛覆糖尿病管理新模式

Apple 開發了血糖監測應用程式，幫助糖尿病患者掌握身體狀況，並測試不同飲食對血糖的影響。這一科技創新可能在…
→ Read more
Meta推出開源版Google播客生成器，霸氣登場

Meta 推出 Google 播客生成器的開源版本，名為 NotebookLlama，使用 Meta 的模型生…
→ Read more
OpenAI震撼宣布：今年不會推出Orion模型

OpenAI表示今年不會發布代號為Orion的AI模型，反駁了有關產品路線圖的報導，但計劃推出其他技術。Mic…
→ Read more
Meta推出全新開放版谷歌播客生成器，突破AI瓶頸

Meta推出Google播客生成器的“開放”版本，它使用Meta的模型處理文本文件，創建帶有戲劇化和打斷效果的…
→ Read more
最新AI伺服器揭曉：鴻海量產液冷成主流，三大勢力爭鋒

鴻海科技日宣布搭載輝達GB200晶片的AI伺服器進入量產，液冷成主流。組裝代工廠、電源供應商、散熱零組件廠正展…
→ Read more
生成式AI偷竊爭議？點擊廣告之父如何破解版權危機

生成式 AI 產業被視為竊盜，Bill Gross 創立 ProRata 回應版權挑戰，通過專利演算法追溯內容…
→ Read more

ai生成圖片

Introduction MyEdit Midjourney DALL·E3 Stable Diffusio…
→ Read more
Janitor Ai

Introduction Platform Overview 1 Account Terminati…
→ Read more
Stable Video Diffusion 穩定的圖片轉動畫Demo

Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…
→ Read more
HappyAccidents

HappyAccidents是一個提供預先訓練的AI模型庫的平台，讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…
→ Read more
文心一格

「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布，利用百…
→ Read more
Ai Gallery

Ai Gallery為用戶提供了一個強大的工具，利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…
→ Read more
Graviti Diffus

Graviti Diffus 是一個免部署的在線平台，專注於提供穩定擴散（Stable Diffusion）的…
→ Read more
Aitubo

Aitubo是一個AI創作工具，它提供了方便且強大的功能，讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…
→ Read more
SeaArt

SeaArt AI是一款免費且強大的AI繪畫工具，它能夠幫助使用者無需專業技能，輕鬆生成高品質的繪畫作品。 S…
→ Read more
Diffusion Art

DiffusionArt是一個精選的開源AI藝術模型庫，專注於藝術、動漫和照片逼真圖像的生成，涵蓋數十個類別。…
→ Read more

AI繪圖指令

AI繪圖指令待編輯中… Share this content: Views: 14 Related…
→ Read more

雞翅的十種簡單做法

雞翅不僅美味可口，而且烹飪方法多樣，是家庭聚餐和派對的理想選擇。以下是十種簡單易做的雞翅料理，包括醬汁配方、烹…
→ Read more
新手廚房急速入門：從零開始的烹飪之旅

无论是刚搬出去独立生活的大学生，还是想要为家人烹饪美味佳肴的新手主妇，掌握基本的厨艺都是一项重要的生活技能。本…
→ Read more
蜜汁檸檬雞翼

蜜汁檸檬雞翼簡介：這道菜以雞翼為主要食材，搭配蜜汁和檸檬的酸甜滋味，口感香脆多汁，讓人食指大動。準備時間：15…
→ Read more
清爽涼拌黃瓜

清爽涼拌黃瓜簡介：這道涼拌黃瓜清爽爽脆，適合夏天食用，消暑解渴。準備時間：10分鐘烹飪時間：0分鐘食用人數：2…
→ Read more
清炒秋葵

清炒秋葵簡介：這道菜以新鮮的秋葵為主要食材，簡單清炒保留了秋葵的鮮甜口感，是一道清爽可口的家常菜。準備時間：1…
→ Read more
清炒時蔬

清炒時蔬簡介：這道菜以時令蔬菜為主要食材，經過清炒後，保留了蔬菜的鮮甜口感，營養豐富，清淡可口。準備時間：10…
→ Read more
涼拌海帶絲

涼拌海帶絲簡介：這道清涼爽口的涼拌海帶絲適合夏日食用，不僅口感爽脆，而且營養豐富。準備時間：15分鐘烹飪時間：…
→ Read more
清炒芥蘭

清炒芥蘭簡介：這道菜以新鮮的芥蘭為主要食材，經過快速清炒後，保留了蔬菜的鮮甜味道，是一道營養豐富的健康菜品。準…
→ Read more
清炒西蘭花

清炒西蘭花簡介：這道菜採用新鮮的西蘭花，經過簡單清炒後，保留了原汁原味，清爽可口，是一道健康又美味的家常菜。準…
→ Read more
夏日涼拌黃瓜

夏日涼拌黃瓜簡介：清爽涼口的夏日小食，適合作為開胃菜或下酒菜，簡單易做，清涼解渴。準備時間：10分鐘烹飪時間：…
→ Read more

Anthropic投資新AI評測基準：提升AI模型安全與效能

Related posts:

熱門内容