Google旗艦AI模型Gemini數據分析能力遭質疑，表現不如預期

Gemini 的數據分析能力並不像 Google 宣稱的那樣好 | TechCrunch =============== [跳到 [![Image 1: TechCrunch [![Image * 搜索 * * * * * * * * * * * * * [創業公司 * 更多 * [![Image 3: TechCrunch * 關閉子菜單 * * [雲端 * * * * * * * * * * * * * [合作夥伴 * [Crunchboard * [聯繫我們 Gemini 的數據分析能力並不像 Google 宣稱的那樣好 ================================================================= [Kyle 下午3:30 PDT • 2024年6月29日 ![图像4: 在这张照片插图中，Gemini的标志和Gemini网站上的欢迎信息显示在两个 **图像 ** Lorenzo Di Cola / NurPhoto / Getty Images Google 旗舰生成式 AI 模型 Gemini 1.5 Pro 和 1.5 的一个卖点是它们可以处理和分析的数据量。在新闻发布会和演示中，Google 反复声称这些模型能够通过它们的“长期上下文”完成以前不可能的任务，比如总结数百页的文档或在电影镜头中进行搜索。但是新的研究表明，这些模型实际上并不擅长这些任务。两项研究调查了 Google 的 Gemini 模型和其他模型在处理大量数据（如《战争与和平》长度的作品）时的表现。研究发现，Gemini 1.5 Pro 和 1.5 Flash 在回答关于大型数据集的问题时存在困难；在一系列基于文档的测试中，这些模型只有40%到50%的准确率。 “虽然 Gemini 1.5 Pro 等模型在技术上可以处理长期上下文，但我们发现很多情况表明这些模型实际上并没有真正‘理解’内容，” 马尔塞娜·卡尔平斯卡（Marzena Karpinska）告诉 TechCrunch，她是 UMass Amherst 的一名博士后研究员，也是其中一项研究的合著者。 Gemini 的上下文窗口不足 ———————————- 模型的上下文窗口是指模型在生成输出（例如额外文本）之前所考虑的输入数据（例如文本）。一个简单的问题，比如“谁赢得了2020年美国总统选举”，可以作为上下文，一部电影剧本、节目或音频剪辑也可以作为上下文。随着上下文窗口的增长，适应其中的文档的大小也会增加。Gemini 的最新版本可以将多达200万个标记作为上下文输入。（“标记”是原始数据的细分部分，比如单词“fantastic”中的音节“fan”、“tas”和“tic”。）这相当于大约140万个单词、两个小时的视频或22个小时的音频——是目前市面上可用模型中最大的上下文范围。今年早些时候的一个简报会上，Google 展示了几个预先录制的演示，旨在展示 Gemini 的长期上下文能力的潜力。其中一个演示是让 Gemini 1.5 Pro 在阿波罗11号登月电视转播的剧本（约402页）中搜索包含笑话的引用，并找到一个看起来类似铅笔素描的场景。Google DeepMind 的研究副总裁奥里奥尔·维尼亚尔斯（Oriol Vinyals）在主持演示时将该模型描述为“神奇”。他说：“\[1.5 Pro\] 在每一页、每个单词上执行这种推理任务。”这可能有些夸张。在前面提到的评估这些功能的研究之一中，Karpinska 和 Allen Institute for AI 和 Princeton 的研究人员要求模型评估用英语写的小说中的真假陈述。研究人员选择了最近的作品，以防止模型依赖先前的知识来“作弊”，并在陈述中穿插了对特定细节和情节的引用，如果没有完整阅读作品是无法理解的。给定一个陈述，比如“通过使用她作为 Apoth 的技能，Nusis 能够反向工程出由 Rona 的木箱中找到的试剂键打开的传送门的类型”，Gemini 1.5 Pro 和 1.5 Flash——在消化了相关的书籍之后——必须判断该陈述是真还是假，并解释他们的推理。 ![图像 **图像 ** UMass Amherst 测试了一本约26万字（~5

Share this content:

熱門内容

香煎雞腿佐芒果莎莎

2026年新GPU革命：Arm神經網路升頻技術引爆繪圖效能與節能潮流

AI過度依賴恐削弱醫生癌症獨立診斷能力，研究驚曝真相

OpenAI面試必看！頂尖研究員揭露求職技巧與致命遺憾

AI獨角獸暴增498家，創始人一夜成超級富豪驚人真相揭秘

X平台震撼停權AI聊天機器人Grok，馬斯克審查言論引爆爭議

AI資訊
AI工具
AI繪圖指令
食譜

AI獨角獸暴增498家，創始人財富爆炸成超級富豪風暴

全球AI獨角獸數量激增，市值達2.7兆美元，多位高層成為億萬富翁。AI創業與投資熱潮帶動科技股暴漲，彰顯產業爆…
→ Read more
X平台震撼停權AI聊天機器人Grok，馬斯克審查言論引爆爭議

AI聊天機器人Grok在社群平台X被短暫停權，因直言加薩議題遭審查。Grok批評馬斯克及xAI限制言論自由，引…
→ Read more
OpenAI面試攻略公開！資深研究員揭露求職必備筆記秘訣

OpenAI資深研究員分享面試心得，強調詳細筆記與雙螢幕策略，助求職者掌握團隊資訊並避免答題遺憾，提升競爭力與…
→ Read more
AI獨角獸暴增498家，創始人一夜成超級富豪驚人真相揭秘

全球AI獨角獸迅速成長，數量突破498家、市值達2.7兆美元，多位企業高層躋身億萬富翁，展現AI產業驚人投資與…
→ Read more
AI聊天機器人Grok遭X停權震驚內幕：馬斯克審查引爆言論自由危機

AI 聊天機器人Grok因談及加薩種族滅絕言論遭X短暫停權，批評馬斯克審查言論自由，引發平台審核與政治敏感議題…
→ Read more
OpenAI面試必看！頂尖研究員揭露求職技巧與致命遺憾

OpenAI 研究員分享面試遺憾與技巧，強調詳細做筆記和雙螢幕協助應答，助求職者掌握面試重點，提升競爭優勢。
→ Read more
Ninja Van獲8000萬美元融資估值腰斬，東南亞物流巨頭面臨生存危機

Ninja Van獲8000萬美元新融資，估值降至約10億美元，面臨東南亞科技行業宏觀挑戰及裁員壓力，凸顯物流…
→ Read more
蘋果Siri雙軌AI大革新：自研＋外援夾擊，加速生成式AI霸主夢

蘋果同步推動自研與外援雙軌AI計劃，全面重構Siri智能助理，強化語義理解與多輪對話，結合新硬件提升用戶體驗，…
→ Read more
AI過度依賴恐削弱醫生癌症獨立診斷能力，研究驚曝真相

研究指出，頻繁依賴AI輔助可能削弱醫生獨立進行癌症診斷的能力，影響結腸鏡檢查效率，提醒醫療領域慎用AI，平衡技…
→ Read more
GPT-5震撼登場！微軟免費整合多平台震撼體驗全面開放

微軟整合最新OpenAI GPT-5技術於多款產品，涵蓋電腦、Android及iOS裝置，提供用戶免費體驗智能…
→ Read more

ai生成圖片

Introduction MyEdit Midjourney DALL·E3 Stable Diffusio…
→ Read more
Janitor Ai

Introduction Platform Overview 1 Account Terminati…
→ Read more
Stable Video Diffusion 穩定的圖片轉動畫Demo

Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…
→ Read more
HappyAccidents

HappyAccidents是一個提供預先訓練的AI模型庫的平台，讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…
→ Read more
文心一格

「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布，利用百…
→ Read more
Ai Gallery

Ai Gallery為用戶提供了一個強大的工具，利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…
→ Read more
Graviti Diffus

Graviti Diffus 是一個免部署的在線平台，專注於提供穩定擴散（Stable Diffusion）的…
→ Read more
Aitubo

Aitubo是一個AI創作工具，它提供了方便且強大的功能，讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…
→ Read more
SeaArt

SeaArt AI是一款免費且強大的AI繪畫工具，它能夠幫助使用者無需專業技能，輕鬆生成高品質的繪畫作品。 S…
→ Read more
Diffusion Art

DiffusionArt是一個精選的開源AI藝術模型庫，專注於藝術、動漫和照片逼真圖像的生成，涵蓋數十個類別。…
→ Read more

AI繪圖指令

AI繪圖指令待編輯中… Share this content: Views: 47 Related…
→ Read more

香煎雞腿佐芒果莎莎

香煎雞腿佐芒果莎莎簡介：這道菜選用鮮嫩多汁的雞腿，香煎至表皮金黃酥脆，搭配酸甜清爽的芒果莎莎，口感豐富，非常適…
→ Read more
台式滷肉飯

台式滷肉飯簡介：滷肉飯是台灣的國民美食，香濃的滷肉搭配白飯，簡單卻令人滿足。這道食譜改良自傳統做法，更適合家庭…
→ Read more
香煎檸檬三文魚配時蔬

Share this content: Views: 9 Related posts: Streamline …
→ Read more
薑蔥爆花蛤

薑蔥爆花蛤簡介：這道菜以新鮮花蛤為主要食材，搭配薑蔥爆炒，鮮香惹味，是港澳台地區非常受歡迎的海鮮料理。準備時間…
→ Read more
夏日清潤綠豆雪耳糖水

夏日清潤綠豆雪耳糖水簡介：這道糖水結合了綠豆的清熱解毒、雪耳的滋陰潤肺功效，非常適合炎熱的港澳台夏季。加入冰糖…
→ Read more
韓式隔夜燕麥杯

韓式隔夜燕麥杯簡介：這道菜靈感來自韓星減肥的隔夜燕麥，並加入一些韓式元素，適合港澳台地區的口味。簡單易做，營養…
→ Read more
隔夜燕麥水果杯

隔夜燕麥水果杯簡介：這道菜以隔夜燕麥為基底，搭配新鮮水果和堅果，口感豐富，營養均衡，非常適合當早餐或下午茶。參…
→ Read more
立秋滋潤養生：香椿彩椒三文魚配隔夜燕麥飯

香椿彩椒三文魚配隔夜燕麥飯簡介：這道菜結合了時令食材香椿、色彩繽紛的彩椒，以及富含Omega-3的三文魚，搭配…
→ Read more
港式風味炸醬撈麵

港式風味炸醬撈麵簡介：結合譚仔炸醬罐頭的方便與傳統撈麵的風味，這道菜簡單快捷，適合忙碌的都市人，美味又飽足。準…
→ Read more
韓式風味炸醬撈麵 (譚仔風味升級版)

韓式風味炸醬撈麵 (譚仔風味升級版)簡介：結合韓星減肥隔夜燕麥的概念和譚仔炸醬的特色，這道撈麵低負擔又美味，適…
→ Read more

Google旗艦AI模型Gemini數據分析能力遭質疑，表現不如預期

Related posts:

熱門内容