AI歷史知識勘誤驚人！最新研究揭示真相

history, AI, research, benchmark, historical questions, LLMs, limitations, understanding — image credit : pexels

人工智能（AI）在很多领域都取得了惊人的进展，但一项新的研究发现，AI 在处理历史问题方面却表现不佳。该研究测试了三个顶尖的大型语言模型（LLM）——OpenAI 的 GPT-4、Meta 的 Llama 和 Google 的 Gemini——在回答历史问题方面的能力，发现它们在准确性方面远远不及预期。

AI 历史认知的局限性

LLM 无法理解历史的复杂性
研究人员创建了一个名为 Hist-LLM 的基准测试，通过 Seshat 全球历史数据库来评估 LLMs 对历史问题的理解能力。结果表明，即使是最先进的 GPT-4 Turbo 也只能达到约 46% 的准确率，这与随机猜测的水平相差无几。该研究的共同作者、伦敦大学学院计算机科学副教授 Maria del Rio-Chanona 指出，LLMs 缺乏对历史的深度理解，它们擅长处理基本的事实，但在更微妙、更高级的历史探究方面却力不从心。

过度依赖流行信息
研究人员发现，LLMs 在回答特定历史事件或人物问题时，倾向于依赖最普遍的信息，而难以检索更冷门或更细致的历史知识。例如，研究人员询问 GPT-4 古埃及在特定时期是否拥有职业常备军，尽管正确答案是否定的，但 GPT-4 却错误地回答了是。这可能是因为，关于其他古代帝国（如波斯）拥有常备军的公开信息非常多，而关于古埃及的此类信息却相对较少。这表明，LLMs 容易受到训练数据偏差的影响，而难以进行更深入的历史分析。

训练数据偏差
研究还发现，OpenAI 和 Llama 模型在某些地区（如撒哈拉以南非洲）的表现较差，这可能与训练数据中存在的偏差有关。例如，来自某些地区的训练数据可能不足或质量较低，导致模型在处理相关问题时出现误差。

AI 历史研究的潜力

虽然该研究结果表明，LLMs 在处理历史问题方面仍存在局限性，但研究人员相信，LLMs 仍有潜力为历史研究提供帮助。他们正致力于改进基准测试，通过纳入更多来自欠发达地区的训练数据以及添加更复杂的历史问题来提高模型的准确性。此外，他们希望通过将 LLMs 与其他历史研究方法相结合，例如文本分析和数据挖掘，来进一步提升其在历史研究中的应用价值。

AI 在历史研究中的应用前景

虽然 LLMs 目前在处理复杂的历史问题方面还存在不足，但它们仍有可能为历史研究带来一些积极的改变。例如，LLMs 可以被用来整理和分析大量的历史文献，帮助历史学家快速地找到所需的信息。此外，LLMs 还可以在历史教育方面发挥作用，通过提供互动式学习体验来帮助学生更好地理解历史。

常见问题QA

问：AI 无法理解历史的原因是什么？
答：AI 无法理解历史的主要原因是，它们缺乏对历史的深度理解，它们擅长处理基本的事实，但在更微妙、更高级的历史探究方面却力不从心。此外，AI 的训练数据中也存在偏差，这也会导致它们在处理特定历史问题时出现误差。

问：AI 未来会在历史研究中发挥什么作用？
答：AI 未来可能会在历史研究中发挥越来越重要的作用。它们可以帮助历史学家整理和分析大量的历史文献，也可以为学生提供互动式学习体验。然而，AI 在处理复杂的历史问题方面还存在不足，因此需要与其他历史研究方法相结合，才能充分发挥其潜力。

熱門内容

最新Garmin智能手表發布！Fenix 8和Enduro 3震撼亮相

Google推新應用：隨時下載並運行AI模型驚喜登場

Framework推出最新模組化電腦，DIY迷你伺服器不再困難

吉利發射“千里浩瀚”衛星組建全球通信網絡

軟銀與英特爾研發AI記憶體革命，電力節省50%

六合彩發達神器

AI資訊
AI工具
AI繪圖指令
食譜

AI 專屬家教引爆考試準備新潮流，1 萬學生搶著用

Alice.tech AI 專屬家教平台助上萬學生提升考試準備效果。透過AI生成專屬學習計畫、重點摘要及模擬考…
→ Read more
晶創AI超級電腦年底增100PF，助力台灣算力稱霸全球

晶創AI超級電腦算力新增100PF，預計年底完成建置，助力台灣半導體與AI技術整合，加速智慧應用落地，國科會計…
→ Read more
輝達攜手鴻海，以GB300與NVLink 打造全球AI工廠新紀元

輝達攜手鴻海推動全球AI工廠，發表新一代GB300晶片和NVLink技術，並計畫在多國建設國家級AI工廠，鴻海…
→ Read more
吉利發射“千里浩瀚”衛星組建全球通信網絡

吉利將於2025年發射“千里浩瀚”衛星，實現全球實時通信服務和智能安全輔助駕駛的深度融合。未來，吉利的衛星網絡…
→ Read more
2025最新智能電動車smart精靈震撼登場，破百僅需5.1秒

smart靈動新車亮相，配備九種車身顏色、五種內飾風格，19英寸低風阻輪毂及全新泊車輔助系統，零百加速僅需5….
→ Read more
問界M9 2025款驚艷登場：零重力座椅帶來極致舒適享受

問界M9 2025款大五座零重力座椅版正式交付，優化舒適性配置，帶來極致奢華體驗。問界攜手白敬亭，品牌形象更具…
→ Read more
Framework推出最新模組化電腦，DIY迷你伺服器不再困難

Framework在Computex 2025推出最新Desktop與Laptop 12等模組化電腦，並支持D…
→ Read more
AI時代HBM記憶體技術揭秘：熱壓鍵合如何決勝負？

HBM 記憶體需求爆炸性增長，TCB 熱壓鍵合技術成為關鍵。三星、美光、SK 海力士各自擁有技術優勢。韓美半導…
→ Read more
World驗證服務登台！體驗最前沿的身分認證新革命

Tools for Humanity在台灣推出World驗證服務，使用者可在World Space實體據點認證…
→ Read more
台積電擬在阿聯酋建先進晶片廠推動中東AI發展

台積電計劃在阿聯酋建設先進晶片廠，與中東特使和重要投資機構多次會面，需美政府批准。此舉將提升當地半導體能力，符…
→ Read more

ai生成圖片

Introduction MyEdit Midjourney DALL·E3 Stable Diffusio…
→ Read more
Janitor Ai

Introduction Platform Overview 1 Account Terminati…
→ Read more
Stable Video Diffusion 穩定的圖片轉動畫Demo

Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…
→ Read more
HappyAccidents

HappyAccidents是一個提供預先訓練的AI模型庫的平台，讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…
→ Read more
文心一格

「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布，利用百…
→ Read more
Ai Gallery

Ai Gallery為用戶提供了一個強大的工具，利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…
→ Read more
Graviti Diffus

Graviti Diffus 是一個免部署的在線平台，專注於提供穩定擴散（Stable Diffusion）的…
→ Read more
Aitubo

Aitubo是一個AI創作工具，它提供了方便且強大的功能，讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…
→ Read more
SeaArt

SeaArt AI是一款免費且強大的AI繪畫工具，它能夠幫助使用者無需專業技能，輕鬆生成高品質的繪畫作品。 S…
→ Read more
Diffusion Art

DiffusionArt是一個精選的開源AI藝術模型庫，專注於藝術、動漫和照片逼真圖像的生成，涵蓋數十個類別。…
→ Read more

AI繪圖指令

AI繪圖指令待編輯中… Share this content: Views: 34 Related…
→ Read more

夏日清爽馬蹄蘆筍蔬菜碗

夏日清爽馬蹄蘆筍蔬菜碗簡介：這道蔬菜碗以馬蹄、蘆筍等多種蔬菜為主要食材，搭配清爽的醬汁，口感豐富，清熱解暑，非…
→ Read more
萬用紫蘇豆豉醬拌麵

萬用紫蘇豆豉醬拌麵簡介：這道麵食以自家製的萬用紫蘇豆豉醬為靈魂，香氣濃郁，拌麵蒸海鮮都非常適合。簡單快捷，非常…
→ Read more
惹味茄子煲

惹味茄子煲簡介：這道菜以茄子為主角，搭配鹹香的肉末和濃郁的醬汁，經過砂鍋煲製，茄子軟糯入味，香味四溢，是夏日開…
→ Read more
紫蘇豆豉拌麵

紫蘇豆豉拌麵簡介：這道麵食結合了自家製的萬用紫蘇豆豉醬，香氣濃郁，拌麵、蒸海鮮都非常適合。簡單快捷，非常適合忙…
→ Read more
小滿節氣祛濕健脾湯

小滿節氣祛濕健脾湯簡介：小滿時節，香港、澳門、台灣濕熱交蒸，容易感到疲倦乏力。這款湯水以健脾祛濕的食材為主，幫…
→ Read more
小滿節氣清熱祛濕養生湯

小滿節氣清熱祛濕養生湯簡介：小滿時節，濕熱交蒸，容易感到疲倦乏力。這款湯水以清熱利濕的食材為主，幫助身體排除濕…
→ Read more
排骨湯食譜大全：滋補養生,暖胃暖心

排骨湯是一道營養豐富、口感鮮美的湯品,不僅可以補充蛋白質和鈣質,還能為身體提供多種必要的營養元素。以下我們將介…
→ Read more
簡易家常菜食譜：輕鬆烹飪,溫暖滿桌

家常菜是日常生活中不可或缺的一部分,它不僅能滿足我們的味蕾,還能為忙碌的生活帶來一絲溫暖和慰藉。以下我們將介紹…
→ Read more
炒飯食譜大全：簡單美味,百變家常

炒飯是一道極具彈性的料理,不僅可以利用剩飯,還能根據個人喜好和家中現有的食材進行創新。無論是作為主食還是配菜,…
→ Read more
蛋糕食譜大全：從經典到創新,打造美味甜蜜時光

蛋糕不僅美味可口,還能為生活增添一份甜蜜與幸福感。無論是想要慶祝特殊時刻,還是只是想犒賞自己,自製蛋糕都是一個…
→ Read more