Sakana AI革命性通用Transformer記憶體：降低LLM成本75%

Memory optimization, Universal Transformer, Neural Attention Memory Model, Performance improvement — image credit : pexels

在大型語言模型（LLM）與其他基於 Transformer 的模型上建立應用程式時，記憶體效率是一個重要的考量因素。近年來，由於 Transformer 模型的上下文視窗越來越長，能夠容納更多的 token，導致運算成本和效能下降。為了解決這個問題，日本東京的新創公司 Sakana AI 開發了一項名為「通用 Transformer 記憶體（Universal Transformer Memory）」的技術，這項創新技術使用特殊的神經網路來最佳化 LLM，幫助企業降低成本，同時提升效能。

神奇的記憶體優化技術：通用 Transformer 記憶體

通用 Transformer 記憶體如何運作？
通用 Transformer 記憶體採用神經注意力記憶模組（NAMM）來最佳化提示。 NAMM 是一種簡單的神經網路，可以判斷 LLM 記憶體中每個 token 是否應該「記住」或「遺忘」。透過這種方式，模型能夠移除無用的資訊，並專注於最關鍵的資訊，對於需要長上下文推理的任務來說尤其重要。

NAMM 如何與 LLM 協作？
NAMM 在與 LLM 分開的環境中訓練，並在推理時與預訓練模型結合，這使其具有靈活性且易於部署。 NAMM 運作於 Transformer 的注意力層，分析每個 token 的關係和重要性，並根據注意力值決定哪些 token 應該保留或移除。這種基於注意力的機制使得訓練過的 NAMM 可以應用於不同模型，而無需額外的訓練。

通用 Transformer 記憶體的應用與效益

實例：NAMM 如何優化 LLM 效能

Sakana AI 的研究人員在 Meta Llama 3-8B 模型上訓練了一個 NAMM，實驗結果顯示，NAMM 顯著提升了模型在長序列上的自然語言和程式碼問題上的表現。同時，NAMM 透過丟棄不必要的 token，將 LLM 模型的快取記憶體使用量減少了高達 75%。

除了 Llama 模型之外，NAMM 也在其他模型，例如 Llava（電腦視覺）和 Decision Transformer（強化學習）上取得了成功。 NAMM 透過丟棄冗餘資訊，例如影片幀和次佳動作，幫助這些模型專注於最相關的資訊，進而提高效能。

通用 Transformer 記憶體的優勢與劣勢

優勢：

顯著降低 LLM 的記憶體使用量，節省運算成本。
提升模型效能，尤其在需要長上下文推理的任務上表現出色。
NAMM 可以應用於不同模型，具有良好的可移植性。
透過自動調整行為，根據任務類型優化記憶體使用。

劣勢：

NAMM 需要存取模型的內部啟動，目前僅適用於開源模型。
需要針對特定任務進行訓練，才能發揮最佳效能。

通用 Transformer 記憶體的未來展望

Sakana AI 研究人員正在探索更進階的技術，例如在 LLM 的訓練期間使用 NAMM，以進一步擴展其記憶體功能。

通用 Transformer 記憶體的出現為 LLM 的發展開闢了新的道路，有望在未來創造更多令人興奮的突破，提升 LLM 的效能和效率。

常見問題QA

通用 Transformer 記憶體是否可以應用於所有 LLM？

目前，NAMM 需要存取模型的內部啟動，因此只能應用於開源模型。但研究人員正在努力擴展 NAMM 的應用範圍，使其能夠適用於更多模型。

通用 Transformer 記憶體會取代現有的提示最佳化技術嗎？

通用 Transformer 記憶體並非要取代現有的提示最佳化技術，而是提供了一種全新的思路，可以與現有技術互補，進一步提升 LLM 的記憶體效率和效能。

熱門内容

国产大模型突袭汽车制造，全场景应用重磅发布

特斯拉突破800万辆里程碑，欧洲销量惊人下滑引爆危機

最新Garmin智能手表發布！Fenix 8和Enduro 3震撼亮相

ChatGPT越獄指令-AIM

AI工具

AI資訊
AI工具
AI繪圖指令
食譜

WWDC 倒計時：iPhone iOS 26 正式發布時間揭曉

蘋果即將在 WWDC 上宣布 iOS 26，並於 2025 年 6 月 10 日發布開發者測試版。預計正式版在…
→ Read more
人工鋸齒智慧：Google CEO解析AI未來挑戰與潛力

Google CEO 皮查依提出「人工鋸齒智慧」新術語，描述AI技術進步過程的挑戰與潛力，探討AI模型依賴高品…
→ Read more
黑猩猩與AI：動物行為學家揭示AI意識的未來可能

珍古德以黑猩猩研究挑戰人類獨特性，並探討AI是否具備類似感知能力。她期望AI能促進跨物種溝通與生態保護，重新定…
→ Read more
阿維塔百萬級大六座SUV震撼來襲 2025旗艦新車首發揭秘

阿维塔將推出價值過百萬的大六座旗艦SUV，基於長安汽車最新SDA 2.0平台打造，預計到2030年涵蓋轎車、S…
→ Read more
国产大模型突袭汽车制造，全场景应用重磅发布

東風柳州汽車與智平方科技合作引入AlphaBot 2智能機器人，探索具身大模型在汽車製造中的應用。此舉標誌著国…
→ Read more
特斯拉突破800万辆里程碑，欧洲销量惊人下滑引爆危機

特斯拉在全球迎來第800萬輛車下線，但歐洲市場銷量連續第五個月下滑，柏林工廠的Model Y銷售面臨挑戰，特斯…
→ Read more
AI加速汽車技術革命！Arm發表Zena CSS平台縮短上市時程

Arm推出Zena CSS運算平台，採用最新Armv9技術，提供汽車製造商更快的開發流程與高效能AI功能，能縮…
→ Read more
AMD Radeon RX 9060 XT在Computex 2025效能實測，是否值得購買？

AMD在Computex 2025發表Radeon RX 9060 XT顯示卡，提供8GB與16GB版本，強化…
→ Read more
最新NVIDIA MLPerf訓練測試成績效能大爆表

NVIDIA發表最新MLPerf訓練測試成績，GB200 NVL72 圓滿完成所有測試項目，其效能表現與成本效…
→ Read more
Qi2.2最高45W！Apple新MagSafe充電器強勢曝光，無線充電大突破

Apple 新 MagSafe 充電器曝光，支援最新 Qi2.2 標準，最高輸出功率達 45W，顯著提升無線充…
→ Read more

ai生成圖片

Introduction MyEdit Midjourney DALL·E3 Stable Diffusio…
→ Read more
Janitor Ai

Introduction Platform Overview 1 Account Terminati…
→ Read more
Stable Video Diffusion 穩定的圖片轉動畫Demo

Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…
→ Read more
HappyAccidents

HappyAccidents是一個提供預先訓練的AI模型庫的平台，讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…
→ Read more
文心一格

「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布，利用百…
→ Read more
Ai Gallery

Ai Gallery為用戶提供了一個強大的工具，利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…
→ Read more
Graviti Diffus

Graviti Diffus 是一個免部署的在線平台，專注於提供穩定擴散（Stable Diffusion）的…
→ Read more
Aitubo

Aitubo是一個AI創作工具，它提供了方便且強大的功能，讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…
→ Read more
SeaArt

SeaArt AI是一款免費且強大的AI繪畫工具，它能夠幫助使用者無需專業技能，輕鬆生成高品質的繪畫作品。 S…
→ Read more
Diffusion Art

DiffusionArt是一個精選的開源AI藝術模型庫，專注於藝術、動漫和照片逼真圖像的生成，涵蓋數十個類別。…
→ Read more

AI繪圖指令

AI繪圖指令待編輯中… Share this content: Views: 35 Related…
→ Read more

夏日清爽馬蹄蘆筍蔬菜碗

夏日清爽馬蹄蘆筍蔬菜碗簡介：這道蔬菜碗以馬蹄、蘆筍等多種蔬菜為主要食材，搭配清爽的醬汁，口感豐富，清熱解暑，非…
→ Read more
萬用紫蘇豆豉醬拌麵

萬用紫蘇豆豉醬拌麵簡介：這道麵食以自家製的萬用紫蘇豆豉醬為靈魂，香氣濃郁，拌麵蒸海鮮都非常適合。簡單快捷，非常…
→ Read more
惹味茄子煲

惹味茄子煲簡介：這道菜以茄子為主角，搭配鹹香的肉末和濃郁的醬汁，經過砂鍋煲製，茄子軟糯入味，香味四溢，是夏日開…
→ Read more
紫蘇豆豉拌麵

紫蘇豆豉拌麵簡介：這道麵食結合了自家製的萬用紫蘇豆豉醬，香氣濃郁，拌麵、蒸海鮮都非常適合。簡單快捷，非常適合忙…
→ Read more
小滿節氣祛濕健脾湯

小滿節氣祛濕健脾湯簡介：小滿時節，香港、澳門、台灣濕熱交蒸，容易感到疲倦乏力。這款湯水以健脾祛濕的食材為主，幫…
→ Read more
小滿節氣清熱祛濕養生湯

小滿節氣清熱祛濕養生湯簡介：小滿時節，濕熱交蒸，容易感到疲倦乏力。這款湯水以清熱利濕的食材為主，幫助身體排除濕…
→ Read more
排骨湯食譜大全：滋補養生,暖胃暖心

排骨湯是一道營養豐富、口感鮮美的湯品,不僅可以補充蛋白質和鈣質,還能為身體提供多種必要的營養元素。以下我們將介…
→ Read more
簡易家常菜食譜：輕鬆烹飪,溫暖滿桌

家常菜是日常生活中不可或缺的一部分,它不僅能滿足我們的味蕾,還能為忙碌的生活帶來一絲溫暖和慰藉。以下我們將介紹…
→ Read more
炒飯食譜大全：簡單美味,百變家常

炒飯是一道極具彈性的料理,不僅可以利用剩飯,還能根據個人喜好和家中現有的食材進行創新。無論是作為主食還是配菜,…
→ Read more
蛋糕食譜大全：從經典到創新,打造美味甜蜜時光

蛋糕不僅美味可口,還能為生活增添一份甜蜜與幸福感。無論是想要慶祝特殊時刻,還是只是想犒賞自己,自製蛋糕都是一個…
→ Read more