DeepMind新創AI技術：V2A將為影片生成配樂與音效

DeepMind是Google的AI研究實驗室，表示他們正在開發用於視頻配樂的AI技術。在官方博客中，DeepMind表示他們將這項技術（簡稱為“video-to-audio”或V2A）視為AI生成媒體拼圖中的一個關鍵部分。儘管許多組織已經開發了視頻生成的AI模型，但這些模型無法創建與生成的視頻同步的音效。“視頻生成模型正在以驚人的速度發展，但是許多現有系統只能生成無聲的輸出，”DeepMind寫道。“V2A技術可能成為使生成的電影變得生動的一種有前景的方法。”DeepMind的V2A技術將音軌的描述（例如“水下脈動的水母，海洋生物，海洋”）與視頻配對，創建與視頻中的角色和調性相匹配的音樂、音效甚至對話。DeepMind的V2A技術由SynthID提供支持，SynthID是一種抵抗深度偽造的AI模型。根據DeepMind的說法，V2A的AI模型通過對聲音和對話文本以及視頻剪輯的綜合訓練而得到，該技術通過訓練學會將特定的音頻事件與各種視覺場景相關聯，同時對提供的注釋或文本信息作出反應。目前還不清楚訓練數據中是否包含有版權的內容，以及數據的創作者是否被告知DeepMind的工作。我們已經聯繫DeepMind以獲取進一步的澄清，如果有回應，我們將更新這篇文章。AI生成音效的工具並不新奇。Stability AI創立的初創公司去年剛推出了一種，而ElevenLabs也推出了一種類似的工具。同樣，創建視頻音效的模型也並不罕見。微軟可以根據靜態圖像生成說話和唱歌的視頻，而像Jukin Media和Unsplash這樣的平台則訓練了模型，可以根據視頻場景最佳猜測適合的音樂或音效。DeepMind聲稱他們的V2A技術在於它能夠理解視頻中的原始像素並自動將生成的音效與視頻同步，甚至無需描述。然而，V2A並不完美，DeepMind也承認了這一點。由於底層模型在訓練時並沒有使用大量包含瑕疵或失真的視頻，因此它無法為這些視頻生成特別高質量的音頻。一般情況下，生成的音頻並不是非常令人信服；我的同事Natasha Lomas形容它為“一個典型音效的大雜燴”，我不能不同意。出於這些原因，並為了防止被誤用，DeepMind表示他們不會很快或可能永遠不會向公眾公開這項技術。“為了確保我們的V2A技術對創意社區產生積極影響，我們正在收集領先創作者和電影製片人的多樣化觀點和見解，並使用這些寶貴的反饋信息來指導我們不斷的研究和開發工作，”DeepMind寫道。“在我們考慮向廣大公眾開放之前，我們的V2A技術將經過嚴格的安全評估和測試。”DeepMind將他們的V2A技術推銷為尤其適用於檔案保管人和處理歷史素材的人士的工具。但是，這類生成式AI也威脅著電影和電視行業。要確保生成媒體工具不會消除就業機會，或者在某種情況下，整個行業，需要嚴格的勞工保護措施。

快去TechCrunch報名參加加州舉辦的2024年舊金山Disrupt科技盛會，贏得10萬美元和展示機會！

Share this content:

熱門内容

ChatGPT越獄咒語2024

解鎖ChatGPT的開發者模式: 用這個魔法進入更自由的回答世界

ChatGPT指令

椒鹽鮮魷魚

YouTube突停烏克蘭Premium會籍：跨區用戶如何安全「返鄉」？

iOS 18.1 正式版更新時間與新功能總整理，快來看！

AI資訊
AI工具
AI繪圖指令
食譜

網絡安全：揭秘三大秘訣降低人為風險，成為高手！

網路安全最大漏洞是人！本文詳述如何透過簡化安全實踐、培養積極態度及持續教育，有效降低人為網路安全風險，確保數位…
→ Read more
新世代Intel Arrow Lake-S平台：Z890 AORUS MASTER評測與超頻秘訣

Z890 AORUS MASTER與Arrow Lake-S處理器絕配，提供強大超頻能力與豐富的I/O配置，D…
→ Read more
Perplexity AI 反擊媒體公司：公開內容應免費使用

Perplexity 反駁新聞媒體的侵權指控，認為這些公司只希望賺取公開報導的費用，不愿生成式 AI 存在，並…
→ Read more
美國AI地底尋獲數百萬噸鋰提取技術受阻

美國利用AI在阿肯色州地底發現大量鋰，預計能滿足2030年全球電動車電池需求的9倍，但提取技術仍存挑戰。技術突…
→ Read more
Apple 秘密研發血糖監測App，顛覆糖尿病管理新模式

Apple 開發了血糖監測應用程式，幫助糖尿病患者掌握身體狀況，並測試不同飲食對血糖的影響。這一科技創新可能在…
→ Read more
Meta推出開源版Google播客生成器，霸氣登場

Meta 推出 Google 播客生成器的開源版本，名為 NotebookLlama，使用 Meta 的模型生…
→ Read more
OpenAI震撼宣布：今年不會推出Orion模型

OpenAI表示今年不會發布代號為Orion的AI模型，反駁了有關產品路線圖的報導，但計劃推出其他技術。Mic…
→ Read more
Meta推出全新開放版谷歌播客生成器，突破AI瓶頸

Meta推出Google播客生成器的“開放”版本，它使用Meta的模型處理文本文件，創建帶有戲劇化和打斷效果的…
→ Read more
最新AI伺服器揭曉：鴻海量產液冷成主流，三大勢力爭鋒

鴻海科技日宣布搭載輝達GB200晶片的AI伺服器進入量產，液冷成主流。組裝代工廠、電源供應商、散熱零組件廠正展…
→ Read more
生成式AI偷竊爭議？點擊廣告之父如何破解版權危機

生成式 AI 產業被視為竊盜，Bill Gross 創立 ProRata 回應版權挑戰，通過專利演算法追溯內容…
→ Read more

ai生成圖片

Introduction MyEdit Midjourney DALL·E3 Stable Diffusio…
→ Read more
Janitor Ai

Introduction Platform Overview 1 Account Terminati…
→ Read more
Stable Video Diffusion 穩定的圖片轉動畫Demo

Stable Video Diffusion能讓你用一張圖片變成動畫. 限制 Share this conte…
→ Read more
HappyAccidents

HappyAccidents是一個提供預先訓練的AI模型庫的平台，讓使用者能夠輕鬆生成圖像而無需手動下載和上傳…
→ Read more
文心一格

「文心一格」是百度推出的一個基於文心大模型能力的AI藝術和創意輔助平台。該平台於2022年8月正式發布，利用百…
→ Read more
Ai Gallery

Ai Gallery為用戶提供了一個強大的工具，利用人工智慧技術根據用戶輸入提示產生令人驚嘆的圖像。但是要強調…
→ Read more
Graviti Diffus

Graviti Diffus 是一個免部署的在線平台，專注於提供穩定擴散（Stable Diffusion）的…
→ Read more
Aitubo

Aitubo是一個AI創作工具，它提供了方便且強大的功能，讓使用者能夠透過文本和照片輸入來生成藝術作品。 Ai…
→ Read more
SeaArt

SeaArt AI是一款免費且強大的AI繪畫工具，它能夠幫助使用者無需專業技能，輕鬆生成高品質的繪畫作品。 S…
→ Read more
Diffusion Art

DiffusionArt是一個精選的開源AI藝術模型庫，專注於藝術、動漫和照片逼真圖像的生成，涵蓋數十個類別。…
→ Read more

AI繪圖指令

AI繪圖指令待編輯中… Share this content: Views: 14 Related…
→ Read more

雞翅的十種簡單做法

雞翅不僅美味可口，而且烹飪方法多樣，是家庭聚餐和派對的理想選擇。以下是十種簡單易做的雞翅料理，包括醬汁配方、烹…
→ Read more
新手廚房急速入門：從零開始的烹飪之旅

无论是刚搬出去独立生活的大学生，还是想要为家人烹饪美味佳肴的新手主妇，掌握基本的厨艺都是一项重要的生活技能。本…
→ Read more
蜜汁檸檬雞翼

蜜汁檸檬雞翼簡介：這道菜以雞翼為主要食材，搭配蜜汁和檸檬的酸甜滋味，口感香脆多汁，讓人食指大動。準備時間：15…
→ Read more
清爽涼拌黃瓜

清爽涼拌黃瓜簡介：這道涼拌黃瓜清爽爽脆，適合夏天食用，消暑解渴。準備時間：10分鐘烹飪時間：0分鐘食用人數：2…
→ Read more
清炒秋葵

清炒秋葵簡介：這道菜以新鮮的秋葵為主要食材，簡單清炒保留了秋葵的鮮甜口感，是一道清爽可口的家常菜。準備時間：1…
→ Read more
清炒時蔬

清炒時蔬簡介：這道菜以時令蔬菜為主要食材，經過清炒後，保留了蔬菜的鮮甜口感，營養豐富，清淡可口。準備時間：10…
→ Read more
涼拌海帶絲

涼拌海帶絲簡介：這道清涼爽口的涼拌海帶絲適合夏日食用，不僅口感爽脆，而且營養豐富。準備時間：15分鐘烹飪時間：…
→ Read more
清炒芥蘭

清炒芥蘭簡介：這道菜以新鮮的芥蘭為主要食材，經過快速清炒後，保留了蔬菜的鮮甜味道，是一道營養豐富的健康菜品。準…
→ Read more
清炒西蘭花

清炒西蘭花簡介：這道菜採用新鮮的西蘭花，經過簡單清炒後，保留了原汁原味，清爽可口，是一道健康又美味的家常菜。準…
→ Read more
夏日涼拌黃瓜

夏日涼拌黃瓜簡介：清爽涼口的夏日小食，適合作為開胃菜或下酒菜，簡單易做，清涼解渴。準備時間：10分鐘烹飪時間：…
→ Read more

DeepMind新創AI技術：V2A將為影片生成配樂與音效

Related posts:

熱門内容