亞馬遜CTO沃格爾自創AI會議摘要應用「Distill」大揭秘

Featured Image
Amazon首席技術官Werner Vogels是一位身價數百萬的人,在COVID-19疫情期間他直接購買了他居住的阿姆斯特丹中心的Airbnb小屋。那麼,他平時都是如何度過他的日子呢?從他的個人博客上可以看出,他建立了一個基於人工智能的會議摘要應用程序。在這篇博客中,他詳細介紹了Distill,這是一個他與他的CTO團隊共同開發的開源應用程序,用於轉錄和摘要他們的會議通話。Distill可以將會議的音頻錄音(支持MP3、FLAC和WAV等格式)進行分析,並生成摘要以及待辦事項列表。它還可以通過自定義集成將摘要和列表發送到Slack等平台上。

Distill作為亞馬遜首席技術官開發的應用程序,顯然依賴於亞馬遜付費產品和服務來進行大量的計算工作。AWS Transcribe負責處理Distill的轉錄工作;Amazon S3為會議音頻文件提供存儲空間;而Bedrock則是亞馬遜的生成式人工智能開發套件,用於處理摘要生成。但是,既然已經有無數工具可以滿足會議摘要的需求,為什麼還要創建一個會議摘要工具呢?儘管如此,我想Vogels可能認為,為什麼不呢?他有豐富的資源可以利用,似乎還有足夠的空閒時間進行業餘的編程項目。根據博客的描述,他已經在試圖將Distill的代碼從Python轉移到Rust上。(如果你能得到CTO的職位,這樣的工作肯定很不錯。)

Distill的一個獨特之處在於它允許您選擇哪個人工智能模型來進行會議摘要。默認情況下,它使用的是Anthropic的Claude 3系列的中端模型Sonnet。(亞馬遜在Anthropic中的大量股份可能與這一設計決策有關。)但是,任何在Bedrock中托管的模型都可以使用,比如Meta的Llama 3和來自AI初創公司Mistral、AI21 Labs和Cohere的模型。Vogels並不保證Distill不會出錯。他寫道:“請記住,人工智能並不完美。我們得到的一些摘要可能會有錯誤,需要手動調整。但這並沒有關係,因為它仍然能夠加快我們的工作流程。這只是提醒我們,在這一過程中我們仍然需要保持識別力和參與度。批判性思維現在和以往一樣重要。”(註:這段翻譯為直譯,未作太多優化。)

我認為,需要“參與”摘要過程有點違背自動摘要的初衷。你不如聘請一位速記員。但你永遠不會聽到Vogels對他的雇主所推銷的技術表示不滿。我敢說,這也是他仍然擔任首席技術官的原因。

Share this content: