SDXL Turbo:一個實時的文本到圖像生成模型

Stability AI 最近推出了一個名為SDXL Turbo的全新文本到圖像生成模型。這個網絡總結了SDXL Turbo的特點和優勢,以及它在性能和商業應用方面的突破。這款模型利用一種新的蒸餾技術,稱為對抗擾動蒸餾(Adversarial Diffusion Distillation),能夠以單步生成圖像輸出,並在保持高品質的同時實現實時文本到圖像轉換。

Adversarial Diffusion Distillation的優勢:

SDXL Turbo通過引入對抗擾動蒸餾(ADD)技術,在擴散模型技術的基礎上進行了改進。這款模型具有與生成對抗網絡(GAN)相似的優點,例如在單步生成圖像的同時避免了其他蒸餾方法中常見的瑕疵和模糊問題。更多關於SDXL Turbo的蒸餾技術的技術細節可以在這裡的研究論文中找到。

性能優勢相對於其他擴散模型:

SDXL Turbo通過與其他擴散模型(如StyleGAN-T++,OpenMUSE,IF-XL,SDXL和LCM-XL)相比較,展示了較高的性能。在進行了與語料驅動的LCM-XL模型(配置為4個步驟能夠和50個步驟的SDXL模型相比)的比較測試後,人類評估者在隨機選擇的兩個輸出中選擇與提示最接近的輸出。這些測試表明,SDXL Turbo只需要一個步驟能夠超越50個步驟的SDXL模型或4個步驟能夠的LCM-XL模型。這意味著SDXL Turbo在显著降低計算要求的同時,仍能提供優於現有模型的圖像品質。此外,SDXL Turbo在推理速度方面也有顯著改善,僅需207ms(包括提示編碼,單個去噪步驟和解碼)即可生成一個512×512的圖像。

使用Clipdrop探索SDXL Turbo:

為了讓用戶能夠測試這個新模型的能力,Stability AI還推出了一個名為Clipdrop的圖像編輯平台,用於演示SDXL Turbo的實時圖像生成功能。Clipdrop兼容大多數瀏覽器,目前可以免費試用。

商業應用:

如果您有興趣在商業產品或用途中使用這個模型,請通過這裡的鏈接與Stability AI聯繫,以了解更多信息。另外,您還可以通過訂閱Stability AI的新聞通訊、關注他們在Twitter、Instagram、LinkedIn上的動態,以及加入他們的Discord社區

Share this content: