在如今 AIGC 產品不斷涌現的時代,AI 畫圖已經不再是難事。儘管 AI 有著「無需動筆」、「零門檻作畫」等優點,但很多人卻不能輕易地獲得一幅理想中的作品,其中最大的難點在於「prompt」。
Prompt 方法是一門極深的管理學問:如果不輸入精準的命令描述,產生結果就可能十分隨機,甚至與預期相去甚遠。但如何給出完美的 prompt,如何讓模型按照人類使用者預設的方式輸出結果,甚至如何降低花在 prompt 上的成本,很少有人清楚。
因此,AIGC 產業中產生了一種專門的職業——prompt 工程師。最近,初創公司 Anthropic 在舊金山招聘「prompt 工程師和圖書館員」,給出的薪水高達 33.5 萬美元。
然而,現在有了 AI 繪畫神器 Midjourney 的 /describe 功能,這一過程或許能夠讓 AI 代勞,而 AI 是否能做得比人類更好呢?
Midjourney 是一款於2022年3月發表的 AI 繪畫工具,此前剛剛推出第五代版本,由於產生效果十分「炸裂,大量使用者迅速湧入,以至於該公司不得不關閉了免費註冊通道。最近 Midjourney 推出了 /describe 命令,這個命令可以讓用戶將圖像轉換為文字,具體來說,Midjourney 學會了從圖像中反推 prompt。如果你在 Midjourney 上傳一張圖片,它會提供給四個版本的描述,你可以直接拿來並進行調整,然後去產生自己想要的圖片變體。
這一次功能的更新意義重大。首先,透過用於 Web 顯示的 ALT 文本元素,圖像描述讓有視覺障礙或閱讀困難的人更容易造訪數位內容。其次,描述可以通過搜尋引擎啟用更好的搜尋功能和索引。此外,描述還可以用於標題,使圖像更加清晰。
當圖像被用於網頁或博客等數字內容時,標題是吸引讀者注意力的重要手段。透過將描述用作標題,可以讓讀者更加清楚地了解圖像的主題和內容,進而提高閱讀體驗。此外,利用描述作為標題還可以讓搜索引擎更容易地索引和搜尋相關內容,提高圖像的可搜尋性和可見性。因此,Midjourney 新增的 /describe 命令不僅提高了圖像的可讀性和可搜尋性,同時也為圖像的標題創作提供了更多可能性。
Share this content: