“GPT-4o登場:OpenAI多模態革新,人機交互再進化”

Featured Image
OpenAI 最近推出了 GPT-4o,這是一個多模態模型,可以深入應用到人們的日常生活中。GPT-4o 可以接受文字、圖像和音訊的任意輸入組合,並即時生成文字、音訊和圖像的任意輸出組合。這一新模型大大改善了 ChatGPT 的體驗,使得與 ChatGPT 的互動更像真人交談,帶有屬於人類的情緒和口氣,有時保有耐心,偶爾展現俏皮的一面,呈現出更自然的人機互動。

OpenAI 公布了許多使用案例,以及開發者和一般網友的初步測試結果,這些測試表明 GPT-4o 在 ChatGPT 中的性能令人驚豔。以下是一些例子:

1. 利用手機鏡頭和 ChatGPT,視障朋友可以仿彿看見這個世界。
2. 兩個 ChatGPT 可以互相交談,並通過手機鏡頭分享彼此所看到的人和事。
3. 著名線上教育平台可汗學院(Khan Academy)的創辦人 Sal Khan 和他的兒子 Imran Khan 參與了測試,ChatGPT 讀取螢幕上顯示的數學問題,然後教 Imran Khan 一步步解出正弦 sin(α)。
4. 使用 Mac 版 ChatGPT App,ChatGPT 可以參與視訊會議,提出想法並與其他人討論,最後總結討論的重點。
5. 在面試前,ChatGPT 可以幫助你做準備,並給出一些建議。
6. ChatGPT 可以在發表會現場充當口譯員,流利地翻譯義大利語和英語。
7. 使用 Mac 版 ChatGPT App 和純粹 Breakout 遊戲的截圖,可以讓 ChatGPT 生成遊戲程式碼。
8. 通過手機上的 ChatGPT,只需要 20 秒就可以生成 3D 模型的 STL 檔案。
9. 利用手機鏡頭和 ChatGPT,可以識別紙上的書寫體文字,雖然有少數幾個字可能辨識錯誤,但整體體驗仍然非常出色。
10. GPT-4o 支援解讀表情的能力更細緻,已達到人類的水準。

GPT-4o 的推出將使 ChatGPT 在各個領域有更廣泛的應用,帶來更多的便利和創新。我們可以預見 ChatGPT 在未來的發展中將繼續取得更大的突破,並在人機互動領域發揮更重要的作用。

Share this content: