“GPT-4o登場：OpenAI多模態革新，人機交互再進化”

OpenAI 最近推出了 GPT-4o，這是一個多模態模型，可以深入應用到人們的日常生活中。GPT-4o 可以接受文字、圖像和音訊的任意輸入組合，並即時生成文字、音訊和圖像的任意輸出組合。這一新模型大大改善了 ChatGPT 的體驗，使得與 ChatGPT 的互動更像真人交談，帶有屬於人類的情緒和口氣，有時保有耐心，偶爾展現俏皮的一面，呈現出更自然的人機互動。

OpenAI 公布了許多使用案例，以及開發者和一般網友的初步測試結果，這些測試表明 GPT-4o 在 ChatGPT 中的性能令人驚豔。以下是一些例子：

1. 利用手機鏡頭和 ChatGPT，視障朋友可以仿彿看見這個世界。
2. 兩個 ChatGPT 可以互相交談，並通過手機鏡頭分享彼此所看到的人和事。
3. 著名線上教育平台可汗學院（Khan Academy）的創辦人 Sal Khan 和他的兒子 Imran Khan 參與了測試，ChatGPT 讀取螢幕上顯示的數學問題，然後教 Imran Khan 一步步解出正弦 sin(α)。
4. 使用 Mac 版 ChatGPT App，ChatGPT 可以參與視訊會議，提出想法並與其他人討論，最後總結討論的重點。
5. 在面試前，ChatGPT 可以幫助你做準備，並給出一些建議。
6. ChatGPT 可以在發表會現場充當口譯員，流利地翻譯義大利語和英語。
7. 使用 Mac 版 ChatGPT App 和純粹 Breakout 遊戲的截圖，可以讓 ChatGPT 生成遊戲程式碼。
8. 通過手機上的 ChatGPT，只需要 20 秒就可以生成 3D 模型的 STL 檔案。
9. 利用手機鏡頭和 ChatGPT，可以識別紙上的書寫體文字，雖然有少數幾個字可能辨識錯誤，但整體體驗仍然非常出色。
10. GPT-4o 支援解讀表情的能力更細緻，已達到人類的水準。

GPT-4o 的推出將使 ChatGPT 在各個領域有更廣泛的應用，帶來更多的便利和創新。我們可以預見 ChatGPT 在未來的發展中將繼續取得更大的突破，並在人機互動領域發揮更重要的作用。

Share this content:

“GPT-4o登場：OpenAI多模態革新，人機交互再進化”

Related Posts:

Related posts: