台灣天才陳信翰:從數理童星到OpenAI研究主管

Featured Image
GPT-4o再度震驚全球!OpenAI新發表會掀起了一股熱潮,而Mark Chen的表現更是讓人印象深刻。他是台灣出生的,後來移居美國,現在是OpenAI的重要成員,中文名字是陳信翰。他的父親曾在光電業擔任要職,母親則是清華大學的教授。他是如何培養出出色的數理能力,並引起奧特曼的注意的呢?去年他在台灣的一次活動中分享了他的成長背景。

在OpenAI的新發表會上,有一位亞洲面孔的人叫Mark Chen。他在全球的注目下展示了如何使用GPT-4o(全名是Generative Pre-trained Transformer 4o)進行深度呼吸。雖然他笑稱自己很緊張,但是他的舉止充滿了自信,讓人印象深刻。正是這位Mark Chen獲得了OpenAI的創辦人奧特曼(Sam Altman)的高度讚譽,而他就是一位台灣人,目前擔任OpenAI多模態與尖端研究部門的主管。去年九月,他應邀到國立清華大學演講。那麼,他的背景是什麼呢?

陳信翰在高中時就讀於台灣的清華大學實驗中學雙語部。陳信翰的高中曾邀請他到清華大學接受一些課程,包括離散數學等等。這不是他第一次受邀到清華大學,他在2021年就以「使用GPT生成文本和圖像」為題與網友分享了他的經驗。陳信翰還曾經拜訪陳家,分享他是如何在高中時通過SAT考試獲得滿分。

在去年的台灣人工智慧論壇上,主持人問陳信翰台灣和美國教育的差異,他委婉地表示台灣的學生缺乏紀律。陳信翰在數學競賽中取得了出色的成績,連續多次在AMC10、AMC12和AIME等競賽中獲得滿分,最終進入了麻省理工學院。在2008年接受採訪時,他表示「台灣的課本和試題過於注重演算法,這會削弱學生對數學樂趣的追求」。他在麻省理工學院獲得了數學和資訊工程的雙學位,並在讀書期間在微軟實習,畢業後進入了一家自營交易機構從事量化投資,開發股票和期貨的機器學習算法,現在在OpenAI擔任研究科學家,領導多模態與尖端研究部門,陳信翰對Codex、GPT-3和Image GPT都做出了重要貢獻,他還帶領DALLE‧2團隊,並為GPT-4引入了視覺功能。

陳信翰在一場長達90分鐘的演講中分享了GPT-4o模型的發展歷程。陳信翰表示「GPT模型愈來愈像人類」,並詳細介紹了模型版本的演進。GPT模型本質上是一個機率模型,利用機器學習來預測下一個詞彙,從而完成句子。當GPT-2出現時,即使沒有對模型進行特定任務的訓練,模型仍然能夠完成所有語言描述的任務。

陳信翰強調,GPT-2讓OpenAI意識到「幾乎所有任務都可以用語言描述」,這一點非常重要。OpenAI發現將任務轉化為「prompt」(指令或提示)的重要性,並通過調整和改進模型來提高性能。隨著GPT-3的出現,OpenAI獲得了兩個啟示。首先是規模的重要性,也就是縮放定律(scaling laws)的重要性。根據2020年OpenAI發表的一篇論文,當自回歸生成模型的規模增加並使用更多的計算資源時,性能會得到提升,這種提升幅度甚至可以用精確的公式來預測。陳信翰表示,「我們將盡力追逐這個定律,希望它不會失效」。第二個啟示是,只要提供足夠的上下文和實例,GPT-3就能夠學習如何完成訓練時未見過的任務,逐漸實現類似人類歸納法的一般化能力。今年發布的GPT-4引入了視覺輸入的多模態功能,並且在推理和語言理解方面更加深入,比如能夠解釋笑話的笑點,並能夠在對話中進行上下文理解。

陳信翰回顧了GPT模型的成長歷程,從只能完成句子到能夠進行對話,再到逐步學會歸納法和理解上下文。儘管模型的運作方式與人類有所不同,但是正如看著孩子成長一樣,它們也在不斷成長。

陳信翰還分享了GPT模型面臨的兩大挑戰:對齊模型行為與人類意圖,以及提升模型的「好」程度。陳信翰指出,語言模型的用途是預測下一個詞彙,而不是「對人類有幫助」,因此初期的模型很難滿足需求。OpenAI通過人類回饋強化學習的方法來解決這個問題,讓GPT模型知道並模仿人類的偏好。

在了解了人類意圖之後,模型還能做些什麼來提升自己呢?首先,需要定義「什麼是更好」,這其中有三個層次:首先是讓模型的運作更像人類,這是一種進步。OpenAI關注「思維連鎖」的研究,要求模型不要直接回答問題,而是模仿人類思考時的步驟,並透過互相辯論來避免生成內容過於單一。其次是讓模型的回答更具可驗證性,這也是一種進步。可以通過爬取外部網頁和自我監督的方式,讓開發者提供外掛,與即時資訊進行對接。最後是讓模型的回答更具多樣性,這當然也是一種進步。OpenAI考慮多元化人類回饋者的背景,以反映不同族群的想法和偏好,推動生成內容的多樣化。

在問答環節中,陳信翰回答了有關模型的信任和安全性的問題。他分享了OpenAI在提高模型安全性方面的努力,包括事前預防措施和積極探索模型如何思考的方式。他還強調,安全性無法通過虛擬手段達到,只有通過實際試用,研究人員才能理解最先進技術的限制和不足。至於是否開源GPT-4的問題,陳信翰解釋說貿然開源可能會被人惡意利用,因此他們首先會開放給一般用戶使用,了解潛在的缺陷,然後再根據情況考慮是否開源。雖然OpenAI的做法有一定的理由,但是仍然無法讓國際科技社群完全接受。

在未來的研究方向中,OpenAI計劃將模型做得更輕量化,甚至使其可以在手機上運行。他們還計劃增加模型與真實世界的互動,測試多模態模型的邊界,並讓模型實現更廣泛的目標。奧特曼和陳信翰等人帶領OpenAI不斷推進機器智能的發展,並不斷突破新的界限。我們在旁邊見證了這一切,同時期待和擔憂,並不斷反思人類的價值。

以上是對OpenAI新發表會的整理和優化,希望能夠提高文章的SEO效果,並獲得更多來自搜尋引擎的流量。

Share this content: