AI發展天花板將至?揭穿過度炒作背後的真相

Featured Image
過去幾個月,對人工智能(AI)的炒作已經到了瘋狂的地步。像是特斯拉在一兩年內就要實現全自動駕駛了,AI明年將會變得比人類更聰明了,到 2040 年會有十億台AI機器人取代人類工人了,這些還只是伊隆·馬斯克今年迄今為止對AI誇下的海口之一。整個AI圈都充斥著這樣的預測和承諾,給人感覺AI的發展已走上不可阻擋的指數軌跡曲線上,已經到了我們人類根本無法阻止的地步。但是事實並非如此。真要說,AI正開始觸碰到收益遞減的發展天花板,進而令這些誇張的承諾變成一張廢紙。下面我會解釋的。

要想理解這個問題,我們得先瞭解一點AI的基本工作原理。現代AI運用的是深度學習演算法與人工神經網路,借此來發現資料當中的趨勢。然後,AI就可以根據這些資料推斷或沿著同一趨勢線生成新的資料。這首先需要「訓練」AI,將大量資料餵給它進行分析,讓它去發現這些趨勢。之後,你就可以拋問題給AI來獲得輸出。這個基本概念為電腦視覺、自動駕駛汽車、聊天機器人以及生成式AI提供了動力。這個解釋有點簡化了,但現在我們只需要瞭解這些就夠了。

過去幾年,AI的能力有了顯著增強。這部分要歸功於有了更好的程式設計和演算法。但 90% 要歸功於用了更大的資料集對AI進行訓練。進而使得AI可以更準確地瞭解資料趨勢,進而更準確地生成結果。但有個問題:我們正目睹相對於所需的資料和算力,訓練AI帶來的回報正在急劇遞減。

我們先從資料講起。假設我們開發了一個簡單的電腦視覺AI,它可以辨識出狗和貓,我們已經用 100 張狗和貓的圖像和影片對其進行了訓練,它可以在 60% 的時間內正確辨識這些動物。如果我們將訓練的圖像和影片數量增加一倍,達到 200 個,其辨識率就會提高,但只能略微提高到 65% 左右。如果我們再次將訓練圖像和影片增加一倍,達到 400 個,那麼其改進將更加微乎其微,只能達到 67.5% 左右。

從這個例子可以看出,隨著訓練資料的增加,AI的改善效果逐漸遞減。這是因為在一定程度上,訓練資料的多寡已經達到了AI的學習極限。換句話說,增加更多的訓練資料並不會帶來更大的效益。這就是所謂的「訓練收益遞減」。

除了訓練資料,AI的另一個瓶頸是算力。隨著AI模型的複雜性和規模的增加,需要更多的計算資源來進行訓練和推斷。然而,隨著模型變得越來越大,所需的算力也成倍增加。這使得訓練和推斷變得更加昂貴和困難。

總而言之,AI的發展已經達到了一個瓶頸。無論是資料還是算力,都限制了AI的進一步發展。這並不意味著AI沒有前途,相反,AI仍然是一個非常強大的工具,可以應用於許多領域。但是,我們需要保持理性,不要被誇大的承諾和預測所迷惑。AI的發展需要時間和努力,我們需要與之共同進步。

Share this content: