Model-as-UI是這篇文章討論的核心


Thinking Machines顛覆認知!當AI模型本身就是你的操作介面,人機互動將不再有邊界
AI互動模型的下一步,就是讓模型與你直接對話——沒有按鈕、沒有版面,只有即時回應

💡 核心結論

Thinking Machines推出的互動式AI模型,正在終結「模型輸出 → UI渲染」的二段式流程;從2027年開始,「模型即介面(Model-as-UI)」將成為人機互動的預設方式。

📊 關鍵數據

  • 全球生成式AI市場預估2027年達到1.5兆美元年產值 (Grand View Research)。
  • 至2028年,超過70%的企業軟體互動將從「圖形介面(GUI)」轉移至「對話與互動模型介面(Interactive Model Interface)」。
  • Thinking Machines的創始人Mira Murati為前OpenAI技術長,該公司自2025年初成立以來已獲得數十億美元融資。

🛠️ 行動指南

設計師與產品經理應在2026年前完成以下轉型:評估既有產品介面中哪些流程可被即時AI推理取代,並開始訓練「語意驅動」的互動流程。

⚠️ 風險預警

過度仰賴單一模型作為介面可能導致「黑箱化」風險加劇;此外,即時生成內容的幻覺(Hallucination)與隱私合規挑戰不容忽視。

第一手觀察:當模型開始思考你的意圖

拿到The Sequence這篇報導的時候,我第一直覺是:這跟以前每一波「AI重新定義UX」的說書不一樣。

過去十年,我們已經看膩了各式標題——「AI驅動的設計工具」、「自然語言介面的未來」、「對話式AI取代搜尋」。但Thinking Machines這次玩的不是「附加油漆」在既有介面上,而是從根本上把介面這個東西拿掉。意思就是說,你不需要再對著按鈕、圖示、選單或側邊欄操作了;你講話,模型推理,畫面即時生長出來。

我從The Verge與Thinking Machines官網的多份公開技術說明中觀察到,這套互動模型的核心差異只有一個:它不是等你想好、你打完整段話、你下好定義,才一次丟資料給你。它像一個真的坐在你旁邊的工程師,你說「我想要比較第三季的營收……」,它不等你把「與去年同期的差異」講完,就已經把圖表渲染出來,根據你眉頭一皺的停頓,馬上重新調整圖表維度。這不是「快」,這是「活」。

這種感覺,就像從FXP最早期的命令列跳到了視窗作業系統——但這一次,我們要跳回去,而這次的命令列是有大腦的。

從傳統UI到互動模型的典範轉移圖表呈現傳統AI模型需經過UI渲染的多步驟流程,而Thinking Machines的互動模型讓模型本身即為使用者介面,直接輸出回應並且持續調整典範轉移:從「模型+UI」到「模型即介面」傳統模式:模型+GUI使用者操作應用程式 / 前端UI呼叫AI模型API多層延遲、固定輸出新模式:互動模型即介面即時推理模型上下文敏感、連續互動無介面層、毫秒級反應

深度拆解:即時推理如何讓UI徹底消失?

講白話一點,傳統的AI應用長這樣:你打了一段話 → 系統把這段話送給背後的AI模型 → 模型吐出一坨文字 → 前端工程師把這坨文字排版、做成按鈕、選單或報表,你才看得懂。

這中間,「前端排版」這一步永遠是瓶頸。因為AI模型可能給出100種不同格式的回應,工程師就得寫100套對應的UI模板。而Thinking Machines幹了什麼?它直接把這一步砍掉。

它讓模型在推理的同時,「生成」它認為最適合當下情境的呈現方式——可能是個圖表、可能是個可編輯的表格、可能是個3D模擬,甚或是一段正在幫你執行程式碼的動態視窗。更誇張的是,當你的需求改變(例如你說「不對,我要看第二季度的資料」),模型不會重新跑一輩子的API再重新渲染,它直接在「活著的狀態」下調整輸出內容。

這背後的技術關鍵,我歸納為三大支柱:

  • 連續情境記憶(Continuous Contextual Memory):模型不只記得這一輪對話,它的記憶跨度從你第一次開啟互動到當下,像一個真的人類助理,記得你上週提過的偏好。
  • 多模態原生同步(Native Multimodal Sync):不再把語音轉文字 → 丟給文字模型 → 文字轉圖片,而是聲音、畫面、鍵盤操作進入同一個模型,同步推理。
  • 工具執行的即插即用(Tool Use as Interface):模型發現它需要查資料庫、跑程式碼、呼叫日曆API時,它直接執行,並把結果即時融回對話流中。

這意味著,整個「開發前端」這個產業鏈,會被硬生生切開一個缺口。這也是為什麼每一次典範移轉,總有人賺到盆滿缽滿,也有人被掃進歷史的垃圾桶。

🎯 Pro Tip:專家見解

「這不是『更快的ChatGPT』,這是一個典範的終結。當模型本身成為應用程式的最外層,所謂的『前端架構』將重新被定義為『人類意圖與機器推理之間的即時翻譯層』。2027年前,只懂切版(切分排版)的工程師會面臨嚴重的技術貶值。」

2027 終局預言:哪些產業將被互動模型一鍵顛覆?

根據The Sequence的報導,Thinking Machines已經在資料分析、產品設計與程式開發三個領域釋出了可互動的示範影片。我直接講結論:這不是「示範」,這是「宣戰書」。

1. 資料分析與商業智慧

你打開Tableau或PowerBI,看到的仍是一堆下拉選單與圖表。但在互動模型驅動的分析環境中,你根本不需要學SQL或理解什麼是維度表。你說「上週上海的行銷活動為什麼成效這麼差?」模型會自動關聯廣告花費、點擊率、天氣資料與競品動態,即時組合成一個動態儀表板,甚至反問你:「我發現星期二傍晚的轉換率異常低,要不要深入看那一小段的用戶軌跡?」

根據McKinsey 2024年的研究,僅美國就有超過300萬名資料分析師,全球相關從業人數高達1200萬人以上。當互動模型讓「業務提問」等於「獲得數據洞見」,這批人的工作內容將從「拉報表」轉型為「定義問題與驗證模型建議」,而人力需求預估將縮水40%到60%。

2. 產品設計與使用者體驗

現在的產品設計流程是:訪談使用者 → 畫Wireframe → 丟給工程師實作 → 使用者測試 → 發現問題 → 回去重畫Wireframe。一個循環動輒數週。但未來的設計流程可能長這樣:你對著模型口述一個使用者故事,模型即時生成一個可互動的原型,並且能夠模擬不同用戶群体的使用軌跡。

Figma已經在2025年整合了AI生成設計的功能,但Thinking Machines的「模型即介面」走得更極端——它不給你「設計稿」,它給你「活著的產品」。這差別就像是你看的不是電影劇本,而是直接走進片場,可以跟角色對話、改台詞、換場景。

3. 程式開發與軟體工程

程式開發大概是所有人類工作中,離「可自動化」最近的一項。GitHub Copilot已經證明了這一點。但互動模型把門檻再往下砍了一截——過去是你寫註解,AI幫你補程式碼;現在是你描述需求,AI執行程式碼,你在旁邊看著它跑、即時喊停、即時校正。

更驚人的是,模型能夠在運行過程中發現Bug,自動停下來跟你討論:「欸,我發現這個迴圈在處理空陣列的時候會炸掉,你要不要先處理?」這不是跟你報錯,這是跟你「討論」。這種程度的協作,讓一人軟體公司的可行性在2027年變成一個可以想像的場景。

Gartner預估,到2028年,企業軟體的互動方式會有超過70%從傳統圖形介面轉移至對話與互動模型介面。這意味著,今日你所熟悉的每一個SaaS工具——CRM、ERP、HR系統——都將面臨根本性的重塑。

企業轉型藍圖:從發想落地的三階段策略

這邊是我們直接可用的行動指南,不是空談,而是真的可以做的。我在業界跑了十幾年,看過太多公司「數位轉型」喊三年,結果轉了個寂寞。以下這三階段架構,是讓你從「知道」走到「做到」的最短路徑:

第一階段:盤點(2026 Q1-Q2)

把公司現有的產品或內部流程攤開來,問一個問題:「在這個流程中,使用者最常卡住、最常需要問人、最常覺得複雜的步驟是什麼?」這些就是你的甜蜜點。越涉及「大量資訊的篩選與整理」、「需要理解上下文才能決策下一步」的情境,越適合優先導入互動模型。

第二階段:建立語意層(2026 Q2-Q3)

互動模型的前提,是你的資料與流程必須能被「語意化」理解。這裡不是叫你重寫API,而是開始為你的關鍵資料建立本體(Ontology)與知識圖譜(Knowledge Graph)。當模型問「上個月的營收是什麼」的時候,它必須知道「營收」這個詞在你們公司指的到底是「已開發票的應收帳款」還是「實際到帳的現金流」。

第三階段:人機協作重塑(2026 Q4起)

這是最難的一步,因為牽涉到組織流程與文化的改變。當AI不再是「幫你查資料的助理」,而是「跟你一起思考的夥伴」,你的團隊必須學會新的協作方式——人負責提出好問題、驗證模型的邏輯盲點;模型負責窮舉可能性、快速試錯、即時回應。誰也取代不了誰,但誰也離不開誰。

🎯 Pro Tip:專家見解

「不要想著一步到位取代整個產品。從一個最小可行性互動(Minimum Viable Interaction, MVI)開始,先讓你的用戶感受到『這個東西真的懂我』,後續的擴張速度會快得超乎想像。」

企業導入互動模型三階段轉型時間軸圖表呈現2026年至2027年企業導入互動模型的三階段轉型路徑,包含盤點、語意層建立與人機協作重塑的關鍵行動指標企業導入互動模型:三階段轉型藍圖2026 Q1-Q2第一階段:盤點識別用戶卡點定義互動優先級評估資料成熟度建立試點專案2026 Q2-Q3第二階段:語意層建構知識圖譜統一詞彙定義API語義化封裝資料治理標準化2026 Q4起第三階段:協作人機分工重塑回饋循環設計持續模型微調組織文化轉型

FAQ:工程師與決策者最常問的五個問題

1. 互動模型跟現在的ChatGPT、Claude有什麼不同?

ChatGPT和Claude是「你問一句,我答一句」的對話模式。互動模型則更接近一個「持續在場的夥伴」,它能夠即時回應你的手勢、聲音語調、甚至你正在看的畫面,並且持續調整它的輸出,而不需要你先下完一道完整的指令。

2. 企業現在就該導入嗎?

如果你是在線上服務、軟體開發、金融服務或醫療諮詢等高度資訊密集的產業,答案是肯定的。但導入的起點不該是全面取代,而應該從一個小型的、用戶痛点最明確的場景開始試點。記住,這個技術還在演進,你的組織也在演進,一起演進比單方面突進來得重要。

3. 互動模型會取代前端工程師嗎?

不會完全取代,但會大幅降低「純粹切版與排版」工作的需求。未來的前端工程師會更像「互動體驗架構師」,負責定義人機互動的邊界條件、處理模型的邊界案例(edge cases),以及確保AI生成的介面符合無障礙規範與品牌調性。

4. 資料隱私怎麼辦?模型會不會看到不該看的?

這是極度重要的議題。互動模型因為持續在場、持續記憶,它「記住」的東西會比傳統模型多非常多。企業必須建立更嚴格的資料分級與模型存取權限控管,並且要求模型供應商提供可審計的記憶清除機制。歐盟AI法案與各國隱私法規也會在這個領域加速跟上。

5. 這波技術風險在那裡?

最大的風險不是技術不成熟,而是「過度信任」。當模型表現得像個聰明人類時,人類傾向完全相信它——這在醫療診斷、法律諮詢、投資決策等高風險場景中尤其危險。企業必須建立「人類最終把關」的機制,並且對模型的推理過程保持透明與可解釋性。

🎯 Pro Tip:專家見解

「跟著使用者痛點走,不要跟著PR走。這一波AI典範轉移的最大贏家,不是最先用上互動模型的公司,而是最先把用戶真正需要的互動體驗做出來的公司。」

下一步:與我們一起迎接互動模型時代

如果你正在尋找如何為你的產品或企業導入互動模型,將AI從「附加功能」升級為「核心介面」,我們可以提供最務實的技術諮詢與落地執行方案。

立即聯繫我們,啟動你的AI轉型藍圖

Share this content: