星期五, 19 12 月, 2025
AI人工智慧忘掉ChatGPT的流暢回答:它不懂、也無意,這才是台灣在AI賽局中的真正王牌

忘掉ChatGPT的流暢回答:它不懂、也無意,這才是台灣在AI賽局中的真正王牌

當我們向ChatGPT或Gemini提出一個複雜問題,並在幾秒鐘內獲得一段流暢、清晰且看似充滿洞見的回答時,我們究竟在與什麼互動?一個正在思考的智慧體,還是一個史上最精密的語言模仿機器?這個問題不僅是科技哲學的思辨,更直接關係到全球數兆美元的產業估值,以及每一位投資者和企業決策者的未來判斷。一股強勁的潛流正衝擊著生成式AI的根基:儘管大型語言模型(LLM)的輸出成果驚人,但從根本上說,它們可能是「毫無意義」的。

這並非危言聳聽,而是一個基於語言本質的嚴峻挑戰。我們日常溝通之所以有效,不僅僅是因為詞彙和語法的正確組合,更核心的要素是說話者的「意圖」(Intention)。當我們說話時,我們心中有一個明確的目標:我們要指稱某個特定事物,表達某種特定觀點,或傳達某個特定的事實。正是這種意圖,為我們的語言注入了意義。然而,這恰恰是當前所有大型語言模型都無法跨越的鴻溝。

語言的「意圖」難題:AI無法跨越的鴻溝

語言充滿了模糊性與多義性,若沒有說話者的意圖作為定錨,意義便會漂移不定。試想一個簡單的句子:「窗戶上卡著一隻bat。」這句話中的「bat」究竟是哪種事物?在英語中,它既可以指哺乳動物「蝙蝠」,也可以指棒球運動中的「球棒」。對於一個人類說話者而言,當他說出這句話時,他腦中想的必定是兩者之一,他的意圖已經為這個詞彙選擇了唯一的、確定的意義。如果他看到的是一隻驚慌失措的飛行生物,他意圖表達的就是「蝙蝠」;如果他看到的是一件運動器材,他意圖表達的就是「球棒」。

然而,一個大型語言模型在生成這句話時,它並沒有「看見」任何東西,也沒有任何關於蝙蝠或球棒的真實世界經驗。它的運作機制,是基於其龐大訓練資料庫中詞彙與詞彙之間的統計機率。它知道「窗戶」、「卡住」和「bat」這些詞彙在文本中經常一起出現,但它本身無法形成一個指向「特定那隻蝙蝠」或「特定那根球棒」的意圖。因此,它生成的「bat」這個詞,缺乏意義的根基。它只是一個基於機率計算得出的最佳符號,而非一個承載著確定指涉的詞語。

這種「意圖缺失」的問題,在更複雜的語境中變得更加尖銳。例如「他看到朋友後笑了」這句話中的「他」是指誰?這需要依賴上下文來判斷。對於人類,我們的溝通意圖會自然而然地解析這個指代。但對AI而言,它只是在不同可能的指代對象(例如前文中提到的不同男性角色)之間進行機率選擇,而不是真正「理解」並意圖指稱某個特定的人。

同樣地,「馬利克很高」這句話的意義也完全取決於語境。如果馬利克是一個五歲男孩,身高130公分,那麼相對於同齡人,這句話是真的。但如果將他與成年籃球運動員相比,這句話顯然是假的。人類說話者在使用「很高」這個詞時,心中已經有了一個預設的比較參照系——這就是意圖。AI缺乏這種 grounded in reality(根植於現實)的意圖,因此它生成的「很高」只是一串符號,其真假值是懸而未決的。

這個根本性的缺陷意味著,無論AI的回答看起來多麼有條理、多麼富含知識,它本身並不「知道」自己在說什麼。它是一個語言模式的卓越複製者,卻不是一個意義的創造者。這個看似哲學性的辨析,卻對AI產業的商業模式和未來發展構成了巨大挑戰。

從向量到文字的「黑箱」:AI為何不懂自己在說什麼

要理解AI為何缺乏意圖,我們需要窺探其運作的「黑箱」。當我們輸入一段文字時,LLM首先會將其分解成稱為「詞元」(tokens)的碎片,這些詞元可能是一個單字、一個詞根或甚至只是一個字母。接著,每個詞元都被轉換成一個高維度的數字向量(vector)。這一步至關重要:語言的豐富內涵,包括其多義性、文化背景和情感色彩,都被壓縮成了一個純粹的數學對象。

例如,「bat」這個詞,無論它在語境中意指蝙蝠還是球棒,在初始編碼階段,它很可能被轉換成同一個數字向量。AI接下來的所有運算,都是基於這些向量之間的數學關係——它們在向量空間中的距離、角度和分布。模型透過訓練,學會了如何根據輸入向量序列,去預測下一個最有可能出現的向量,然後再將這個預測出的向量解碼成文字詞元。

整個過程就像一個極其複雜的數學方程式,輸入是數字,輸出也是數字。AI從頭到尾都沒有接觸到「意義」本身。它處理的是詞彙共現的統計規律,而不是概念之間的邏輯關係。當我們問它「從台北信義區到台灣大學怎麼走最快?」它給出的回答,並非源於它對台北地理的理解,也不是它真的規劃了一條路線。而是因為在它的訓練資料中,「信義區」、「台灣大學」、「捷運」、「公車」、「路線」這些詞彙的向量,以某種特定的統計模式關聯在一起。它只是重現了這個模式,而非進行了真正的地理空間推理。

人類的認知過程則截然不同。當我們聽到這個問題時,我們的大腦會啟動對真實世界地理空間的表徵,調用關於捷運系統、交通狀況的記憶,並在心中進行一種模擬,最終形成一個解決方案,再用語言將其表達出來。我們的語言,是我們內心思想和世界模型的輸出;而AI的語言,是其資料庫統計模式的輸出。這兩者有著本質的區別。這也解釋了為何LLM會產生所謂的「幻覺」(hallucinations)——即一本正經地編造虛假資訊。因為在它的向量空間中,某些不實資訊的組合可能在統計上看起來「很合理」,它無法像人類一樣,基於事實和常識進行查核。

美、日、台的AI棋局:誰在打造「大腦」,誰在打造「身體」?

理解了AI「無意義」的本質,我們就能以更清晰的視角來審視全球AI產業的競爭格局,特別是美國、日本和台灣在其中的不同角色定位。

美國:追逐「通用大腦」的巨頭

以OpenAI、Google、Microsoft為首的美國科技巨頭,正投入天文數字的資金,競相打造規模更大、參數更多的基礎模型。他們的目標是創造一個接近通用人工智慧(AGI)的「大腦」,一個能夠處理幾乎所有語言任務的統一系統。他們的商業模式,在很大程度上建立在用戶對其輸出「意義」的感知之上。然而,這種模式的風險也正在於此。由於模型本身缺乏真正的理解和意圖,其可靠性始終存在上限。企業若將其用於需要高度精確和負責的領域,如法律、醫療或金融,就必須承擔「幻覺」帶來的巨大風險。此外,當基礎模型的技術逐漸普及,這種「大腦」本身可能會商品化,屆時真正的護城河在哪裡,將成為一個嚴峻問題。

日本:務實布局「專用工具」的策略家

相較於美國的宏大敘事,日本的AI發展策略顯得更為謹慎和務實。NTT、NEC、富士通等傳統科技企業,正致力於開發規模較小、針對特定產業的語言模型。例如,NTT開發的「tsuzumi」模型,就強調輕量化和針對性,旨在更容易地與企業現有系統整合,解決具體的商業問題。日本企業似乎更早地認識到LLM作為一個通用「大腦」的局限性,轉而將其視為可以高度客製化的「專用工具」。這種策略避開了與美國巨頭在模型規模上的直接競爭,轉而在應用層面積累優勢。此外,像軟銀(SoftBank)這樣的全球投資巨頭,則在全球範圍內布局AI生態鏈,扮演著資本催化劑的角色,其投資組合的多樣性也反映了對AI未來多種可能路徑的對沖。

台灣:打造AI「身體與神經系統」的基石

在這場全球棋局中,台灣的角色獨一無二,也至關重要。如果說美國在打造AI的「大腦」,那麼台灣就在打造其賴以運行的「身體」和「神經系統」。台灣並沒有直接投身於基礎模型的燒錢大戰,而是憑藉其無可比擬的半導體和硬體製造實力,成為了AI革命的基礎設施供應商。

Nvidia設計的AI晶片(神經元),絕大部分由台積電(TSMC)以最先進的製程製造。這些晶片被組裝在由鴻海(Foxconn)、廣達(Quanta)、緯穎(Wiwynn)等公司設計和製造的高效能AI伺服器(頭腦和脊柱)中。聯發科(MediaTek)也在積極設計自己的AI晶片,搶占邊緣運算的市場。台灣的價值,不在於LLM生成的那些「無意義」的文字,而在於支撐這些文字得以生成的、實實在在的硬體。

這個定位讓台灣在AI浪潮中處於一個極為有利的位置。無論最終是OpenAI的模型勝出,還是Google的模型佔優,抑或是開源模型崛起,它們都需要台灣製造的晶片和伺服器。台灣的價值鏈,較少受到LLM本身「意義缺陷」所帶來的商業模式風險的影響。我們的價值是確定的、物理的,是整個產業的基石。

投資者的視角:在「意義的幻覺」中尋找真實價值

對於投資者而言,洞察LLM「無意義」的本質,是撥開迷霧、發現真實價值的關鍵。這意味著我們需要重新評估風險與機會。

首先,最大的風險在於對AI能力的過度信任和不當應用。LLM的「幻覺」不是一個可以透過更多資料就能徹底修復的bug,而是其核心機制的內在屬性。這意味著任何將LLM直接用於關鍵決策而沒有人類專家嚴格監督的商業模式,都潛藏著巨大的營運和法律風險。

那麼,機會在哪裡?答案在於承認並利用這種「人機協作」的模式。雖然LLM的輸出本身沒有意圖和意義,但它可以被一個擁有意圖的人類用戶賦予意義。我們將這個過程稱為「替代意義」(Ersatz Meaning)。LLM是一個強大的靈感生成器、草稿撰寫器、資訊檢索輔助工具和模式識別器。真正的價值,產生於人類專家利用這個工具來最大化自身智慧和效率的那個環節。

因此,明智的投資策略應聚焦於以下幾個方向:

1. 「賣鏟人」策略:這是最穩妥的選擇。投資於AI產業的基礎設施,即晶片製造(如台積電)、晶片設計(如Nvidia)和伺服器供應鏈(如廣達、緯穎)。無論淘金者誰能挖到金礦,賣鏟子和牛仔褲的人總是穩賺不賠。

2. 「應用層」的精明玩家:尋找那些並非試圖創造通用大腦,而是將現有LLM技術巧妙地整合到特定工作流程中,以解決實際問題的公司。這些公司深刻理解技術的局限性,並設計了強大的人類監督和驗證機制,將AI的效率與人類的可靠性結合起來。

3. 對純基礎模型公司的審慎評估:對於那些估值完全建立在AGI夢想之上的基礎模型公司,需要保持高度的審慎。它們的技術固然令人驚嘆,但其通往永續、可獲利商業模式的路徑,遠比看起來要崎嶇和充滿變數。

總結而言,我們正處於一個由統計模型驅動的語言革命時代。大型語言模型是人類創造出的最令人驚嘆的工具之一,但我們必須清醒地認識到,它們是鏡子,反映的是其訓練資料中的模式,而不是擁有自我意識的智慧之源。它們生成的語言,在被人類解讀和賦予意圖之前,是空洞而無意義的。對於身處台灣的我們而言,最大的機會或許並非去追逐那個鏡中看似智能的幻影,而是去打造和打磨那面能夠映照出一切的、堅實無比的鏡子本身。在這場由代碼和資料構成的喧囂中,最持久的價值,最終還是源於那些我們可以觸摸和測量的物理現實。

相關文章

LINE社群討論

熱門文章

目錄