星期四, 18 12 月, 2025
AI人工智慧當全球瘋搶AI模型,台灣為何該專心當「軍火商」?

當全球瘋搶AI模型,台灣為何該專心當「軍火商」?

全球人工智慧(AI)的發展正進入一個令人目不暇給的「百家爭鳴」時代。過去一週,從中國的科技巨擘到美國的學術新創,接連發布了令人震撼的新模型,技術的迭代速度幾乎是以天為單位運算。螞蟻集團推出了兆級參數的「思考模型」,百度則讓AI影片生成進入「即時串流」時代,Google讓影音同步生成,而史丹佛大學李飛飛團隊的新創更試圖顛覆3D渲染的百年規則。這場競賽不再只是比誰的模型參數更多、資料更大,而是進入了比誰能「想得更深」、「看得更遠」、「反應更快」的全新維度。

然而,在這場由中美巨擘主導的雲端戰爭中,台灣的投資者與產業人士不禁要問:我們的位置在哪裡?當全球目光聚焦於這些光鮮亮麗的演算法時,我們該如何從中找到屬於自己的機會與定位?這不僅僅是技術的競賽,更是一場牽動全球產業鏈重組的深刻變革。

巨擘競逐的AI新戰場:不只比大,更比誰「想得深」

過去,衡量一個AI模型強弱的標準似乎很單純,就是「參數規模」。但近期的新發展顯示,戰場已經轉移。單純的規模擴張已不足以解決複雜問題,業界開始追求更深層次的推理能力與更高效的互動體驗。

螞蟻集團的「兆級」野心:Ring-1T的邏輯推理挑戰

螞蟻集團近期開源的Ring-1T模型,就是一個明確的訊號。這是一個參數達到兆級的混合專家(Mixture of Experts, MoE)架構模型。我們可以將MoE想像成一個由眾多「專家小組」組成的顧問團,當遇到一個複雜問題時,系統會自動指派最擅長該領域的幾個專家來協同解決,而非讓一個全才通包所有任務。這種架構不僅能更有效地利用運算資源,更重要的是,它被設計用來解決深度思考與複雜推理的難題。

根據螞蟻集團發布的資料,Ring-1T在數學、程式設計和邏輯推理等多項基準測試中,都達到了目前開源模型的頂尖水準,其在國際奧林匹克數學競賽(IMO)的解題能力,甚至號稱能對應人類銀牌選手。這背後的意義是,AI正從一個擅長語言模仿與資訊統整的「博學助理」,朝向一個具備嚴謹邏輯與逐步推演能力的「問題解決者」演進。這與美國OpenAI的GPT-4在發展路徑上追求的目標不謀而合,雙方都在試圖攻克AI最核心的認知推理障礙。

百度與Google的影音對決:從「生成」到「即時互動」

如果說螞蟻挑戰的是AI的「智商」,那麼百度和Google則在刷新AI的「創意表達」與「即時反應」能力。百度的AI影片生成平台「文心一格·蒸汽機」推出了「即時串流生成」功能。這與OpenAI的Sora模型有著本質上的不同。Sora是我們先給予指令,然後等待模型一次性「渲染」出完整的影片。而百度的技術,則像是在直播一樣,使用者可以即時看到畫面的生成過程,並可能進行互動調整。為了實現這種低延遲的互動,其模型架構採用了「流式滑窗自回歸擴散」技術,這意味著模型是一邊運算一邊生成,極大地提升了互動性。

與此同時,Google也對其旗艦影片模型Veo進行了重大升級。最新的Veo 3.1版本實現了一個關鍵突破:原生同步生成影片畫面與音訊。這意味著影片中的對話、音效和配樂不再是後期配音,而是在生成影像的同時一併創造出來,確保了音畫的高度同步與協調。此外,其影片擴充功能已能將片段延長至近兩分半鐘,為AI敘事創作提供了更大的可能性。這兩大巨擘的動態顯示,AI生成內容的賽道正從「能否生成」的1.0時代,邁向「能否即時互動、能否多模態協同」的2.0時代。

換道超車的想像力:從3D渲染到生成式世界模型

在巨擘們激烈廝殺的同時,由知名AI學者李飛飛共同創辦的WorldLabs公司,則展示了一種截然不同的、可能「換道超車」的技術路徑。他們推出的生成式世界模型RTFM(Real-time Frame Model),目標是顛覆傳統的3D渲染流程。

過去數十年,無論是電影特效還是電動遊戲,要創建一個虛擬3D世界,都必須經過繁瑣的建模、貼圖、打光等步驟,這需要耗費大量的專業人力與運算資源。RTFM則另闢蹊徑,它不建立傳統的3D幾何模型,而是像一個「學習型渲染器」,直接從幾張2D圖片中學習場景的空間關係,然後即時生成該場景在任何新視角下的2D圖像,並保持3D空間的一致性。最驚人的是,這一切都可以在單張NVIDIA H100 GPU上即時運行。

這項技術的潛力極其巨大。它不僅可能大幅降低元宇宙、數位雙生(Digital Twin)等應用的開發門檻,更可能在自動駕駛、機器人視覺等領域發揮關鍵作用,讓機器能夠更快速、更低成本地理解和預測真實世界的動態。

當我們談論AI時,我們在談論什麼?美、日、台的產業定位

面對這波瀾壯闊的技術浪潮,不同國家和地區的產業也呈現出截然不同的戰略定位。看清這種差異,對於台灣的投資者至關重要。

美國的霸權:從雲端模型到生態系建構

美國無疑是這場AI競賽的領跑者。以OpenAI、Google、Meta為首的巨擘,其核心戰略是打造最強大的「基礎模型」(Foundation Models),並透過API(應用程式介面)將其能力開放出來,建構一個龐大的開發者生態系。就像微軟的Windows和蘋果的iOS一樣,他們不僅僅是提供產品,更是在制定標準、建立平台,讓全世界的開發者在他們的基礎上進行創新。這種模式的優勢在於能掌握產業鏈的最高話語權,獲取最豐厚的利潤。

日本的追趕與聚焦:大型企業的應用突圍

相較之下,日本在基礎模型競賽中聲音較小,但其策略更為務實且聚焦。以NEC、富士通(Fujitsu)等傳統科技巨擘為代表,他們並不追求打造全球最強的通用大模型,而是專注於將AI技術與自身深耕多年的產業領域相結合,例如工業製造、金融服務、社會基礎設施等。他們更擅長的是「AI+應用」,將AI視為提升現有業務效率與價值的工具,而非一個獨立的產品。這種策略雖然短期內難以產生像ChatGPT那樣的爆炸性影響,但卻能穩扎穩打,在特定的垂直領域建立深厚的護城河。

台灣的關鍵拼圖:從「運算能力軍火庫」到「終端智慧」

台灣在這場全球AI棋局中的角色,既獨特又關鍵。如果說中美巨擘是戰場上指揮千軍萬馬的將軍,那麼台灣就是提供最精良武器的「軍火庫」。從台積電(TSMC)最先進的晶片製程,到鴻海(Foxconn)、廣達(Quanta)等廠商組裝的AI伺服器,再到散熱、電源、機殼等整個供應鏈,台灣掌握了AI時代最底層、也最不可或缺的「運算能力基礎設施」。無論上層的軟體應用如何變化,對高效能運算的需求只會有增無減,這為台灣的硬體產業帶來了結構性的長期利多。

除了扮演軍火庫的角色,台灣在「終端AI」(Edge AI)領域也展現出強大潛力。聯發科(MediaTek)在手機晶片中整合的AI處理單元(APU),讓AI運算可以直接在裝置上高效運行,而非完全依賴雲端。這股趨勢正從手機擴充到AI PC、智慧汽車等新興硬體。與此同時,由國科會主導開發的TAIDE模型,則代表了台灣在建立自主可控的語言模型、確保數位主權方面的努力。台灣的策略,是硬體與軟體並進,一方面鞏固在全球硬體供應鏈中的核心地位,另一方面則在應用層面積極佈局,尋找軟硬整合的新機會。

投資者的羅盤:在喧囂中尋找確定性

面對複雜的市場環境與快速的技術迭代,投資者需要一個清晰的羅盤來指引方向。綜合來看,以下幾個方向具備較高的確定性:

1. 「賣鏟人」的價值恆定:在AI淘金熱中,最穩健的投資標的之一,永遠是那些「賣鏟子和牛仔褲」的。對應到AI產業,這就是提供運算能力基礎設施的硬體供應商。無論是晶片製造、伺服器代工,還是高速傳輸、散熱模組等關鍵零組件,只要AI發展的趨勢不變,這些公司的訂單能見度就相對較高。

2. 應用為王,情境落地是關鍵:基礎模型的戰爭成本高昂,且贏家通吃的局面日益明顯。對大多數企業而言,真正的機會在於應用層。如何利用AI技術解決特定產業的痛點,提升效率、創造新體驗,才是價值變現的核心。特別是那些面向海外市場的消費級軟體(C端),以及深入製造業、金融等領域的企業級服務(B端),一旦找到合適的應用情境,其成長潛力將非常可觀。

3. 終端AI革命的序幕:隨著AI PC和新一代智慧型手機的普及,越來越多的AI運算將從雲端轉移到個人裝置上。這不僅能保護使用者隱私,還能提供更即時、更個人化的體驗。「終端AI」將催生新的硬體需求和軟體生態,相關的晶片設計公司和軟硬整合解決方案提供商值得長期關注。

總結而言,全球AI競賽已進入一個多層次、多維度的深水區。它不僅僅是中美兩國的科技對抗,更是全球產業鏈的一次深刻重構。台灣在這場變革中,憑藉其無可取代的硬體製造實力,穩穩佔據了核心戰略位置。對投資者而言,與其追逐遙遠的演算法聖杯,不如立足於我們自身的產業優勢,看清從雲端到終端的產業鏈條,在喧囂的AI浪潮中,找到最堅實的價值之錨。硬體與軟體的深度融合,必將創造出下一波真正改變世界的創新應用。

相關文章

LINE社群討論

熱門文章

目錄