星期四, 18 12 月, 2025
AI人工智慧脫胎於輝達,反攻CUDA霸權:中國AI晶片新創摩爾线程憑什麼?

脫胎於輝達,反攻CUDA霸權:中國AI晶片新創摩爾线程憑什麼?

在全球人工智慧(AI)革命的浪潮中,運算能力已然成為衡量國家與企業競爭力的核心指標,其重要性堪比新時代的石油。這場由大型語言模型(LLM)點燃的軍備競賽,不僅將輝達(NVIDIA)推上前所未有的市值高峰,也使其CUDA生態系統成為一道難以逾越的技術壁壘。然而,在地緣政治與科技封鎖的雙重壓力下,中國正傾全國之力,試圖建立一個獨立自主、不受掣肘的AI運算能力基礎建設。這場突圍戰不僅關乎單一企業的成敗,更是一場牽動全球半導體供應鏈格局的「芯」棋局。在這盤棋中,一家成立僅數年、由前輝達高管創立的新創公司——摩爾线程(Moore Threads),正以其獨特的戰略定位與技術路徑,成為觀察中國AI晶片野心的一個絕佳窗口。它究竟憑藉什麼,敢於挑戰輝達的霸權?其「生態、架構、叢集」三位一體的戰略,又將如何影響台灣與日本的相關產業鏈?

摩爾线程:脫胎於輝達的「全功能GPU」挑戰者

當談論AI晶片時,大多數人的目光都聚焦在專用的AI加速器上。然而,摩爾线程從一開始就選擇了一條更艱難、但也可能更具長遠價值的道路——打造「全功能GPU」。這意味著其晶片不僅能執行AI訓練與推論任務,還要兼顧圖形渲染、科學計算與超高清影片編解碼等多種功能。

明星團隊與雄厚資金:為何市場對它另眼相看?

摩爾线程之所以能在短時間內崛起,其核心團隊的背景是關鍵因素。創辦人張建中曾是輝達全球副總裁暨大中華區總經理,在輝達任職長達15年,親手將中國市場打造成輝達全球最重要的營收來源之一。其餘核心成員也多具備輝達、AMD等國際大廠的深厚履歷。這支「輝達系」的創業團隊,不僅意味著他們對GPU的技術架構與產業生態有著深刻的理解,更帶來了寶貴的產業人脈與執行經驗。

這也解釋了為何摩爾线程能吸引到騰訊、中國移動等產業巨頭以及上海國盛、紅杉資本等頂級投資機構的青睞。雄厚的資金支持,讓公司能在成立初期就承受高昂的研發投入與晶片試產費用,快速推進產品迭代。

不只做AI加速:解讀「全功能GPU」的戰略意圖

選擇全功能GPU路線,是一項極具野心的戰略抉擇。它反映出摩爾线程不僅想在AI伺服器市場分一杯羹,更試圖複製輝達的成功路徑——以一個統一的架構,滲透到資料中心、個人電腦、邊緣運算等多個應用情境。

對比台灣的產業生態,這條路徑的獨特性就更加明顯。例如,聯發科(MediaTek)在手機SoC領域是世界級的領導者,其晶片整合了CPU、GPU及AI處理單元(NPU),但在資料中心等級的高性能通用GPU領域則著力不深。摩爾线程的目標,正是要填補中國在高性能通用GPU領域的空白,直接對標輝達的GeForce與Data Center產品線。這種策略的好處在於,單一晶片架構能服務更多元化的市場需求,從而擴大生態系統的基礎,避免在單一AI加速市場與眾多競爭者進行慘烈的同質化競爭。長期來看,一個健康且多元的生態系統,才是對抗CUDA霸權的根本。

致勝三部曲:架構、生態與叢集

面對輝達這座看似無法撼動的大山,摩爾线程深知單點的性能突破毫無意義,必須從系統層面發起挑戰。其核心戰略可歸納為三大支柱:打造兼容主流生態系統的MUSA統一架構、建構從千卡到萬卡互聯的「夸娥」叢集方案,並積極融入中國本土的軟硬體生態系統。

MUSA架構:兼容CUDA生態系統的務實捷徑

輝達的成功,一半來自其強大的GPU硬體,另一半則來自其經營了近二十年的CUDA軟體生態系統。CUDA擁有龐大的開發者社群與成熟的程式庫,絕大多數AI框架與應用程式都基於CUDA開發,這形成了強大的使用者黏性與轉換壁壘。任何挑戰者都必須回答一個問題:如何讓開發者願意為你的平台重新開發應用?

摩爾线程的答案是「MUSA(Moore Threads Unified System Architecture)」。這是一個軟硬體融合的統一系統架構,其最聰明的設計在於,它在語法層面兼容CUDA C++的核心語意和Triton語言。這意味著開發者可以將現有的CUDA程式碼以相對較低的工作量,平順地遷移到摩爾线程的平台上。根據其官方資料,MUSA能將跨平台程式碼的移植工作量減少90%以上。

這種策略並非孤例。AMD的ROCm平台也採取了類似的HIP(Heterogeneous-computing Interface for Portability)工具,試圖讓CUDA程式碼能輕鬆轉換。這條路徑堪稱一條務實的捷徑,它繞開了從零開始建立一個全新生態系統的漫長過程,而是選擇站在巨人的肩膀上,先吸引存量用戶,再逐步培養自己的開發者社群。這是在軟體生態系統上後發制人的關鍵一步。

叢集互聯的野心:從千卡到萬卡的「夸娥」計畫

訓練當今的語言大型模型,單一或數張GPU卡的運算能力遠遠不夠,需要動輒數千甚至數萬張GPU卡協同工作。此時,晶片之間的通訊效率就成為了整個系統的性能瓶頸。輝達憑藉其高速的NVLink互聯技術與InfiniBand網路,在多節點叢集性能上建立了巨大優勢。

摩爾线程顯然也看到了這一點,並推出了名為「夸娥(KUAE)」的軟硬一體化系統級運算能力解決方案。這套方案不僅包括其S4000、S5000等智慧運算卡,更涵蓋了從基礎建設、叢集管理平台到大型模型平台的一體化交付能力。其核心目標是攻克千卡乃至萬卡規模GPU叢集的高效互聯難題,確保大規模訓練時的運算能力利用率(MFU)能維持在較高水準。

這就像建設一座城市,不僅要有高樓大廈(單卡性能),更要有順暢的高速公路與智慧交通調度系統(叢集互聯與管理)。摩爾线程宣稱其千卡規模的智慧運算叢集效率已能超越國外同代產品,這顯示出其不僅僅是一家晶片設計公司,更是一家系統級解決方案提供商。這種從晶片到叢集的完整堆疊能力,是其爭取大型智慧運算中心訂單的重要籌碼。

宏觀視角:中國AI晶片生態系統的合縱連橫

摩爾线程的崛起並非單打獨鬥,而是中國AI晶片產業奮力突圍的一個縮影。目前,中國本土的AI運算能力生態系統正逐漸形成兩大主要陣營。

兩大陣營成形:華為昇騰 vs. 「類CUDA」聯盟

第一大陣營是以華為昇騰(Ascend)為核心的垂直整合生態系統。華為從晶片(昇騰910系列)、基礎軟體(CANN)、AI框架(MindSpore)到應用開發,試圖打造一個完全自主可控的封閉體系。這條路徑類似於蘋果的策略,雖然初期生態系統建構困難,但一旦成功,其系統優化與使用者體驗將具有強大優勢。華為甚至開源了其統一匯流排(Unified Bus)協定,試圖建立自己的硬體互聯標準。

第二大陣營則是以海光資訊、摩爾线程、沐曦等為代表的「類CUDA」聯盟。這些公司的共同特點是,其硬體架構或軟體工具鏈在不同程度上選擇了兼容或靠攏CUDA生態系統,以降低市場推廣的阻力。例如,海光資訊開放了其CPU互聯總線協定(HSL),吸引了寒武紀、沐曦、摩爾线程等加入,意圖打造一個開放的硬體互聯生態系統,共同對抗輝達的NVLink。這種類似於PC時代「Wintel」聯盟或手機時代「Android」陣營的策略,透過開放與合作,共同做大市場蛋糕。

從硬體適配到模型共舞:晶片與大型模型的深度整合

中國AI晶片生態系統成熟的另一個標誌,是晶片廠商與大型模型公司的關係,已從單純的硬體適配,演進到共同設計與深度整合的階段。例如,中國開源大型模型公司「深度求索(DeepSeek)」在其新模型中,特別加入了對UE8M0 FP8這種新資料格式的支援,而這正是為了適配即將推出的下一代中國國產晶片。這意味著,模型架構的設計從一開始就考慮了國產晶片的硬體特性,以求達到最佳的訓練與推論效率。這種「軟硬體協同設計」的趨勢,正在加速催生一個國產運算能力與國產大型模型的生態閉環。

台灣與日本的鏡像思考:新賽局中的機會與挑戰

中國AI晶片產業的快速發展,對身處全球半導體供應鏈核心位置的台灣與日本,帶來了複雜的影響,既是機會,也是挑戰。

台灣產業鏈的角色:從代工夥伴到潛在競爭者

對台灣而言,這是一場充滿矛盾的賽局。一方面,無論是輝達、AMD,還是中國的AI晶片新創,在現階段都高度依賴台積電(TSMC)的先進製程進行晶圓代工。同時,以鴻海(Foxconn)、廣達(Quanta)、緯創(Wistron)為首的伺服器代工廠,更是所有AI晶片最終產品化的關鍵環節。中國AI晶片的崛起,短期內為台灣的代工與封測產業帶來了新的訂單來源。

但從長遠來看,競爭的陰影也逐漸浮現。當摩爾线程這樣的公司開始提供從晶片到伺服器叢集的整套解決方案時,它就與台灣的品牌伺服器或系統整合商產生了潛在的競爭關係。更重要的是,中國傾力發展的半導體設計能力,長期目標必然是挑戰台灣在全球IC設計領域的領先地位。台灣的IC設計公司,如聯發科或創意電子(GUC),必須思考如何在AI時代,找到自身獨特的價值定位,避免陷入與擁有龐大內需市場及國家資金支援的中國對手進行價格戰。

日本的啟示:在特定領域建立護城河

相較之下,日本的策略或許能提供一些啟示。日本在通用GPU設計領域並非強項,但它選擇在自己具備深厚基礎的領域建立護城河。例如,在半導體材料(如光阻劑、矽晶圓)與關鍵製造設備(如東京威力科創的蝕刻機)方面,日本企業仍佔據著全球難以替代的地位。此外,像Preferred Networks這樣的公司,則專注於開發針對特定應用的AI加速器,而非與輝達進行全面對抗。這顯示了一種務實的策略:與其在紅海市場正面廝殺,不如在供應鏈的關鍵節點或利基應用市場,建立起技術壁壘,成為不可或缺的合作夥伴。

結論:科技戰下的「芯」棋局,號角已響

摩爾线程的故事,是中國在科技封鎖下奮力突圍的生動寫照。它以「輝達系」的深厚經驗為基礎,選擇了「全功能GPU」的宏大敘事,並透過兼容CUDA的務實架構與打造完整堆疊叢集方案的執行力,迅速在市場上站穩腳跟。它的發展路徑,連同華為昇騰的垂直整合模式,共同勾勒出中國AI晶片生態系統的未來藍圖。

這場圍繞運算能力的全球競賽,前路依然漫長且充滿變數。技術的快速迭代、供應鏈的穩定性,以及地緣政治的持續干擾,都是所有參與者必須面對的嚴峻挑戰。然而,不可否認的是,中國發展自主AI運算能力的號角已經吹響。對於台灣和全球的投資者與產業觀察家而言,這不再是一個是否會發生的問題,而是何時以及如何發生的問題。在這場世紀棋局中,忽視任何一個像摩爾线程這樣全力奔跑的棋手,都可能錯失對未來格局的關鍵判斷。

相關文章

LINE社群討論

熱門文章

目錄