瑞穗證券(Mizuho)預估 Google TPU 出貨量將在 2028 年迎來爆發式成長,這份極具張力的數據,揭示了 AI 產業從「訓練」軍備競賽跨入「推理(Inference)經濟學」的典範轉移。本文深度拆解這一波以「降本、省電、降低總擁有成本(TCO)」為核心的算力革命,並梳理美、台、日三地半導體供應鏈。看博通如何穩坐高階主航道、聯發科如何以雙軌制模式奇襲 ASIC 市場、以及台積電與日本關鍵材料、設備大廠如何迎來集體價值重估。
過去兩年,全球科技界的資金與目光被輝達(Nvidia)通用型 GPU 牢牢吸引。投資人緊盯雲端超大規模資料中心(Hyperscaler)的資本支出,彷彿算力越大就是贏下 AI 聖戰的唯一解。然而,一場寂靜卻極具破壞力的典範轉移已在基礎設施底層爆發。
瑞穗證券(Mizuho)最新發布的調研報告指出:Google 自研的 AI 定制化晶片——TPU(Tensor Processing Unit)的出貨量即將迎來指數級爆發。預估到了 2028 年,單年 TPU 出貨量將飆升至驚人的 3,500 萬顆,與 2025 年的 240 萬顆、2026 年的 430 萬顆相比,呈現垂直壁立的增長斜率。
儘管市場上不乏對於「單一雲端巨頭能否在物理上吞下如此巨量晶片」的激辯,但這個驚人數據背後揭示了一個商業邏輯:AI 產業正全面從「訓練(Training)」軍備競賽,跨入「商業推理(Inference)」的深水區。算力不再只求大,如何「省錢、省電、降低總擁有成本(TCO)」,才是科技巨頭生死存亡的核心增量。
這場被市場稱為「TPU 海嘯」的需求擴張,不僅為晶片設計合作夥伴博通(Broadcom)提供了強大支撐,更從根本上改寫了市場的估值邏輯,將投資人的關注焦點從「單季 AI 半導體營收是否超預期」,系統性轉向「雲端廠自研 ASIC 出貨斜率是否被系統性低估」的深度重估。
一、 算力跨入黃金交叉:何謂「推理經濟學」
要理解 Google 為何全面擴大 TPU 產能,就必須看懂「推理經濟學(Inference Economics)」的興起。
1. 轉向單位代幣成本(Cost per Token)
在 2023 至 2025 年的 AI 蠻荒開拓期,科技大廠的核心任務是「把模型變聰明」,這需要丟入天文數字的資料,動用數萬顆輝達通用 GPU 進行動輒數月的不間斷訓練。此時,通用 GPU 憑藉極高的靈活性與強大的軟體生態(CUDA),成為無可替代的絕對霸主。
然而,隨著 Agentic AI(智慧代理人)時代全面落地,巨頭們驚覺:訓練負載的成長開始放緩,但全球用戶每天進行搜尋、寫程式、生成影音的「推理」工作負載正在呈幾何級數爆炸。 研調機構預計,推理負載將正式佔據整體計算需求的半壁江山。
2. TCO(總擁有成本)的殘酷帳本
在超大規模且工作負載相對穩定的推理場景中,輝達通用 GPU 的「全能」反而成了一種昂貴的浪費。通用 GPU 為了相容各種演算法,保留了大量在特定推理任務中根本用不到的電路模組,帶來了極高的硬體採購成本與功耗。
相較之下,自研 ASIC(如 Google TPU)是「量身打造」的制服。它剔除了不必要的冗餘架構,只保留最核心的運算單元。當工作負載大到一定邊際效應後,自研 ASIC 展現出極致的成本優勢,能有效降低單位代幣成本,並在耗電量與機房空間上,比通用 GPU 節省 30% 至 50% 以上。
只要雲端大客戶擁有足夠穩定的工作負載與實力強大的軟體優化團隊,定制化晶片就會不斷蠶食高利潤的增量推理市場,進而讓 ASIC 從原本的「GPU 替代方案」蛻變為基礎設施的「核心增量與成本槓桿」。
二、 博通穩坐高階主合約,商業模式再進化
在這條龐大的客製化晶片價值鏈中,美股巨頭博通(Broadcom)依然穩居產業的核心主錨。即便市場時常傳出雲端廠試圖自行設計的雜音,但技術壁壘證明:博通在超高階 ASIC 領域的霸主地位短期內難以動搖。
博通的護城河在於它不僅僅提供單一 ASIC 晶片設計服務,而是同時將客製化矽晶(Custom Silicon)、乙太網路解決方案(Ethernet Networking)、高速 SerDes 技術與機櫃級網路系統整合,形成「XPU + 網路 + 鎖定大客戶」的全面性收費模式。無論是與 Google 長期合作的 TPU 世代演進,還是協助 OpenAI 與 Meta 的大規模加速器部署,博通都憑藉強大的規模優勢與轉嫁 HBM 成本上漲的能力,成為雲端巨頭建置網路集群時無可取代的盟友。
然而,面對博通高昂的 Turnkey(代工全包)溢價與日益膨脹的 HBM 採購成本,雲端廠也開始引進第二供應商建立雙軌制(Dual-Sourcing),利用地緣政治與成本優勢實施反向議價。
三、 台灣二軌接棒:聯發科雙軌超車,台股 ASIC 價值量上移
而被 Google 選中的戰略夥伴,正是台灣的晶片設計龍頭——聯發科(MediaTek)。
1. 聯發科大咬「推理優化版」大單
Google 在其第八代(TPU v8)架構中做出了極具顛覆性的雙軌設計切割:
-
高效能訓練晶片(代號:Sunfish):繼續交由博通主導,追求極致算力,鎖定採用台積電的先進製程與 CPO(共同封裝光學)技術。
-
高併發推理晶片(代號:Zebrafish,及下一代 Humufish):破天荒交給了聯發科,負責負責設計主攻高併發推理的成本優化版晶片。
聯發科最初是參與前代 TPU 的 I/O 模組與周邊元件設計,其提供的設計方案比市場其他替代方案便宜了 20% 至 30%。透過讓博通負責訓練晶片、聯發科負責推論晶片的「雙軌並行」策略,Google 成功掌握了供應鏈間的平衡與議價優勢。
聯發科採用的合作模式被稱為「拆解式 ASIC 模式」。在這種模式下,Google 內部團隊自己設計核心的計算晶粒(Compute Die),而聯發科則憑藉其在消費電子與網通晶片中累積的頂尖整合能力,負責提供 I/O 晶粒(包含高速週邊介面、IP 整合服務)。
在 HBM 採購上,Google 跳過了中介商,直接向記憶體大廠議價,從而消除原本在博通 Turnkey 模式中被堆疊的 15% 至 20% 溢價利潤。而聯發科則專注在矽智財、先進封裝及 SerDes 領域斬獲更高附加價值的專案。市場預期聯發科將在後續的 TPU 與客製化晶片計畫中,從傳統的行動晶片供應商徹底改寫為雲端 AI 晶片價值鏈的重要一環,其客製化 AI 晶片業務有望在未來幾年顯著放大,成為推升公司估值的新成長曲線。
四、 跨國產業對標:美日台半導體新戰略地圖
在這場以 Google TPU 為首的自研晶片大潮中,價值的傳導絕不僅止於晶片設計本身,而是順著實體製造的脈絡,一路向外輻射。為了建立投資人的強烈認知連結,我們透過下表將「美、台、日」三地在這場商戰中的核心生態圈進行橫向對標:
| 產業鏈位置 | 美國(核心發動機/品牌) | 台灣(設計二軌與實體製造) | 日本(關鍵材料與利基設備) |
| 雲端主導者 |
Google (GOOGL) · 自研 TPU 生態始祖 · 掌握最大內部推理工作負載 |
中華電信 / 台灣大型雲端業者 · 扮演應用端導入與資料中心在地化角色 |
SoftBank (軟銀) · 積極建設本土 AI 超級電腦,尋求非輝達替代方案 |
| ASIC 主合約 / 旗艦設計 |
Broadcom (AVGO) · 掌控高階客製化晶片絕對領先市佔 · 強大高速 SerDes 與網路整合 IP |
世芯-KY (3661-TW) · 台灣純 ASIC 設計服務領頭羊,為北美大客戶客製化晶片實體化 |
Socionext (6526-JP) · 日本最頂尖的客製化晶片(ASIC)設計大廠,深度布局車用與資料中心 |
| ASIC 二軌 / 推理優化設計 |
Marvell (MRVL) · 提供雲端與網通客製化晶片 · 洽談開發記憶體處理單元 |
聯發科 (2454-TW) · 斬獲 Google TPU v8 推理版大單 · 轉型為雲端 AI 晶片價值鏈重要一環 |
(日本廠多偏向利基型 ASIC) |
| 晶圓代工與先進封裝 |
Intel (INTC) · 其先進封裝積極爭取聯發科下一代 Humufish 訂單 |
台積電 (2330-TW) · 全球 ASIC 與 GPU 的共同終極出海口,獨佔先進製程與 CoWoS 封裝產能 |
Rapidus · 日本傾全國之力打造的 2 奈米基地,未來期盼爭取客製化晶片代工 |
| 高階 IC 載板 / 基礎材料 | (主要依賴亞洲供應鏈) |
欣興 (3037-TW) / 創意 (3443-TW) · 提供大尺寸、高層數的 ABF 載板及先進封裝 IP |
Ibiden (斐斐得, 4062-JP) · 高階 ABF 載板全球龍頭,為 Broadcom 及 Google 晶片提供關鍵基板 |
| 晶片晶圓測試設備 |
Teradyne (泰瑞達) · 自動測試設備(ATE)主要勢力 |
京元電子 (2449-TW) · 承接大量客製化晶片封裝後測試(FT)訂單 |
Advantest (愛德萬測試, 6857-JP) · 全球 SoC 與高階 HBM 測試設備霸主,晶片結構越複雜,測試時間與利潤越高 |
五、 HBM 需求與硬體外溢:供應鏈跟著旺
此趨勢亦將對高頻寬記憶體(HBM)產業投下震撼彈。市場過往容易將 ASIC 與 GPU 對立,誤以為自研晶片的放量會削弱 HBM 的需求,但事實上自研晶片在朝向 HBM4 或 HBM4e 世代遷移的過程中,對高階記憶體的單位消耗量不減反增。
隨著 Google TPU、Meta MTIA、AWS Trainium 等項目全面導入 HBM 技術,HBM 的需求驅動力,將從單一的輝達鏈條擴散至多個客製化平台,美光、SK 海力士及三星等記憶體巨頭將能迎來更多元化的客戶結構與更有彈性的議價空間。
最終,這股由自研晶片帶動的升級浪潮將具體落實到伺服器整機櫃的物理交付上。雲端大客戶採購的是實質的資料中心容量,這意味著價值量將從晶片端一路擴散至台灣與日本的硬體生態圈:
-
台廠供應鏈:台積電的先進製程與 CoWoS 封裝產能、伺服器 ODM 廠的機櫃級裝配、高效能電源、液冷散熱技術以及高階 PCB 與 ABF 基板。
-
日廠設備與材料:諸如 Ibiden 的高階載板、Advantest 的 SoC 測試機台,皆會因為晶片複雜度與出貨量的攀升而迎來實質訂單。
儘管軟體壓縮技術的進步與編譯器效率的革新會持續對硬體強度進行反向校驗,但只要推理需求持續呈指數級爆發,從博通、聯發科到亞洲供應鏈環節的二階彈性標的,都將在這一波自研晶片的黃金五年中迎來重新定價的歷史契機。

