星期四, 18 12 月, 2025
AI人工智慧HBM太貴、算力不夠?「以存代算」如何引爆AI新革命,讓台廠成最大贏家

HBM太貴、算力不夠?「以存代算」如何引爆AI新革命,讓台廠成最大贏家

當我們讚嘆ChatGPT等大型語言模型(LLM)的對答如流、文采飛揚時,背後支撐這一切的運算基礎設施正悄然面臨一場巨大的危機。人工智慧(AI)應用的爆發式成長,特別是從模型訓練轉向商業化應用的「推論」階段,正讓全球的資料中心陷入「推不動、推得慢、推得貴」的三重困境。這場危機的核心,直指一個長期以來被視為AI算力心臟的關鍵零組件——高頻寬記憶體(HBM)。然而,當整個產業將希望寄託於更昂貴、更稀缺的HBM時,一種顛覆性的思維典範正從根本上挑戰現有架構,那就是「以存代算」。這場由記憶體階層發起的革命,不僅僅是技術路線的轉變,更預示著全球半導體供應鏈的權力洗牌,並為身處其中的台灣廠商,帶來了前所未有的挑戰與機會。

AI時代的「記憶體高牆」:為何昂貴的HBM也無力回天?

要理解這場變革的迫切性,我們必須先看懂AI推論的痛點。不同於一次性的模型訓練,推論需要即時、大規模地回應使用者需求,其算力消耗正快速超越訓練,成為AI商業化的最大成本中心。根據產業研究機構預估,到了2027年,中國市場用於推論的算力需求佔比將高達72.6%。然而,目前的AI基礎設施在應對這股浪潮時,顯得力不從心。

問題的根源在於傳統運算架構中的「記憶體牆」(Memory Wall)。處理器(GPU)的運算速度早已一日千里,但資料存取的速度卻遠遠跟不上,形成了巨大的效能瓶頸。HBM的出現,正是為了解決這個問題。它像是在GPU旁蓋了一座立體停車場,透過3D堆疊技術,將多個DRAM晶片垂直整合,大幅提升了資料傳輸頻寬。這使得HBM成為輝達(NVIDIA)等高階AI晶片的標準配備,彷彿是解決AI算力瓶頸的萬靈丹。

然而,HBM並非完美解方。首先是驚人的成本。在AI伺服器中,HBM的成本佔比可達20%至30%,僅次於核心的AI晶片。其次是寡佔的供應鏈與地緣政治風險。目前全球HBM市場由南韓的三星(Samsung)與SK海力士(SK Hynix)兩家巨頭壟斷,不僅產能有限,更受到美國出口管制政策的嚴格限制。這意味著,將所有希望押注在HBM上,無疑是將AI發展的命脈交到少數幾家海外企業手中,風險極高。

更關鍵的是,隨著AI模型處理的文本越來越長、對話越來越複雜,一個名為「鍵值快取」(KV Cache)的技術資料量急遽膨脹。簡單來說,KV Cache就像是AI在與你對話時的「短期記憶」,它儲存了先前對話的關鍵資訊,避免每次生成新回應時都得從頭計算。這個機制雖能提升效率,卻也大量吞噬了本就寶貴的HBM與DRAM空間,很快便會觸及容量極限。當HBM這條路越走越窄、越走越貴時,產業界不得不開始思考:有沒有另一條路可走?

另闢蹊徑的革命:「以存代算」如何打破算力枷鎖?

「以存代算」(Using Storage for Computation)正是這個問題的答案。這個概念的核心思想極具顛覆性:與其不計代價地擴充昂貴的高速記憶體,不如聰明地利用成本低廉、容量巨大的儲存裝置,來換取計算效率。

我們可以將AI伺服器的記憶體系統比喻成一位大廚的工作檯。HBM就像是緊鄰爐火(GPU)的一塊小巧但極速的砧板,隨時處理最急迫的食材;DRAM則是旁邊稍大一些的備料區;而固態硬碟(SSD)則是後方巨大的步入式儲藏室。傳統作法是拼命加大那塊昂貴的砧板,但空間始終有限。「以存代算」則像一套智慧化的廚房管理系統,它會將對話的「短期記憶」(KV Cache)根據其活躍程度,在砧板、備料區和儲藏室之間進行智慧調度。

當一輪對話暫時結束,系統會將相關的KV Cache從昂貴的HBM或DRAM中「卸載」到大容量的SSD裡儲存起來。當下一輪對話開始時,再從SSD中迅速「預載」回來,GPU只需計算新增的內容即可,無需重複處理整個對話歷史。這種「以儲存換計算」的模式,帶來了驚人的效益。相關技術研究顯示,採用這種架構後,AI生成第一個字的回應延遲(TTFT)最高可縮短87%,整體處理吞吐量提升近8倍,最終將端到端的推論成本降低了70%。

這意味著,SSD不再只是被動儲存資料的倉庫,而是搖身一變,成為AI運算流程中主動參與、不可或缺的一環。它從根本上緩解了對HBM的過度依賴,透過一個由HBM(高速快取)、DRAM(中介緩衝)、SSD(長期記憶池)組成的智慧分層儲存體系,在成本、效能與容量之間找到了新的平衡點。這場由華為等廠商率先倡導的架構革命,正快速成為全球資料中心的技術共識,也正式引爆了一場針對AI硬體的全新軍備競賽。

硬體軍備競賽開打:AI SSD的崛起與技術變革

在「以存代算」的新典範下,對SSD的要求發生了質變。它不再是傳統意義上的儲存裝置,而是一種新型態的「AI SSD」,必須滿足三大核心要求:海量容量、超高吞吐量與極低延遲。這股需求正反向驅動SSD產業鏈進行一場深刻的技術變革。根據市場研究機構TrendForce的預測,AI伺服器有望推動SSD需求年成長率平均超過60%,AI SSD在整體NAND Flash市場的佔比,將從2024年的5%躍升至2025年的9%。

顆粒之爭:為何QLC成為AI時代的甜蜜點?

SSD的核心是NAND Flash快閃記憶體顆粒。過去,為了追求極致效能,企業級SSD多採用TLC(三層單元)顆粒。然而,AI應用,特別是資料庫檢索與KV Cache儲存,對容量的需求遠大於對極限寫入壽命的要求。此時,QLC(四層單元)顆粒憑藉其在同等晶片面積下提供更高儲存密度的優勢,成為了兼顧成本與容量的「甜蜜點」。儘管QLC的早期產品在效能和壽命上有所妥協,但隨著技術演進,如今的QLC SSD讀寫速度已遠超多年前的TLC產品,足以滿足AI推論中大量的讀取需求。日本鎧俠(Kioxia)的執行長便公開表示,QLC SSD是AI產業的最佳選擇。

速度的極限:從PCIe 5.0到CXL的未來藍圖

資料傳輸的通道,是決定SSD效能的另一關鍵。目前,PCIe 5.0介面已成為高階AI SSD的主流,其頻寬是上一代PCIe 4.0的兩倍。然而,產業的目光已投向更遠的未來。除了持續演進的PCIe 6.0/7.0標準,真正可能帶來遊戲規則改變的是CXL(Compute Express Link)互連技術。CXL允許CPU、GPU與記憶體、儲存裝置之間實現更高效、低延遲的資源共享與池化。在「以存代算」的場景下,CXL能讓GPU像存取本地HBM一樣,更直接、更快速地存取DRAM和SSD中的資料,徹底打破不同裝置間的記憶體壁壘,實現真正的存算一體化。

大腦的進化:SSD主控晶片的關鍵角色

如果說NAND顆粒是SSD的肌肉,那主控晶片就是其運作的大腦。在AI時代,主控晶片的角色變得空前重要。它不僅要負責傳統的資料讀寫、錯誤校正和耗損平均演算法,更要能智慧地管理AI工作負載下的資料流動,例如優化KV Cache的存取路徑、執行AI檢索任務等。一顆強大的主控晶片,能顯著提升SSD在AI應用中的實際效能,並延長其使用壽命。這也使得主控晶片設計成為了AI SSD價值鏈中技術壁壘最高、附加價值也最豐厚的環節之一。

全球玩家佈局:美、日、台、中如何在這場新賽局中卡位?

這場由「以存代算」引發的硬體革命,正吸引全球半導體巨頭紛紛投入戰局。美、日、台、中各方勢力憑藉其在產業鏈中的不同優勢,展開了一場激烈的卡位戰。

美國作為AI技術的發源地,擁有最完整的產業生態。美光(Micron)和隸屬於SK海力士的Solidigm,正積極推動高容量QLC SSD的應用,並率先發布了支援PCIe 6.0介面的產品。他們不僅提供硬體,更深入AI應用場景,推出如液冷散熱等整合方案,試圖定義下一代AI資料中心的儲存標準。

日本的鎧俠(Kioxia),作為NAND Flash技術的重要發明者,則採取了效能與容量雙軌並行的策略。一方面推出專為AI系統設計的高效能CM9系列SSD,另一方面則強攻超大容量的LC9系列,並計畫推出能讓SSD自主處理AI檢索任務的智慧軟體,展現其從硬體製造商向解決方案提供商轉型的野心。

而對於台灣的產業鏈來說,這場變革帶來了絕佳的切入點。台灣雖然沒有像三星或鎧俠那樣的NAND Flash原廠巨頭,卻在SSD的「大腦」——主控晶片領域,佔據著世界級的領導地位。慧榮科技(Silicon Motion)群聯電子(Phison)是全球獨立SSD主控晶片市場的兩大霸主。他們的晶片被廣泛應用於全球各大SSD品牌,是驅動整個產業創新的核心引擎。隨著AI SSD對主控演算法與運算能力的要求越來越高,慧榮與群聯的技術實力與市場地位將更形重要。他們能否率先推出支援PCIe 5.0/6.0及CXL技術、並針對AI工作負載深度優化的主控晶片,將是決定台灣能否在這波浪潮中佔據高價值環節的關鍵。此外,以威剛(ADATA)為代表的記憶體模組廠,以及為這些高階主控晶片提供先進製程代工的台積電(TSMC),共同構成了台灣在此賽局中不可或缺的堅實產業生態。

中國大陸廠商則是這波「以存代算」趨勢的重要推動者與實踐者。華為憑藉其UCM(統一記憶體管理)架構,在軟體定義儲存層面提供了完整的解決方案。浪潮、焱融等伺服器與儲存系統商也快速跟進,推出了針對AI推論加速的特化儲存產品。而在主控晶片領域,聯芸科技等本土設計公司也正積極追趕,試圖在國產化替代的浪潮中分一杯羹。

投資者的羅盤:展望「以存代算」背後的產業鏈機會

「以存代算」不僅僅是一個技術名詞,它代表著AI基礎設施從「以運算為中心」向「以資料為中心」的根本性轉移。對投資者而言,理解這一轉變,是掌握下一波半導體成長機會的鑰匙。這意味著我們的目光需要從過去高度集中的GPU,擴散到整個記憶體與儲存產業鏈。

首先,這股趨勢將帶來SSD需求的結構性升級。市場需要的不再是更多的SSD,而是價值更高、容量更大、速度更快、也更智慧的AI SSD。這將直接利好擁有技術與規模優勢的NAND Flash製造商,如三星、SK海力士、鎧俠等。

其次,對於台灣的投資者而言,最大的亮點無疑在於主控晶片設計領域。慧榮與群聯處於產業鏈的制高點,他們的技術演進直接定義了AI SSD的能力邊界。隨著AI應用的深化,主控晶片的設計複雜度與價值量將持續提升,使其成為整個產業鏈中最具成長潛力的環節之一。

最後,這場革命也將惠及整個周邊生態系,包括高效能SSD模組廠、提供關鍵IP授權的廠商,以及支援先進封裝測試的供應商。AI推論的龐大需求,正將一個原本被視為配角的儲存產業,推向了舞台中央。這場從HBM的局限中誕生的記憶體革命,正為全球半導體產業開啟一個全新的篇章。對於能洞察先機、精準佈局的投資者來說,這無疑是一個充滿潛力的黃金時代。

相關文章

LINE社群討論

熱門文章

目錄