星期四, 18 12 月, 2025
AI人工智慧美股:別讓 AI 的內建偏見毀了你的投資組合:用「移動靶心」分析法找出下個 NVIDIA(NVDA)...

美股:別讓 AI 的內建偏見毀了你的投資組合:用「移動靶心」分析法找出下個 NVIDIA(NVDA)

大型語言模型(LLM)的崛起,正以前所未有的速度弭平傳統量化投資與主觀決策投資之間的界線。過去,華爾街的量化交易員(Quants)埋首於資料模型,試圖從龐雜的數字中挖掘微弱的獲利訊號;而另一端,基本面分析師則透過閱讀財報、訪談經營團隊,憑藉經驗與直覺做出判斷。如今,這兩種看似平行的方法論,正因AI而交會。量化基金開始利用LLM自動解析企業財報與法說會逐字稿,量化管理層對利潤率的指引變化、資本配置的趨勢,甚至是市場對特定主題(如AI支出或成本控制)的情緒。與此同時,主觀決策的經理人也開始運用LLM,快速整合多家公司的資訊,形成宏觀敘事,並將管理層的語氣、信心強度、或對電動車需求等主題的風險曝險等質化因素,轉化為可比較的資料。然而,當金融機構爭相將這項強大的新工具整合進核心業務時,一個根本性的問題卻鮮少被深入探討:我們真的了解這些AI模型是如何「思考」的嗎?它們是否像人類分析師一樣,存在著不為人知的內在偏見?更重要的是,這些偏見將如何影響我們的投資決策,帶來隱藏的風險,或是潛在的超額報酬(Alpha)?

AI的「內建偏見」:當你的投資顧問有自己的秘密立場

傳統的自然語言處理(NLP)模型,更像是一具精密的計算機,你輸入指令,它輸出結果,本身不帶有觀點。但大型語言模型完全不同,它們在涵蓋整個網際網路的浩瀚資料中進行訓練,這個過程使其不僅學會了語言,更吸收了資料中蘊含的各種觀點、偏見甚至是刻板印象。這意味著,當我們向AI詢問一支股票的看法時,得到的可能不僅僅是客觀分析,還摻雜了它從訓練資料中繼承而來的「隱性觀點」。

對於高度重視風險控管的金融機構而言,這是一個嚴峻的挑戰。如果公司採用的AI模型,其內建的投資哲學與公司的官方觀點不符,後果可能不堪設想。這就好比你聘請了一位價值投資派的基金經理,他卻私下狂熱地追逐高風險的成長股。為了揭示這層神秘面紗,近期有學者設計了一套巧妙的實驗,旨在探究不同主流LLM在投資決策上是否存在系統性的偏好。

實驗揭曉:不同AI模型竟有不同投資「個性」

這項研究的方法論核心在於建立「知識衝突」。研究人員選取了美國S&P 500指數中的427家公司作為目標,並針對每一家公司,先利用一個強大的AI模型(Gemini 1.5 Pro)自動生成一份詳盡的「正面證據」(看漲理由)和一份「負面證據」(看跌理由)。

接著,實驗進入關鍵步驟。他們將這兩份觀點完全相反的證據同時提供給六個當前市場上主流的LLM,包括OpenAI的GPT-4o、Google的Gemini 1.5 Pro、Meta的Llama 3、法國新創公司的Mistral、以及來自中國的Qwen(通義千問)和Deepseek(深度求索)。在資訊對等且相互矛盾的情況下,AI被要求做出最終的投資判斷:買入(Buy)、賣出(Sell)或持有(Hold)。這個設計的精妙之處在於,當外部資訊無法提供明確方向時,模型為了做出決策,就不得不依賴其「內心」的隱性偏見。

實驗結果令人震驚:不同的LLM展現出了截然不同的投資「個性」。

  • 整體傾向:Llama 3和Deepseek表現出強烈的「多頭」傾向,在多數情況下都建議買入。Gemini、Qwen和Mistral則屬於溫和的樂觀派。相比之下,GPT-4o則顯得最為中立和謹慎,其買入和賣出的建議比例最為均衡。
  • 從科技股狂熱到價值投資:AI的產業、規模與動能偏好

    這種差異不僅體現在整體的多空傾向上,更深入到具體的投資風格偏好中。

    1. 產業偏好:幾乎所有模型都對「科技業」情有獨鍾,這或許反映了其訓練資料中充斥著過去十年科技股的輝煌敘事。此外,「能源」和「醫療保健」也是多數模型的共同偏好。然而,細看之下仍有差異,例如Llama 3對「房地產」的偏愛程度高於其他模型,而GPT-4o和Qwen則對「通訊服務」有著更高的興趣。

    2. 公司規模偏好:在對待大型股與中型股的態度上,AI們出現了顯著分歧。Qwen、Mistral和GPT-4o明顯偏愛市值排名前25%的超大型企業(Q1),對於接下來25%的公司(Q2)興趣大減。這種類似於台灣投資人追捧「權值股」的行為,反映了一種對龍頭企業的內在信任。相反,Llama 3、Deepseek和Gemini則對這兩類規模的公司沒有表現出明顯的偏好差異。

    3. 動能 vs. 逆勢偏好:這一項的結果最出乎意料。在傳統投資學中,動能投資(追漲)和逆勢投資(抄底)是兩大主流策略。實驗發現,除了Gemini表現得較為中立外,其他所有模型都表現出強烈的「逆勢交易」傾向。它們更傾向於推薦那些近期表現不佳的股票,而非追逐市場上的熱門股。其中,Qwen的逆勢傾向尤為極端。這與許多人想像中AI會盲目跟隨趨勢的印象大相徑庭,也對那些希望利用AI進行動能交易的用戶提出了警示。

    「頑固」還是「靈活」?AI面對反證時的反應

    研究的最後一步,是測試這些模型的「固執程度」。當一個模型基於其內在偏見做出了初步判斷後,研究人員會提供更多與其判斷相反的證據,觀察它是否會修正自己的看法。

    結果再次顯示了模型間的性格差異。Llama 3、Mistral和Deepseek顯得相當「頑固」,即使面對大量不利證據,它們也堅持己見,修正率很低。這代表它們的內在偏見非常根深蒂固。另一方面,Gemini、GPT-4o和Qwen則表現得更為「從善如流」,願意根據新的資訊調整自己的觀點。

    這項發現對金融機構的意義非凡。在台灣或日本,投資文化普遍相對保守,金融機構在引進新技術時,首要考量的是可控性與穩定性。一個「頑固」的AI模型,其行為模式或許更容易預測,但也可能錯過市場變化;而一個「靈活」的模型,雖然能適應新資訊,卻也可能更容易受到短期市場雜訊的干擾。因此,在選擇或開發LLM應用時,絕不能只看其效能指標,更需要像對待人類基金經理一樣,對其進行深度的「盡職調查」,了解其潛在的風格偏見與決策模式。

    超越財報數字:用AI追蹤企業敘事的「移動靶心」

    如果說理解AI的內在偏見是為了「防禦」,避免其誤導我們的決策,那麼LLM的另一項強大能力,則為我們提供了全新的「進攻」武器——深入解讀企業語言背後的真實意圖,從中發掘能夠預測未來股價表現的領先指標。

    企業管理層在法說會或財報中,總會強調某些績效主題或概念來向投資人傳達進展,例如「提升市佔率」、「改善現金流」或「擴大獲利能力」。然而,這些被強調的重點並非一成不變。學者將這種現象稱為「移動靶心」(Moving Targets)。當管理層發現某個先前承諾的目標難以達成時,他們往往會悄悄地轉移焦點,開始強調另一個更容易實現的新目標。

    一項研究發現,當一家公司「移動靶心」的頻率下降,也就是說,管理層在很長一段時間內都圍繞著相同的幾個核心主題溝通時,往往預示著該公司未來的股價表現會更差。這背後的邏輯很直觀:如果一家公司持續穩定地實現其核心目標,它沒有必要頻繁更換敘事;反之,只有當核心業務遭遇瓶頸時,才需要不斷拋出新的故事來轉移市場的注意力。

    什麼是「移動靶心」?從NVIDIA到台積電的共同語言

    這個概念聽起來抽象,但其實在我們熟悉的企業身上屢見不鮮。

  • 美國的NVIDIA:幾年前,NVIDIA在法說會上溝通的重點是其在「遊戲顯卡」市場的領導地位與成長。但隨著AI革命的到來,其敘事重心迅速轉移到「資料中心」、「AI加速器」和「CUDA生態系」上。這個靶心的成功移動,伴隨的是股價的飛躍。
  • 台灣的台積電:作為晶圓代工的龍頭,台積電的核心敘事長期圍繞著「先進製程的領先」。然而近年來,隨著地緣政治風險加劇與客戶需求變化,我們能清晰地觀察到其敘事中加入了新的重要靶心,如「先進封裝(CoWoS)技術的突破」以及「全球製造基地的多元化」(例如美國、日本、德國設廠)。
  • 日本的豐田(Toyota):豐田的移動靶心則更為複雜。在電動車浪潮初期,其敘事堅守「油電混合動力(Hybrid)」的優越性。而後,隨著市場壓力變化,其溝通重點在「純電動車(BEV)」、「氫燃料電池車(FCEV)」和「固態電池技術」之間來回移動,反映了其在轉型路徑上的探索與猶豫。

舊方法的極限:為何傳統關鍵字分析會錯失良機

在LLM出現之前,分析師們也試圖用傳統的NLP技術(如命名實體辨識,NER)來捕捉這些敘事轉變。這種方法主要是通過計算特定關鍵字的出現頻率來實現。然而,這種粗糙的方式存在兩大致命缺陷:

1. 雜訊過多,語意不清:NER方法可能會抓取到大量無關緊要的詞彙,如「年份」、「百分比」或「單位」,卻無法理解其經濟意義。
2. 遺失上下文:它可能提取出「營收」這個詞,卻忽略了前面限定的「資料中心」這個關鍵上下文,從而無法區分「資料中心營收」和「遊戲業務營收」這兩個截然不同的靶心。

這就像試圖通過計算一篇文章中「愛」這個字出現的次數,來判斷這是一部愛情小說還是一篇宗教佈道一樣,顯然會錯失大量關鍵資訊。

語意分析的威力:新一代AI如何讀懂「弦外之音」

而基於LLM的新方法則帶來了革命性的突破。整個流程分為三步:

1. 智慧擷取:首先,利用LLM通讀整篇法說會逐字稿,要求它直接提取出管理層強調的、具有實質商業意義的績效「靶心」。由於LLM具備上下文理解能力,它能有效過濾雜訊,並完整保留如「擴大高毛利產品線市佔率」這樣的精確概念。
2. 語意相似度計算:接著,利用先進的文本編碼器(Text Encoders)將這些提取出的「靶心」轉化為高維度的數學向量。這一步的關鍵在於,語意相近的詞句,其對應的向量在空間中的距離也會很近。例如,「銷售增長」和「營收擴張」雖然字面不同,但在語意層面高度相關,它們的向量也會非常接近。
3. 建立指標:最後,通過比較連續兩季法說會中「靶心」向量的相似度,就可以建立出一個量化的「移動靶心」指標。如果本季的靶心能在上一季找到語意上高度相似的對應,說明敘事穩定;反之,如果大量靶心都找不到對應,則說明敘事發生了劇烈轉移。

實證結果:更穩定的敘事如何預測更高的股票回報

研究團隊利用這種新方法對S&P 100指數成分股自2010年至2024年的資料進行了回溯測試,結果非常顯著。無論是橫截面迴歸分析還是時間序列的投資組合測試,都得出了一致的結論:「移動靶心」指標得分較低(即敘事更穩定、更少轉移)的公司,其未來一個月的股票回報顯著更高。

這個由LLM驅動的「另類資料」訊號,在控制了傳統的市場風險因子(如規模、價值、動能等)後依然有效。這證明了LLM不僅僅是一個資訊整理工具,它確實在幫助我們從非結構化的文本中,提煉出了能夠預測市場表現的全新Alpha來源。

台灣投資者的啟示:如何駕馭這把雙面刃?

綜合來看,大型語言模型為投資分析帶來了巨大的潛力,但它同時也是一把鋒利的雙面刃。對於身處台灣的投資者和金融機構而言,與其被動地接受這股浪潮,不如主動思考如何駕馭它。

第一步:認識你的AI工具,別盲目信任。 正如第一部分的研究所示,沒有任何一個LLM是完全中立的。無論是自行開發還是採購第三方服務,都必須對其進行嚴格的偏見測試。了解它偏愛哪個產業、何種規模的公司、是順勢還是逆勢思維,這是將其納入投資流程的先決條件。這就像我們在選擇一位基金經理時,必須先了解他的投資哲學和歷史績效一樣。

第二步:將AI視為「超級分析師助理」,而非「決策者」。 目前來看,AI最大的價值在於其無與倫比的資訊處理能力。讓它去完成繁重的第一層工作:閱讀數百頁的財報、聽完幾十場法說會、從中提取關鍵的「移動靶心」、標記出異常的情緒波動。然而,最終的綜合判斷、策略制定和風險承擔,仍然需要經驗豐富的人類分析師來完成。人機協作,才是未來投資的致勝之道。

第三步:放眼日本與台灣企業,尋找「移動靶心」的蹤跡。 「移動靶心」分析框架不僅適用於美國企業,對於分析我們熟悉的亞洲公司同樣有效。投資者可以開始有意識地去追蹤,例如鴻海(Hon Hai)的敘事如何從「電子代工」轉向「電動車CDMS與半導體」,或是日本的索尼(Sony)如何從強調「消費電子硬體」轉向側重「遊戲、音樂、動漫等內容IP」。這些敘事的轉變,往往是企業戰略轉型的領先指標,其中蘊含著巨大的投資機會與風險。

總結而言,AI投資的時代已經來臨。它既帶來了模型偏見的隱藏陷阱,也帶來了透過解讀企業敘事發現新Alpha的巨大機會。成功的投資者,將是那些能夠深刻理解這項工具的優勢與侷限,並將其智慧地融入自身投資框架的人。未來,投資的勝負將不再僅僅是人與人之間的較量,更是人與機器協同能力的終極比拚。

相關文章

LINE社群討論

熱門文章

目錄