跨市博弈丨AI資本開支神話正接近Quicksort時刻

今日8:00

金融市場最擅長的事情，不是理解科技，而是把科技畫成一條直線。

今天的人工智能投資敍事，基本上是一場集體度尺運動。分析師拿着GPU出貨量、雲端資本開支、數據中心耗電量和半導體訂單，把它們排成一條漂亮的上升曲線，然後宣布未來已經被算出來了。如果一千億美元能買到一個推理能力，那麼一萬億美元自然能買到十倍推理能力。若回報還未出現，解方也很簡單：再買更多晶片、再蓋更多機房、再向電網提出更不禮貌的要求。

這是一種很舒適的信仰。它把人工智能的未來降格成採購部門的問題。資本愈多，算力愈多；算力愈多，智能愈多；智能愈多，估值愈高。華爾街喜歡這類故事，因為它有表格、有敏感度分析、有供應鏈瓶頸，最重要的是，它有可以融資的資產。唯一的小問題是，科技史通常不按投資銀行的Excel工作表演進。

真正危險的時刻，往往不是市場低估新技術，而是市場太快把某一代技術的限制誤認為永恒規律。今天AI的主流假設是：硬體規模就是主要槓桿。這並非物理定律，更像是架構尚未成熟時的臨時補丁。當模型愈來愈大、上下文愈來愈長、推理愈來愈貴，市場選擇了最本能的反應：堆更多GPU。這與其說是工程，不如說是用鈔票堵漏水。

問題在於，堵漏水可以很快，也可以很壯觀，但它不是水利工程。

現代大型語言模型的核心麻煩，在於許多transformer架構仍然背負着近似平方級複雜度的原罪。輸入長度翻倍，計算和記憶體需求不是翻倍，而是接近4倍。這個數學關係聽起來像課本細節，實際上卻是資本市場最不願面對的利潤表炸彈。若上下文長度擴大十倍，資源壓力可能不是十倍，而是百倍量級。若市場希望AI從回答郵件進化到處理長合約、長影片、複雜工作流、工業控制和多步推理，那麼今日架構的成本曲線很快會變成一堵牆。

平方級複雜度最大的殘酷之處，是它在早期看起來無害。小數據、小上下文、小任務時，一切都可用硬體掩蓋。投資者會誤以為瓶頸只是供給不足，像石油、銅礦或高端封裝產能一樣，只要價格夠高，產能總會出來。可是算法的指數性懲罰不同於普通商品短缺。它不是「多花一點錢」的問題，而是「你正在用錯誤的增長函數描述世界」。

電力公司可能很高興，但債券市場未必。

科技史上，真正的飛躍很少來自更粗壯的蠻力，而是來自改變指數。早期計算機排序問題曾被平方級複雜度算法拖累。當數據量變大，問題不是機器不夠快，而是方法本身太笨。Quicksort與其他算法的意義，並不只是讓排序快一點，而是重新定義了數據量與時間之間的關係。它不是把馬車換成更大的馬車，而是鋪了鐵軌。

線性規劃也經歷過類似時刻。更好的simplex實踐與interior-point方法，將許多優化問題的可計算性向前推了一整個時代。現代物流、金融定價、供應鏈、航空排程和高頻交易，都建立在這些看似枯燥的算法改進之上。市場通常在事後才發現，最值錢的不是更多鐵，而是更好的數學。

AI正在等待自己的Quicksort時刻。這不是浪漫比喻，而是資本回報率的生死線。若token的邊際成本大幅下滑，需求會爆炸；但資產負債表不會跟着自動變輕。今天那些為當前架構建造的數據中心、電力協議、晶片庫存和融資結構，可能在未來五年內發現自己押注的是一種過渡技術。科技公司的折舊年限總是比科技周期更樂觀，這是會計準則對人類希望的慷慨補貼。

第一個即將被攻擊的瓶頸，是記憶與注意力。長上下文是AI從玩具走向工具的關鍵，但也是transformer最昂貴的奢侈品。若模型要讀完整本技術手冊、處理數小時影片、理解企業多年知識庫，傳統注意力機制會把成本曲線拉成一張恐怖片海報。這正是hybrid linear diffusion transformers、平方級架構與各類線性注意力方法試圖解決的問題。Nvidia在即時影片世界模型中採用相關思路，並不是偶然；影片是最誠實的測謊儀，因為它會立刻揭穿「上下文很便宜」這種幻覺。

這裏的投資含義相當不友善。若長上下文推理可以從平方級成本降到線性或近線性成本，許多「算力永遠短缺」的模型就需要重寫。短缺仍然存在，但短缺的構成會變。市場最容易賺的錢，往往來自賣鏟子；最容易賠的錢，則來自忘記金礦可能改用細菌浸出而不再需要你的鏟子。

第二個轉折，是從語言模型走向世界模型。當前大型模型的訓練方式，本質上仍帶有強烈的生成式浪費：預測下一個詞、下一個像素、下一個可觀測符號。這很有效，也很昂貴，像逼一個學生抄完整部電話簿，以證明他理解城市運作。Yann LeCun推動的JEPA思路，重點不是生成每個細節，而是學習抽象表徵與物理動態。這意味着AI的未來未必是更會聊天的聊天機器，而是能在製造、機器人、航空、能源和複雜環境中建立內部模型的系統。

這對資本市場同樣尷尬。因為語言模型的商業化敘事非常容易賣：更多用戶、更多token、更多訂閱收入。但世界模型的價值可能更深，也更難被季度報表即時捕捉。它們不像聊天框那麼討喜，卻可能控制真正昂貴的世界：工廠、倉庫、飛機、機器人和國防系統。若下一代AI的主戰場從「會說話」轉向「會理解因果與物理」，那麼今日圍繞文字 token建立的成本與收入模型，只是第一幕的布景。

第三個轉折，是智能不應該永遠被凍結。今天的大多數模型像受過昂貴教育但失去短期記憶的顧問。它們在預訓練中吞下互聯網，部署後卻很難真正從每次互動中累積經驗。若要更新知識，往往需要微調、重訓、RAG(Retrieval-Augmented Generation)或一系列工程補丁。這就是continuous learning與持久記憶系統的意義。一些新科創公司關注的不是再訓練一個更大的大腦，而是讓代理在運行時整理、重構和延續自己的記憶。

這聽起來像產品功能，實際上是經濟模型的變化。若每次互動都能改善系統，智能就不再只是一次性資本開支的產物，而變成可複利的運營資產。今天的模型部署有點像僱用一名高薪員工，但每晚都把他的工作記憶清空。這當然能刺激雲端用量，也能刺激投資者想像力；只是對客戶而言，這未免太像一種高科技失憶症收費模式。

第四個轉折，是代理技能的編譯。當前許多AI agent每次執行任務時，仍像第一天上班的實習生：重新探索工具、重新嘗試流程、重新犯一些昂貴而富有創意的錯誤。企業真正需要的不是每次都「智能地improvisation」，而是可檢查、可重複、可治理的流程。若成功的工具調用、決策路徑和工作流可以被記錄、抽象並編譯成可復用模式，那麼 agent的經濟性會發生質變。

這是軟體史上反覆出現的路徑。早期自動化總是手工藝，後來變成流程，再後來變成平台。企業不喜歡魔法，企業喜歡審計、權限、版本控制和責任歸屬。魔法適合demo，流程才適合採購。

第五個轉折，是把推理與資料分離。今天處理企業專有知識的常見方式是RAG，像在模型旁邊綁一個外接資料袋。它有用，但笨重；可控，但增加延遲；務實，但不優雅。Memory Decoder類研究提出的方向，是讓模型透過可插拔記憶模組吸收新知識，而不必改寫核心參數。這避開了微調帶來的災難性遺忘，也避免每次查資料都像讓一位博士戴著頭燈鑽進檔案室。

如果這類方法成熟，企業AI的部署邏輯會被改寫。現在的問題是：要不要重訓？要不要微調？要不要建RAG？未來的問題可能變成：哪個記憶模組、哪個知識邊界、哪種治理機制。模型本身變成推理引擎，資料成為可替換、可審計、可授權的記憶層。這對雲端收入未必是壞事，但對「每個企業問題都需要更多token燃燒」的直線外推，絕對不是好消息。

因此，真正的問題不是GPU需求會不會消失。它不會。認為算法效率提升就等於硬體需求崩潰，是另一種幼稚的線性思維。歷史上，計算效率上升通常會釋放更多需求，而不是消滅需求。晶片仍然重要，數據中心仍然重要，電力仍然重要。但資源組合會變。未來五年的數據中心採購清單，未必會像今天這樣把所有希望都押在同一類加速器、同一種記憶體瓶頸、同一套transformer經濟學上。

這正是投資者應該害怕的地方。不是AI不重要，而是AI太重要，以至於它不可能永遠停留在當前笨重昂貴的形態。市場正在把「現階段的架構限制」資本化為長期資產價值。這是一種常見錯誤。鐵路泡沫時期，投資者知道鐵路會改變世界，這一點完全正確；他們錯在以為每一條鐵軌、每一家鐵路公司、每一張債券都會因此變得值錢。互聯網泡沫時期，投資者知道網絡會吞噬經濟，也完全正確；他們錯在買下太多只會吞噬現金的公司。

今天的AI資本開支循環也有類似氣味。龐大的GPU集群、預付產能、長約電力、土地、冷卻、水資源、網絡設備與融資安排，正在被包裝成不可避免的未來基礎設施。部分確實如此。另一部分則可能只是昨日架構的紀念碑。當市場把短缺本身視為商業模式時，就已經接近危險區。短缺能創造利潤，但短缺也會召喚替代方案。價格訊號愈強，聰明人愈有動力繞過它。

這是資本主義最刻薄也最有效率的地方：高毛利會吸引競爭，高成本會吸引發明。GPU租金愈高，愈多研究者會尋找少用GPU的路徑。上下文愈貴，愈多人會攻擊注意力機制。推理延遲愈糟，愈多人會重構記憶層。當硬體瓶頸成為產業共識時，它同時也變成全世界工程師的靶子。華爾街稱之為護城河；計算機科學家稱之為待優化函數。

更麻煩的是，金融系統擅長把好波動變成壞波動。AI研究的非線性進步本來是好事。一次架構突破、一種新記憶方法、一個更便宜的推理路徑，都可能讓應用更普及、讓客戶成本下降、讓生產率上升。這是創新波動。但當市場用槓桿、債務、長期供應承諾和過度樂觀的終值假設去追逐一條線性曲線時，同樣的技術進步就可能變成金融壓力。好消息會讓某些資產突然變壞。

這種反諷在AI周期中尤其尖銳。若token成本下降10倍，社會可能受益巨大，應用需求可能暴增，整個產業的可用市場可能擴大。但對某些依賴高推理成本、高硬體稀缺性和高資本門檻支撐估值的公司而言，這未必是利多。投資者經常忘記，技術進步與既有資產價格之間沒有道德義務。創新不會因為你剛簽了十年租約而放慢腳步。

最終，AI的勝利者未必是買最多硬體的人，而是最早理解數學正在改變的人。硬體是必要條件，但不是充分條件。資本開支可以購買時間，不能購買架構命運。當前的巨型模型和資料中心建設，可能是通往下一代智能的橋樑；但橋樑不是目的地，除非你是收過路費的。

對投資者而言，問題不應是「AI還會不會需要更多算力」。答案顯然是會。真正的問題是：哪一種算力、在哪一層堆疊中、以什麼成本曲線、服務哪一種架構、產生哪一種可持續利潤。若答案只是「更多GPU」，那不是投資論點，而是採購清單。市場給採購清單的估值，通常在周期頂部最慷慨。

Scaling laws不是故事的終章。它們只是序章，也是警告。當一個產業的資源需求呈現近似指數式膨脹時，它要麼找到新的算法，要麼被自己的成本吞噬。AI不會停下來，但它也不會永遠以今天這種方式前進。資源指數時代的尾聲，不代表智能革命結束；恰恰相反，它意味着真正有趣、也真正殘酷的部分即將開始。

下一階段的AI不會獎勵那些把尺子畫得最長的人。它會獎勵那些願意折斷間尺的人。

徐立言(本欄每逢周一刊出）

https://www.facebook.com/hsulylab