跨市博弈丨AI資本開支神話正接近Quicksort時刻
金融市場最擅長的事情,不是理解科技,而是把科技畫成一條直線。
今天的人工智能投資敍事,基本上是一場集體度尺運動。分析師拿着GPU出貨量、雲端資本開支、數據中心耗電量和半導體訂單,把它們排成一條漂亮的上升曲線,然後宣布未來已經被算出來了。如果一千億美元能買到一個推理能力,那麼一萬億美元自然能買到十倍推理能力。若回報還未出現,解方也很簡單:再買更多晶片、再蓋更多機房、再向電網提出更不禮貌的要求。
這是一種很舒適的信仰。它把人工智能的未來降格成採購部門的問題。資本愈多,算力愈多;算力愈多,智能愈多;智能愈多,估值愈高。華爾街喜歡這類故事,因為它有表格、有敏感度分析、有供應鏈瓶頸,最重要的是,它有可以融資的資產。唯一的小問題是,科技史通常不按投資銀行的Excel工作表演進。
真正危險的時刻,往往不是市場低估新技術,而是市場太快把某一代技術的限制誤認為永恒規律。今天AI的主流假設是:硬體規模就是主要槓桿。這並非物理定律,更像是架構尚未成熟時的臨時補丁。當模型愈來愈大、上下文愈來愈長、推理愈來愈貴,市場選擇了最本能的反應:堆更多GPU。這與其說是工程,不如說是用鈔票堵漏水。
問題在於,堵漏水可以很快,也可以很壯觀,但它不是水利工程。
現代大型語言模型的核心麻煩,在於許多transformer架構仍然背負着近似平方級複雜度的原罪。輸入長度翻倍,計算和記憶體需求不是翻倍,而是接近4倍。這個數學關係聽起來像課本細節,實際上卻是資本市場最不願面對的利潤表炸彈。若上下文長度擴大十倍,資源壓力可能不是十倍,而是百倍量級。若市場希望AI從回答郵件進化到處理長合約、長影片、複雜工作流、工業控制和多步推理,那麼今日架構的成本曲線很快會變成一堵牆。
平方級複雜度最大的殘酷之處,是它在早期看起來無害。小數據、小上下文、小任務時,一切都可用硬體掩蓋。投資者會誤以為瓶頸只是供給不足,像石油、銅礦或高端封裝產能一樣,只要價格夠高,產能總會出來。可是算法的指數性懲罰不同於普通商品短缺。它不是「多花一點錢」的問題,而是「你正在用錯誤的增長函數描述世界」。
電力公司可能很高興,但債券市場未必。
科技史上,真正的飛躍很少來自更粗壯的蠻力,而是來自改變指數。早期計算機排序問題曾被平方級複雜度算法拖累。當數據量變大,問題不是機器不夠快,而是方法本身太笨。Quicksort與其他算法的意義,並不只是讓排序快一點,而是重新定義了數據量與時間之間的關係。它不是把馬車換成更大的馬車,而是鋪了鐵軌。
線性規劃也經歷過類似時刻。更好的simplex實踐與interior-point方法,將許多優化問題的可計算性向前推了一整個時代。現代物流、金融定價、供應鏈、航空排程和高頻交易,都建立在這些看似枯燥的算法改進之上。市場通常在事後才發現,最值錢的不是更多鐵,而是更好的數學。
AI正在等待自己的Quicksort時刻。這不是浪漫比喻,而是資本回報率的生死線。若token的邊際成本大幅下滑,需求會爆炸;但資產負債表不會跟着自動變輕。今天那些為當前架構建造的數據中心、電力協議、晶片庫存和融資結構,可能在未來五年內發現自己押注的是一種過渡技術。科技公司的折舊年限總是比科技周期更樂觀,這是會計準則對人類希望的慷慨補貼。
第一個即將被攻擊的瓶頸,是記憶與注意力。長上下文是AI從玩具走向工具的關鍵,但也是transformer最昂貴的奢侈品。若模型要讀完整本技術手冊、處理數小時影片、理解企業多年知識庫,傳統注意力機制會把成本曲線拉成一張恐怖片海報。這正是hybrid linear diffusion transformers、平方級架構與各類線性注意力方法試圖解決的問題。Nvidia在即時影片世界模型中採用相關思路,並不是偶然;影片是最誠實的測謊儀,因為它會立刻揭穿「上下文很便宜」這種幻覺。
這裏的投資含義相當不友善。若長上下文推理可以從平方級成本降到線性或近線性成本,許多「算力永遠短缺」的模型就需要重寫。短缺仍然存在,但短缺的構成會變。市場最容易賺的錢,往往來自賣鏟子;最容易賠的錢,則來自忘記金礦可能改用細菌浸出而不再需要你的鏟子。
第二個轉折,是從語言模型走向世界模型。當前大型模型的訓練方式,本質上仍帶有強烈的生成式浪費:預測下一個詞、下一個像素、下一個可觀測符號。這很有效,也很昂貴,像逼一個學生抄完整部電話簿,以證明他理解城市運作。Yann LeCun推動的JEPA思路,重點不是生成每個細節,而是學習抽象表徵與物理動態。這意味着AI的未來未必是更會聊天的聊天機器,而是能在製造、機器人、航空、能源和複雜環境中建立內部模型的系統。
這對資本市場同樣尷尬。因為語言模型的商業化敘事非常容易賣:更多用戶、更多token、更多訂閱收入。但世界模型的價值可能更深,也更難被季度報表即時捕捉。它們不像聊天框那麼討喜,卻可能控制真正昂貴的世界:工廠、倉庫、飛機、機器人和國防系統。若下一代AI的主戰場從「會說話」轉向「會理解因果與物理」,那麼今日圍繞文字 token建立的成本與收入模型,只是第一幕的布景。
第三個轉折,是智能不應該永遠被凍結。今天的大多數模型像受過昂貴教育但失去短期記憶的顧問。它們在預訓練中吞下互聯網,部署後卻很難真正從每次互動中累積經驗。若要更新知識,往往需要微調、重訓、RAG(Retrieval-Augmented Generation)或一系列工程補丁。這就是continuous learning與持久記憶系統的意義。一些新科創公司關注的不是再訓練一個更大的大腦,而是讓代理在運行時整理、重構和延續自己的記憶。
這聽起來像產品功能,實際上是經濟模型的變化。若每次互動都能改善系統,智能就不再只是一次性資本開支的產物,而變成可複利的運營資產。今天的模型部署有點像僱用一名高薪員工,但每晚都把他的工作記憶清空。這當然能刺激雲端用量,也能刺激投資者想像力;只是對客戶而言,這未免太像一種高科技失憶症收費模式。
第四個轉折,是代理技能的編譯。當前許多AI agent每次執行任務時,仍像第一天上班的實習生:重新探索工具、重新嘗試流程、重新犯一些昂貴而富有創意的錯誤。企業真正需要的不是每次都「智能地improvisation」,而是可檢查、可重複、可治理的流程。若成功的工具調用、決策路徑和工作流可以被記錄、抽象並編譯成可復用模式,那麼 agent的經濟性會發生質變。
這是軟體史上反覆出現的路徑。早期自動化總是手工藝,後來變成流程,再後來變成平台。企業不喜歡魔法,企業喜歡審計、權限、版本控制和責任歸屬。魔法適合demo,流程才適合採購。
第五個轉折,是把推理與資料分離。今天處理企業專有知識的常見方式是RAG,像在模型旁邊綁一個外接資料袋。它有用,但笨重;可控,但增加延遲;務實,但不優雅。Memory Decoder類研究提出的方向,是讓模型透過可插拔記憶模組吸收新知識,而不必改寫核心參數。這避開了微調帶來的災難性遺忘,也避免每次查資料都像讓一位博士戴著頭燈鑽進檔案室。
如果這類方法成熟,企業AI的部署邏輯會被改寫。現在的問題是:要不要重訓?要不要微調?要不要建RAG?未來的問題可能變成:哪個記憶模組、哪個知識邊界、哪種治理機制。模型本身變成推理引擎,資料成為可替換、可審計、可授權的記憶層。這對雲端收入未必是壞事,但對「每個企業問題都需要更多token燃燒」的直線外推,絕對不是好消息。
因此,真正的問題不是GPU需求會不會消失。它不會。認為算法效率提升就等於硬體需求崩潰,是另一種幼稚的線性思維。歷史上,計算效率上升通常會釋放更多需求,而不是消滅需求。晶片仍然重要,數據中心仍然重要,電力仍然重要。但資源組合會變。未來五年的數據中心採購清單,未必會像今天這樣把所有希望都押在同一類加速器、同一種記憶體瓶頸、同一套transformer經濟學上。
這正是投資者應該害怕的地方。不是AI不重要,而是AI太重要,以至於它不可能永遠停留在當前笨重昂貴的形態。市場正在把「現階段的架構限制」資本化為長期資產價值。這是一種常見錯誤。鐵路泡沫時期,投資者知道鐵路會改變世界,這一點完全正確;他們錯在以為每一條鐵軌、每一家鐵路公司、每一張債券都會因此變得值錢。互聯網泡沫時期,投資者知道網絡會吞噬經濟,也完全正確;他們錯在買下太多只會吞噬現金的公司。
今天的AI資本開支循環也有類似氣味。龐大的GPU集群、預付產能、長約電力、土地、冷卻、水資源、網絡設備與融資安排,正在被包裝成不可避免的未來基礎設施。部分確實如此。另一部分則可能只是昨日架構的紀念碑。當市場把短缺本身視為商業模式時,就已經接近危險區。短缺能創造利潤,但短缺也會召喚替代方案。價格訊號愈強,聰明人愈有動力繞過它。
這是資本主義最刻薄也最有效率的地方:高毛利會吸引競爭,高成本會吸引發明。GPU租金愈高,愈多研究者會尋找少用GPU的路徑。上下文愈貴,愈多人會攻擊注意力機制。推理延遲愈糟,愈多人會重構記憶層。當硬體瓶頸成為產業共識時,它同時也變成全世界工程師的靶子。華爾街稱之為護城河;計算機科學家稱之為待優化函數。
更麻煩的是,金融系統擅長把好波動變成壞波動。AI研究的非線性進步本來是好事。一次架構突破、一種新記憶方法、一個更便宜的推理路徑,都可能讓應用更普及、讓客戶成本下降、讓生產率上升。這是創新波動。但當市場用槓桿、債務、長期供應承諾和過度樂觀的終值假設去追逐一條線性曲線時,同樣的技術進步就可能變成金融壓力。好消息會讓某些資產突然變壞。
這種反諷在AI周期中尤其尖銳。若token成本下降10倍,社會可能受益巨大,應用需求可能暴增,整個產業的可用市場可能擴大。但對某些依賴高推理成本、高硬體稀缺性和高資本門檻支撐估值的公司而言,這未必是利多。投資者經常忘記,技術進步與既有資產價格之間沒有道德義務。創新不會因為你剛簽了十年租約而放慢腳步。
最終,AI的勝利者未必是買最多硬體的人,而是最早理解數學正在改變的人。硬體是必要條件,但不是充分條件。資本開支可以購買時間,不能購買架構命運。當前的巨型模型和資料中心建設,可能是通往下一代智能的橋樑;但橋樑不是目的地,除非你是收過路費的。
對投資者而言,問題不應是「AI還會不會需要更多算力」。答案顯然是會。真正的問題是:哪一種算力、在哪一層堆疊中、以什麼成本曲線、服務哪一種架構、產生哪一種可持續利潤。若答案只是「更多GPU」,那不是投資論點,而是採購清單。市場給採購清單的估值,通常在周期頂部最慷慨。
Scaling laws不是故事的終章。它們只是序章,也是警告。當一個產業的資源需求呈現近似指數式膨脹時,它要麼找到新的算法,要麼被自己的成本吞噬。AI不會停下來,但它也不會永遠以今天這種方式前進。資源指數時代的尾聲,不代表智能革命結束;恰恰相反,它意味着真正有趣、也真正殘酷的部分即將開始。
下一階段的AI不會獎勵那些把尺子畫得最長的人。它會獎勵那些願意折斷間尺的人。
徐立言(本欄每逢周一刊出)
https://www.facebook.com/hsulylab




,泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。