[AI 回顧] Token Maxing三月熱潮退場
摘要 : Token Maxing從矽谷狂熱蔓延至大廠,卻在三個月內快速降溫,主因是成本失控、ROI不明、能力與組織流程脫節。
內容:
三個月前,矽谷還在流行一場名為「Token Maxing」的熱潮。當時工程師們比拼誰消耗更多 token,彷彿用得越多,就越懂 AI、越代表未來。這股風潮最早出現在 OpenAI、Anthropic 等前沿模型公司內部,後來快速擴散到整個科技圈,甚至連迪士尼、Visa 與國內大廠都加入其中。
所謂 Token Maxing,本意是「最大化使用 token 資源」,但很快被扭曲成一種身份象徵。大家開始把高 token 消耗等同於更高的 AI 掌握度與生產力。當時的氛圍甚至到了「不用 AI 就落後、不多用 AI 就是態度有問題」的程度。
但這場熱潮退得也非常快。到了五月底、六月初,亞馬遜關閉了內部 AI 使用排行榜,因為員工開始為了衝排名而讓 AI 執行沒有價值的任務。Uber 也公開質疑 token 消耗與實際業務成果之間的關聯,微軟則開始削減大量內部 Cloud Code 授權。原本無上限投入的企業,幾乎都陸續踩下煞車。
在這波調整中,各家公司也開始尋找新的衡量標準。百度提出以日活智慧體數(DAA)取代 token;Devin主張用節省的人類工時衡量;Uber希望將 token 與功能交付、ROI 掛鉤;亞馬遜則回到客戶與業務問題解決數量。但問題是,token 消耗與這些最終指標之間並沒有簡單直接的換算關係,試錯成本與效益邊界也難以界定。
微軟 CEO 納德拉後來提出「Token 資本」的概念,認為 token 使用的目的不應只是消耗,而是要沉澱成企業自己的 AI 能力資產,例如工作流、私有評測、組織知識、反饋閉環與可遷移的企業經驗。這個觀點雖然補充了部分方向,但本質上也只是把正在被工具鏈自動化的流程,重新包裝成企業資產來理解。
那麼,Token Maxing 為什麼會這麼快失敗?最直接的原因就是太貴了,企業燒不起。更深層來看,至少有三個原因。
第一,前沿模型公司的成本結構本來就不好看,尤其在 IPO 壓力下,更難維持寬鬆的使用政策。模型本身研發成本極高,商業化後毛利也未必理想,因此企業開始提高價格,或透過調整 tokenizer、計費方式來變相漲價。
第二,訂閱制被重度使用者與 agent 工具打穿了。原本包月訂閱適用於一般聊天式使用,但自動化 agent 能長時間並行工作,token 消耗遠超舊有模型。這讓廠商不得不把高強度推理成本拆出來額外收費,例如 Anthropic 與 Google 都開始調整訂閱方案與計費邏輯。
第三,從技術層面看,agent 的 token 消耗極其驚人,而且效率很低。研究指出,agent 式程式設計任務的 token 消耗大約是普通程式碼問答的 1000 倍,最大開支還不是輸出,而是模型反覆讀取上下文的輸入成本。探索、修正、測試等階段尤其消耗巨大,說明現有工具鏈為了讓模型不跑偏,必須不斷餵入上下文,代價極高。
此外,agent 真正的能力也還遠未成熟。研究顯示,在大量真實專業任務中,即使是最好的系統,最難任務的完整通過率也只有 8.6%,平均甚至只有 2.6%。而且 75% 的失敗並不是執行層面的手腳問題,而是理解與策略問題,也就是說,agent 最大的短板是缺乏真正的行業知識與專業判斷。
這意味著,AI 並不是不能做事,而是越接近真實企業場景,越依賴隱性知識、本地規則、專業流程與可驗證輸出。一個通用 skill 到企業內部往往還要二次開發,法務、財務、研發、銷售各有自己的規範與系統,越貼近業務,越難通用。
組織層面也是一大瓶頸。即使 AI 在某個上游環節真的有效,比如寫程式碼,它也未必能轉化成最終成果。因為程式碼之後還有審查、測試、整合、發布與採用等一連串流程。上游加速了,但下游沒有同步加速,最後就只會堆出更多半成品。
MIT 的研究就指出,AI 工具確實讓程式碼提交大幅增加,但這種增幅傳導到專案數與實際發布版本時,效果會明顯縮水。也就是說,「寫出更多程式碼」和「交付更多產品」完全不是一回事。更麻煩的是,AI 產生的程式碼還可能讓人類後續審查負擔更重,理解難度更高,進一步卡住人的頻寬。
除了這些大問題,還有兩種常被忽略的浪費。第一是簡單任務上的虛耗。研究顯示,像簡單算數、拼寫檢查、同義詞查詢這類小任務,很多人明明自己做更快,卻還是習慣打開 AI。結果反而花更多時間在寫提示詞、等待答案、閱讀與確認上,形成一種「效率幻覺」。
第二是重複造輪子。隨著 agent 生成內容的成本越來越低,開發者與 AI 都更傾向直接重新生成一份,而不是搜尋、理解、複用既有成果。研究發現,大量 skill 高度相似,許多 agent 提交的程式碼修復請求最終未被合併,其中相當一部分原因就是同樣的問題早已被別人解決。這說明在缺乏全局協調時,AI 很容易放大重複建設與資源浪費。
總結來看,Token Maxing 的失敗,不只是一次短期泡沫破裂,更像是 AI 產業從狂熱走向現實的過程。它暴露了兩件事:第一,現階段 agent 的能力還不足以在所有任務上穩定提效;第二,企業也還沒有建立出一套成熟的 AI 使用方法,能真正避免浪費並轉化為業務成果。
更深一層說,這其實是經濟學中「生產率悖論」的再次上演。像電力、電腦、網際網路這些通用技術,在剛出現時都曾經歷過「技術進步很快,但整體產出沒有立刻提升」的階段。因為真正的瓶頸,往往不在單一技術本身,而在與之互補的流程、制度、組織與人類能力。
所以,Token Maxing 的退潮不一定代表 AI 沒有未來。相反地,它可能只是提醒大家:AI 要真正產生價值,不能只看 token 花了多少、程式碼寫了多少,而要看它是否穿透整條價值鏈,最終轉化成可交付、可使用、可驗證的成果。

沒有留言:
張貼留言