2026-06-09

AI 程式設計不是太貴，是沒人量過它到底值多少

這兩週企業 AI 圈最扎眼的兩條新聞：微軟要在 Experiences + Devices 部門內部砍掉 Claude Code、把上千名工程師推回 GitHub Copilot；Uber 則是四個月就燒光了 2026 全年的 AI 程式設計工具預算。

輿論的解讀幾乎一面倒：AI 程式設計太貴了，泡沫要破了。 重度使用者每月 500 到 2000 美元的 token 帳單，確實嚇人。

但我覺得這個解讀偏了。真正被清算的不是「AI 太貴」，是另一件更尷尬的事：幾乎沒有人，量過這筆錢到底換回了多少東西。

一個細節暴露了全部

Uber 的做法裡藏著最說明問題的一筆：他們在內部上線了一個按 AI 工具用量給團隊排名的排行榜。到三月，5000 名工程師裡 84% 被劃成了「agentic coding 使用者」。

停下來想想這個排行榜在獎勵什麼——它獎勵的是燒 token，不是產出價值。你把「用得多」做成了一個可以攀比的光榮榜，那大家當然會拼命用。預算被燒光，不是意外，是這套激勵的必然結果。

於是帳單來的時候，財務能看到的是一個精確到美元的成本數字，和一個完全說不清的收益。Uber 的 COO 自己承認得很坦白：花的錢和產出的功能之間，「那條線還連不起來……很難說我們現在就多產出了 25% 有用的功能」。

這不是 AI 的失敗，是衡量的失敗。

最反諷的地方在這裡：這些公司，正是一邊在給自己的 AI 產品瘋狂建評估體系、要金標準資料集、要把每一點品質都量化的同一批人；可輪到自己用的 AI 工具，「提效」卻是一個預設成立、從沒被驗證的假設。

「更快」被當成了不證自明的事。沒人去把 agent 工時和真正交付、真正有價值的產出連起來。結果就是：當 CFO 拿著帳單問「這 500 萬買到了什麼」，工程團隊只能答「感覺快了不少」——而「感覺」在預算會議上，約等於零。

它清算的不是 AI 程式設計，是把 AI 當表演、而不是當槓桿的那種採用方式。

鋪開工具、上個用量排行榜、84% 滲透率——這些都是「採用」的樣子，不是「策略」。真正的策略是：從一開始就想清楚，這玩意兒到底要撬動什麼，並且能把那個「什麼」量出來、連到價值上。

我的判斷是：接下來活下來的團隊，不會是把 AI 工具砍得最狠、用得最省的，而是唯一一批能把 token 花銷連到已交付價值、並且敢拿這條線去跟 CFO 據理力爭的。這場成本回潮，會把「拿 AI 當槓桿」的團隊和「拿 AI 當作秀」的團隊，乾淨俐落地分開。

還有句不太好聽的：如果你這一年衡量的一直是「用量」，那你其實已經輸掉了這場爭論——因為你親手訓練了整個組織去最佳化那塊儀表板，而不是去最佳化價值。