AI 程式設計不是太貴,是沒人量過它到底值多少
這兩週企業 AI 圈最扎眼的兩條新聞:微軟要在 Experiences + Devices 部門內部砍掉 Claude Code、把上千名工程師推回 GitHub Copilot;Uber 則是四個月就燒光了 2026 全年的 AI 程式設計工具預算。
輿論的解讀幾乎一面倒:AI 程式設計太貴了,泡沫要破了。 重度使用者每月 500 到 2000 美元的 token 帳單,確實嚇人。
但我覺得這個解讀偏了。真正被清算的不是「AI 太貴」,是另一件更尷尬的事:幾乎沒有人,量過這筆錢到底換回了多少東西。
一個細節暴露了全部
Uber 的做法裡藏著最說明問題的一筆:他們在內部上線了一個按 AI 工具用量給團隊排名的排行榜。到三月,5000 名工程師裡 84% 被劃成了「agentic coding 使用者」。
停下來想想這個排行榜在獎勵什麼——它獎勵的是燒 token,不是產出價值。你把「用得多」做成了一個可以攀比的光榮榜,那大家當然會拼命用。預算被燒光,不是意外,是這套激勵的必然結果。
於是帳單來的時候,財務能看到的是一個精確到美元的成本數字,和一個完全說不清的收益。Uber 的 COO 自己承認得很坦白:花的錢和產出的功能之間,「那條線還連不起來……很難說我們現在就多產出了 25% 有用的功能」。
這不是 AI 的失敗,是衡量的失敗。
你沒法用「感覺更快了」去打贏一場預算戰
最反諷的地方在這裡:這些公司,正是一邊在給自己的 AI 產品瘋狂建評估體系、要金標準資料集、要把每一點品質都量化的同一批人;可輪到自己用的 AI 工具,「提效」卻是一個預設成立、從沒被驗證的假設。
「更快」被當成了不證自明的事。沒人去把 agent 工時和真正交付、真正有價值的產出連起來。結果就是:當 CFO 拿著帳單問「這 500 萬買到了什麼」,工程團隊只能答「感覺快了不少」——而「感覺」在預算會議上,約等於零。
所以這場清算到底清算了什麼
它清算的不是 AI 程式設計,是把 AI 當表演、而不是當槓桿的那種採用方式。
鋪開工具、上個用量排行榜、84% 滲透率——這些都是「採用」的樣子,不是「策略」。真正的策略是:從一開始就想清楚,這玩意兒到底要撬動什麼,並且能把那個「什麼」量出來、連到價值上。
我的判斷是:接下來活下來的團隊,不會是把 AI 工具砍得最狠、用得最省的,而是唯一一批能把 token 花銷連到已交付價值、並且敢拿這條線去跟 CFO 據理力爭的。這場成本回潮,會把「拿 AI 當槓桿」的團隊和「拿 AI 當作秀」的團隊,乾淨俐落地分開。
還有句不太好聽的:如果你這一年衡量的一直是「用量」,那你其實已經輸掉了這場爭論——因為你親手訓練了整個組織去最佳化那塊儀表板,而不是去最佳化價值。
討論