跳至主要內容

搜尋摘要

目錄
矽谷輕鬆談 節目封面
00:24:11 ~4 分鐘

S2E60 AI 生產力的幻覺:從開發者到整個產業的自我感覺良好

AI 安全研究機構 METR 發現開發者使用 AI 後自評效率提升 20%,實測卻慢了 19%;Uber 四個月燒光全年 AI 預算被迫煞車,Dario Amodei 也收回末日論——AI 帶來的生產力幻覺已從個人蔓延至企業與整個產業。

在 Apple Podcasts 收聽

本頁摘要由 AI 自動生成,著作權屬原節目創作者;可能存在錯誤或遺漏,建議收聽 原節目《矽谷輕鬆談》 以獲取完整資訊。

重點摘要

  • METR 於 2025 年(去年)的研究顯示:開發者使用 AI 後自評效率提升 20-24%,螢幕錄影實測卻慢了 19%,正負落差高達約 40%;受試者看完自己的錄影仍堅稱「速度變快了」
  • AI 在企業層級造成類似幻覺:PR 產出翻倍,但 bug 增加、修復成本攀升,Uber 四個月內花完全年 AI credit 預算,被迫公開踩煞車
  • Anthropic 執行長 Dario Amodei 於 2026 年(今年)初達沃斯論壇修正末日論,承認目前數據僅見 Entry Level 職缺略減,未見整體大規模工作消失
  • 主持人 Kenji 認為當前最大隱憂是 AI 時代 Junior 開發者的能力斷層:透過 AI 工作跳過了掙扎內化的過程,技能無法深植
  • 樂觀情境:這一代斷層可能只是教育體系過渡期的短暫問題;或者 5-10 年後 AI 成熟到 100% 穩定執行,這些底層技能本身就不再被需要

詳細內容

開發者層級:METR 研究揭露 AI 自我感覺良好的幻覺

METR 是一個專注於 AI 模型評估與安全的研究機構,他們在 2025 年(去年)進行了一項以螢幕錄影計時為基礎的實驗,直接量測開發者在「可用 AI」與「不可用 AI」條件下完成同一批任務的實際速度,以驗證 AI 是否真的帶來效率提升。

  • 受試者事前預期 AI 可帶來 24% 效率提升;任務完成後回顧,降至 20% 的主觀感受
  • 實際螢幕錄影分析結果:使用 AI 的組別速度慢了 19%
  • 正(主觀 +20%)負(實測 −19%)合計,自我感覺與現實差距約 40 個百分點
  • 最吊詭之處:研究人員把螢幕錄影回放給受試者看,他們仍堅稱「我跟 AI 合作,效率有提升」——過度自信偏誤在直接證據面前依然頑固存在
  • METR 原計畫於 2026 年(今年)以更大樣本重做此實驗;目前尚未發布新結果

公司層級:Uber 四個月燒光全年 AI 預算

企業導入 AI 初期,可觀察到的表面指標(如 PR 數量)確實上升,但隨之而來的是程式碼品質下降、後續維護成本暴增的問題,使 Uber 等公司不得不公開叫停。

  • Uber 在短短四個月內花完全年 AI credit 預算,隨後出面宣布要謹慎評估成本效益
  • 常見企業導入模式:AI 讓 PR 產出翻倍 → bug 與 issue 也倍增 → 修復時間拉長 → 整體時間投入不降反升
  • 主持人 Kenji 分享個人經驗:用 AI 後單日 PR 從 2 個增至 6 個,但其中 1-2 個有問題,後續修復這些問題侵蝕了所有效率增益
  • 業界風向的轉變:過去半年流行「Token Maxing」(瘋狂燒 Token)的氛圍,近期越來越多公司開始踩煞車

產業層級:末日論的退潮與滯後效應

Dario Amodei(Anthropic 執行長)在 2026 年(今年)初的達沃斯世界經濟論壇上的發言,代表了 AI 產業整體敘事的一次修正——從「AI 將快速取代大批工作」轉向更謹慎的表述。

  • Amodei 的新說法:AI 能完成 End-to-End 任務,但「能完成任務」不等於「取代職位」;說法變得更精確,而非完全否認 AI 影響力
  • 現有數據:Entry Level 入門職缺有所減少,但未見整體產業的大規模職位消失
  • Kenji 的解讀:這可能是滯後效應——Coinbase、Square 等公司的裁員已在緩慢累積,未來某個時間點可能出現突然翻轉,讓許多職業瞬間消失

Junior 能力斷層:AI 時代最深遠的結構性問題

主持人 Kenji 認為,AI 帶來的最嚴峻長期問題不在眼前的生產力數字,而在於新一代開發者缺少了能力養成的關鍵過程。

  • 傳統路徑:Junior 從一行行手寫程式碼開始,參與架構討論、提出多種方案並比較優缺點,在掙扎與反覆中逐漸內化判斷力,積累 5-10 年才形成現在的技術直覺
  • AI 路徑:Junior 依賴 AI 輸出跳過了「掙扎—理解—內化」的過程,任務雖然完成,但他們的技能沒有進入長期記憶
  • 這不只是「以老賣老」的感覺:研究數據顯示,智慧型手機與 AI 普及後,近年學生的認知能力量測結果持續下滑
  • 業界缺乏解決誘因:AI 公司與採用 AI 的企業致力於放大 AI 使用量與提高獲利,因此沒有動機去補足 Junior 的能力缺口

兩個樂觀情境

Kenji 提出兩種可能讓局面反轉的未來想像:

  1. 斷層只是過渡期:問題源於當前 AI 教育體系尚未成熟;若 10 年後教育跟上,下一代 AI Native 將如同現代人熟練使用 Google 卻不因此變笨一樣,能負責任地運用 AI 並保有獨立思考
  2. 這些能力本身可能不再被需要:如同今日幾乎無人研究 Compiler 細節,若 AI 在 5-10 年後成熟到能 100% 穩定地把自然語言轉譯為可靠程式碼,Junior 的底層技術能力缺口就不再是問題——開發者的角色將往更上游的思維與決策層移動

精選語錄

「你自我感覺非常的好,可是你實際上做出來同一個任務的效果就是比較差。」

「即便看到這個證據在眼前,他們還是覺得自己使用 AI 以後的體感上是變得更好了,所以這真的是一個非常危險的概念。」

「你透過 AI 去學習去工作,導致你並沒有真的深刻的把這些能力學到你的腦海裡面。」

時間軸

逐字稿無明確時間戳記,以下依內容段落排列:

  • 開頭:節目介紹,預告三層討論框架(開發者、公司、產業)及 Junior 能力斷層議題
  • 前段:METR 2025 年(去年)研究細節——24% 預期、20% 自評、實測慢 19%、看錄影仍不信
  • 中段前:企業層——Uber 案例、PR 倍增但 bug 增加、AI credit 預算四個月告罄
  • 中段後:產業層——Dario Amodei 2026 年(今年)初達沃斯發言、末日論修正、Coinbase/Square 裁員的滯後效應討論
  • 後段:Junior 能力斷層深度分析——傳統 vs AI 養成路徑對比、數據支持、業界無解決誘因
  • 結尾:兩個樂觀情境;主持人提及感冒狀態,邀請留言討論

相關主題