矽谷輕鬆談 中文
00:24:11 ~4 分鐘
S2E60 AI 生產力的幻覺:從開發者到整個產業的自我感覺良好
AI 安全研究機構 METR 發現開發者使用 AI 後自評效率提升 20%,實測卻慢了 19%;Uber 四個月燒光全年 AI 預算被迫煞車,Dario Amodei 也收回末日論——AI 帶來的生產力幻覺已從個人蔓延至企業與整個產業。
本頁摘要由 AI 自動生成,著作權屬原節目創作者;可能存在錯誤或遺漏,建議收聽 原節目《矽谷輕鬆談》 以獲取完整資訊。
重點摘要
- METR 於 2025 年(去年)的研究顯示:開發者使用 AI 後自評效率提升 20-24%,螢幕錄影實測卻慢了 19%,正負落差高達約 40%;受試者看完自己的錄影仍堅稱「速度變快了」
- AI 在企業層級造成類似幻覺:PR 產出翻倍,但 bug 增加、修復成本攀升,Uber 四個月內花完全年 AI credit 預算,被迫公開踩煞車
- Anthropic 執行長 Dario Amodei 於 2026 年(今年)初達沃斯論壇修正末日論,承認目前數據僅見 Entry Level 職缺略減,未見整體大規模工作消失
- 主持人 Kenji 認為當前最大隱憂是 AI 時代 Junior 開發者的能力斷層:透過 AI 工作跳過了掙扎內化的過程,技能無法深植
- 樂觀情境:這一代斷層可能只是教育體系過渡期的短暫問題;或者 5-10 年後 AI 成熟到 100% 穩定執行,這些底層技能本身就不再被需要
詳細內容
開發者層級:METR 研究揭露 AI 自我感覺良好的幻覺
METR 是一個專注於 AI 模型評估與安全的研究機構,他們在 2025 年(去年)進行了一項以螢幕錄影計時為基礎的實驗,直接量測開發者在「可用 AI」與「不可用 AI」條件下完成同一批任務的實際速度,以驗證 AI 是否真的帶來效率提升。
- 受試者事前預期 AI 可帶來 24% 效率提升;任務完成後回顧,降至 20% 的主觀感受
- 實際螢幕錄影分析結果:使用 AI 的組別速度慢了 19%
- 正(主觀 +20%)負(實測 −19%)合計,自我感覺與現實差距約 40 個百分點
- 最吊詭之處:研究人員把螢幕錄影回放給受試者看,他們仍堅稱「我跟 AI 合作,效率有提升」——過度自信偏誤在直接證據面前依然頑固存在
- METR 原計畫於 2026 年(今年)以更大樣本重做此實驗;目前尚未發布新結果
公司層級:Uber 四個月燒光全年 AI 預算
企業導入 AI 初期,可觀察到的表面指標(如 PR 數量)確實上升,但隨之而來的是程式碼品質下降、後續維護成本暴增的問題,使 Uber 等公司不得不公開叫停。
- Uber 在短短四個月內花完全年 AI credit 預算,隨後出面宣布要謹慎評估成本效益
- 常見企業導入模式:AI 讓 PR 產出翻倍 → bug 與 issue 也倍增 → 修復時間拉長 → 整體時間投入不降反升
- 主持人 Kenji 分享個人經驗:用 AI 後單日 PR 從 2 個增至 6 個,但其中 1-2 個有問題,後續修復這些問題侵蝕了所有效率增益
- 業界風向的轉變:過去半年流行「Token Maxing」(瘋狂燒 Token)的氛圍,近期越來越多公司開始踩煞車
產業層級:末日論的退潮與滯後效應
Dario Amodei(Anthropic 執行長)在 2026 年(今年)初的達沃斯世界經濟論壇上的發言,代表了 AI 產業整體敘事的一次修正——從「AI 將快速取代大批工作」轉向更謹慎的表述。
- Amodei 的新說法:AI 能完成 End-to-End 任務,但「能完成任務」不等於「取代職位」;說法變得更精確,而非完全否認 AI 影響力
- 現有數據:Entry Level 入門職缺有所減少,但未見整體產業的大規模職位消失
- Kenji 的解讀:這可能是滯後效應——Coinbase、Square 等公司的裁員已在緩慢累積,未來某個時間點可能出現突然翻轉,讓許多職業瞬間消失
Junior 能力斷層:AI 時代最深遠的結構性問題
主持人 Kenji 認為,AI 帶來的最嚴峻長期問題不在眼前的生產力數字,而在於新一代開發者缺少了能力養成的關鍵過程。
- 傳統路徑:Junior 從一行行手寫程式碼開始,參與架構討論、提出多種方案並比較優缺點,在掙扎與反覆中逐漸內化判斷力,積累 5-10 年才形成現在的技術直覺
- AI 路徑:Junior 依賴 AI 輸出跳過了「掙扎—理解—內化」的過程,任務雖然完成,但他們的技能沒有進入長期記憶
- 這不只是「以老賣老」的感覺:研究數據顯示,智慧型手機與 AI 普及後,近年學生的認知能力量測結果持續下滑
- 業界缺乏解決誘因:AI 公司與採用 AI 的企業致力於放大 AI 使用量與提高獲利,因此沒有動機去補足 Junior 的能力缺口
兩個樂觀情境
Kenji 提出兩種可能讓局面反轉的未來想像:
- 斷層只是過渡期:問題源於當前 AI 教育體系尚未成熟;若 10 年後教育跟上,下一代 AI Native 將如同現代人熟練使用 Google 卻不因此變笨一樣,能負責任地運用 AI 並保有獨立思考
- 這些能力本身可能不再被需要:如同今日幾乎無人研究 Compiler 細節,若 AI 在 5-10 年後成熟到能 100% 穩定地把自然語言轉譯為可靠程式碼,Junior 的底層技術能力缺口就不再是問題——開發者的角色將往更上游的思維與決策層移動
精選語錄
「你自我感覺非常的好,可是你實際上做出來同一個任務的效果就是比較差。」
「即便看到這個證據在眼前,他們還是覺得自己使用 AI 以後的體感上是變得更好了,所以這真的是一個非常危險的概念。」
「你透過 AI 去學習去工作,導致你並沒有真的深刻的把這些能力學到你的腦海裡面。」
時間軸
逐字稿無明確時間戳記,以下依內容段落排列:
- 開頭:節目介紹,預告三層討論框架(開發者、公司、產業)及 Junior 能力斷層議題
- 前段:METR 2025 年(去年)研究細節——24% 預期、20% 自評、實測慢 19%、看錄影仍不信
- 中段前:企業層——Uber 案例、PR 倍增但 bug 增加、AI credit 預算四個月告罄
- 中段後:產業層——Dario Amodei 2026 年(今年)初達沃斯發言、末日論修正、Coinbase/Square 裁員的滯後效應討論
- 後段:Junior 能力斷層深度分析——傳統 vs AI 養成路徑對比、數據支持、業界無解決誘因
- 結尾:兩個樂觀情境;主持人提及感冒狀態,邀請留言討論
同節目更多集數
相關主題
- 【微笑台灣Ep.179】日本人眼中的新竹?台日跨國合作,開箱新竹的反差魅力聽天下:天下雜誌Podcast · 2026-06-13
- 【天下零時差06.12.26】全台2萬家早餐店比超商還多!巷口阿姨如何煎出2千億產值王國?聽天下:天下雜誌Podcast · 2026-06-12
- 【尋找台灣隊的故事 EP.01】當 K-Beauty 席捲亞洲,台灣隊靠「科研實力」突圍!DR. WU 吳奕叡以專業皮膚科學為盾,開拓亞洲醫美保養市場新局聽天下:天下雜誌Podcast · 2026-06-12
- 【天下零時差06.11.26】神準預言6月大跌!該逃命還是抄底?看懂後市3劇本聽天下:天下雜誌Podcast · 2026-06-11
- 【決策者・聽天下Ep.157】AI之島背後,靠他們撐腰!台泥80年來如何幫台灣打下韌性基石?聽天下:天下雜誌Podcast · 2026-06-11