526.【台股美股提款機】NAND Flash 產業:高 IOPS SSD 需求上升拖慢供給增加速度,2026 下半年供不應求加劇
AI 推理的 KV Cache 卸載需求引爆企業級 NAND Flash SSD 需求,搭配晶圓廠產能被 DRAM 排擠、客戶偏好 TLC 壓制 QLC 量產、三星韓國廠罷工三重夾擊,2026 年下半年供不應求態勢只會比上半年更緊。
本頁摘要由 AI 自動生成,著作權屬原節目創作者;可能存在錯誤或遺漏,建議收聽 原節目《財報狗》 以獲取完整資訊。
重點摘要
- AI 推理的 KV Cache 卸載需求(對話上下文從 HBM、DRAM 外溢到企業級 SSD)是 2026 年第一季 NAND Flash 需求爆發的最大驅動力;三星 NAND 業務季增一倍,鎧俠(Kioxia)、美光、SanDisk 季增均達 80-90%
- AI Agent(代理式 AI)可不眠不休執行推理,推理量可達人工觸發的百倍至千倍,進一步放大 NAND Flash 與 RAG Server 儲存需求
- 2026 年 NAND Flash 位元供給年增僅 17-20%:無塵室飽和、產能被 DRAM 排擠、客戶優先要 TLC 而非容量更大的 QLC,三重因素鎖死供給
- 三星確認罷工(2026 年 5 月),韓國廠佔三星 NAND 總產能約 40%,進一步壓縮下半年供給
- 慧榮科技(Silicon Motion)、群聯電子(Phison)等 NAND 控制器廠商因大廠退出消費性市場外包訂單而受惠,2026 年市佔率可望大幅提升
詳細內容
財報狗概念股頁面改版
財報狗近半年多來大幅升級概念股清單頁面,改以自有內部資料庫搭配 AI 整理,解決市面上概念股分類粗糙、邏輯不透明的問題。主持人指出現行券商 App 或證交所產業分類往往分類過粗或邏輯不明,新版頁面將產業子環節細分並附說明,歡迎使用者預約 30 分鐘訪談提供回饋。
三星前半導體部門總裁言論遭誤讀
三星前半導體部門總裁近期公開發言,市場多解讀為預測 2027 年(明年)下半年記憶體景氣反轉。主持人指出其論述核心是呼籲韓國業者比照台積電建立技術護城河、降低週期波動傷害;提及 2027 年(明年)需求走弱僅屬「萬一發生怎麼辦」的潛在風險,並非景氣預測。
- 市場習慣「先有股價結果再湊原因」:希捷不擴產,漲時解讀為「供給收縮利多」,跌時解讀為「看衰需求」——同一事件兩種詮釋,說明新聞轉述不可靠
- 應建立自己對產業的邏輯框架,不依賴第三方媒體轉述
希捷(Seagate)不擴產的真正邏輯:HAMR 技術量產
希捷在摩根大通法說會上宣布不擴產,改以 HAMR(Heat-Assisted Magnetic Recording,熱輔助磁記錄)技術升級取代設備擴充。HAMR 是 HDD 產業近十多年最大製程轉型,希捷預計 2026 年(今年)下半年進入較大規模量產。
- 純靠製程推進,不擴充產線即可讓年度位元出貨量成長逾 50%,比買新設備更快
- HDD 市場已是希捷、威騰(WD)、東芝三家寡佔,前兩家合計市佔逾 80%;威騰同樣採取製程推進、不擴產策略,兩家有默契
- 雙方均以長約方式鎖定大廠訂單,能見度超過四個季度;價格也正與客戶溝通適度調漲
NAND Flash 需求爆發:AI 推理的 KV Cache 卸載
2026 年(今年)第一季,三星 NAND 業務季增 100%,鎧俠(Kioxia)、SanDisk 季增約 80-90%,SK 海力士季增 46%(上一季基期已高)。最大驅動力是 AI 推理的 KV Cache(鍵值快取)卸載:推理系統需要記住對話上下文,但 HBM 與 DRAM 供給緊繃,迫使業者將較冷門的上下文外溢至 NAND Flash SSD。
KV Cache 三層儲存架構:
- 最熱的上下文 → HBM(最快最貴)
- 次熱的上下文 → DRAM(次快次貴)
- 最冷門的上下文 → 企業級 NAND Flash SSD(最慢最便宜,但比 DRAM 便宜 10-100 倍)
NAND Flash 極低的單位儲存成本讓上下文容量彈性大幅提升。NVIDIA 推出專用機櫃產品(CVX),專門用於 KV Cache 卸載,帶動整個產業跟進採用。
AI Agent 二次放大儲存需求:RAG Server
AI Agent(代理式 AI)讓推理脫離人工觸發,可不眠不休執行任務,推理量可達人工觸發的百倍至千倍。一個三人開發團隊使用 AI Agent 一個月燒掉近百萬美元(約新台幣四、五千萬元),核心原因是 Agent 替他們持續產生大量推理。
- Agent 推理過程產生大量中間資料,需暫存後篩選,有用部分寫回 RAG(Retrieval-Augmented Generation,檢索增強生成)Server
- RAG Server 大量依賴企業級 NAND Flash SSD 儲存向量資料庫
- 使用量成正向回饋:越多人用 → 越多上下文資料 → AI 越聰明 → 越多人用
NAND Flash 供給為何難以快速增加
2026 年(今年)全年 NAND Flash 位元供給量增長預估僅 17-20%,遠低於需求增速,原因有以下幾點:
- 無塵室空間飽和:既有工廠已無空間加裝新設備,只能靠製程推進;蓋新廠(如美光新加坡廠)最快 2028 年才能量產
- 被 DRAM 排擠:三星、SK 海力士、鎧俠優先將稀缺無塵室空間配給利潤率更高的 DRAM,部分業者甚至將 NAND 廠房改供 DRAM 生產
- TLC 需求壓制 QLC 量產:KV Cache 卸載系統對 I/O 速度有要求,大廠幾乎全部指定 TLC 製程(速度快於 QLC);QLC 容量雖更大但速度較慢,各家業者均表示 QLC 量產要到 2027 年(明年)才會放量
- 鎧俠(Kioxia)推出 Super High IOPS SSD:採用 XL Flash 技術(MLC 乃至 SLC 製程),速度更快但容量更小,與 NVIDIA 合作用於推理系統,2026 年(今年)下半年放量可期
三星 NAND 韓國廠確認罷工(2026 年 5 月)
2026 年 5 月 20 日(錄音當日),三星半導體工會馬拉松式談判再度破局,政府介入調解仍無效,隔日確認罷工。三星 NAND Flash 全球市佔約 30-35%,韓國廠佔其 NAND 總產能約 40%,罷工將直接衝擊這部分供給,進一步加劇 2026 年(今年)下半年供不應求。
消費性 NAND Flash:淡季不淡,但下半年需留意
原本預期 2026 年(今年)上半年消費性淡季將壓抑需求,但第一季消費性業務季增仍達 80-100%(以 SanDisk 為例:雲端業務季增 200%,消費性季增 100%)。
原因:AI Server 吸走企業級 SSD 供給,消費性市場也感受到供給萎縮;下游預期下半年價格持續上漲,提前拉貨應對。下半年風險:提前拉貨效應消退後,消費性需求可能回落;但大廠已準備快速將消費性 NAND 產能轉供 AI Server 端。
受惠族群:NAND 控制器 IC 廠商
大廠將資源集中於 AI Server NAND,消費性 NAND 控制器業務轉為外包:
- 慧榮科技(Silicon Motion):2026 年(今年)消費性市佔率預估大幅提升,鎧俠、SanDisk 等大廠將消費性控制器外包
- 群聯電子(Phison):同樣受惠於大廠退出消費性市場所釋出的訂單
精選語錄
市場就是這樣,漲多了就會找個理由來跌。希捷每一季都說類似的話,可是為什麼每一季股價的反應不同?我們應該自己判斷,盡量不要靠第三方新聞轉述來影響判斷力。
KV Cache 卸載讓上下文儲存分成三個階層:最熱的存在 HBM,次要存在 DRAM,最冷門的存在 NAND Flash——現在 HBM 跟 DRAM 都不夠了,所以開始外溢到 NAND Flash。
代理式 AI 可以不眠不休,產生的推理量可能是人工觸發的百倍、千倍以上。三個人一個月的 AI 用量燒掉近百萬美元,不是他們三個人一直在做推理,是 Agent 在幫他們瘋狂推理。
時間軸
逐字稿中無時間戳記資訊,略。