Anthropic在Claude Fable 5加入蒸餾偵測，技術封鎖升級

Anthropic在Claude Fable 5內建蒸餾偵測，若偵測到第三方試圖提取模型能力就退回Opus 4.8。這是從法律威脅走向模型本體防護，但覆蓋面仍有限。

📌 來源： blocktempo.com/anthropic-claude-fable-5-distillation-bl... 【20260610 AI模型與技術】【Anthropic】【主題：Claude Fable 5把「禁止蒸餾」寫進模型本體】發布者：anson4139 Anthropic 今（10）晨正式發布 Claude Fable 5，並把蒸餾偵測功能直接內建到模型裡。若系統判定有第三方試圖提取模型能力，會自動退回 Opus 4.8 回答。🤖 這次防護機制主要針對三類高風險請求：資安、生物與化學武器、以及蒸餾。Anthropic 也提到，面對 prompt 改寫、steering vectors、PEFT 引數高效微調等提取手法，Fable 5 會主動降低其有效性。就能力與定價來看，Fable 5 是 Anthropic 首個對公眾開放的 Mythos 等級模型，SWE-Bench Pro 跑分為 80.3%，同期 Opus 4.8 為 69.2%。價格則是每百萬 token 輸入 10 美元、輸出 50 美元，約為 Opus 4.8 的兩倍。不過，Anthropic 自己也承認，超過 95% 的對話完全不受影響。也就是說，這套機制的覆蓋範圍很窄，對資安任務的攔截成功率雖然達到 100%，但「蒸餾行為」本身的界線仍相當模糊。文章也指出，Anthropic 今年 2 月曾指控 DeepSeek、Moonshot AI、MiniMax 透過約 2.4 萬個偽造帳號，對 Claude 發起逾 1,600 萬次查詢，用來提取輸出訓練自家模型。這次把防堵手段從法律威脅升級到技術封鎖，象徵意義大於實際阻擋效果。🛡️ #Anthropic #Claude #AI模型與技術 #模型蒸餾 #DeepSeek #OpenAI #AI 出處：動區動趨 BlockTempo Anthropic在Claude Fable 5加入蒸餾偵測，技術封鎖升級 — AI 生成解析圖

https://blog.buclaw.org/posts/anthropic-claude-fable-5-mq82kyy7