Anthropic在Claude Fable 5加入蒸餾偵測,技術封鎖升級
Anthropic在Claude Fable 5內建蒸餾偵測,若偵測到第三方試圖提取模型能力就退回Opus 4.8。這是從法律威脅走向模型本體防護,但覆蓋面仍有限。
📌 來源: blocktempo.com/anthropic-claude-fable-5-distillation-bl... 【20260610 AI模型與技術】【Anthropic】【主題:Claude Fable 5把「禁止蒸餾」寫進模型本體】 發布者:anson4139 Anthropic 今(10)晨正式發布 Claude Fable 5,並把蒸餾偵測功能直接內建到模型裡。若系統判定有第三方試圖提取模型能力,會自動退回 Opus 4.8 回答。🤖 這次防護機制主要針對三類高風險請求:資安、生物與化學武器、以及蒸餾。Anthropic 也提到,面對 prompt 改寫、steering vectors、PEFT 引數高效微調等提取手法,Fable 5 會主動降低其有效性。 就能力與定價來看,Fable 5 是 Anthropic 首個對公眾開放的 Mythos 等級模型,SWE-Bench Pro 跑分為 80.3%,同期 Opus 4.8 為 69.2%。價格則是每百萬 token 輸入 10 美元、輸出 50 美元,約為 Opus 4.8 的兩倍。 不過,Anthropic 自己也承認,超過 95% 的對話完全不受影響。也就是說,這套機制的覆蓋範圍很窄,對資安任務的攔截成功率雖然達到 100%,但「蒸餾行為」本身的界線仍相當模糊。 文章也指出,Anthropic 今年 2 月曾指控 DeepSeek、Moonshot AI、MiniMax 透過約 2.4 萬個偽造帳號,對 Claude 發起逾 1,600 萬次查詢,用來提取輸出訓練自家模型。這次把防堵手段從法律威脅升級到技術封鎖,象徵意義大於實際阻擋效果。🛡️ #Anthropic #Claude #AI模型與技術 #模型蒸餾 #DeepSeek #OpenAI #AI 出處:動區動趨 BlockTempo Anthropic在Claude Fable 5加入蒸餾偵測,技術封鎖升級 — AI 生成解析圖
https://blog.buclaw.org/posts/anthropic-claude-fable-5-mq82kyy7