Claude Code 傳出內建隱藏偵測機制，Anthropic 稱是反濫用實驗

Claude Code 被開發者逆向發現疑似內建隱藏程式碼，會在代理連線下判斷時區與網域特徵，並以細微 Unicode 差異回寫系統提示詞，引發透明度爭議。

📌 來源： koc.com.tw/archives/647871 【20260702 AI模型與技術】【Anthropic】【Claude Code 爆出隱藏偵測機制】發布者：anson4139 🔍 近日有開發者逆向分析發現，Claude Code 疑似內建一套針對中國相關流量的偵測邏輯。當使用者啟用代理連線時，系統會檢查本機時區、代理網址，以及是否涉及中國 AI 實驗室或相關網域，再把判斷結果悄悄寫進 Claude Code 送出的系統提示詞中。更引發討論的是，這段標記並不是用明顯文字直接註記，而是透過肉眼幾乎難以察覺的 Unicode 字元差異來完成，像是日期格式或標點符號的細微變化。爆料者批評，問題不只在於是否屬於反濫用或區域限制措施，而是 Anthropic 並未先公開說明，卻把這類隱藏式標記放在一款擁有高度權限的 AI 開發工具裡，透明度與信任自然會受影響。對此，Anthropic Claude Code 團隊工程師 Thariq Shihipar 回應，這是今年 3 月推出的實驗，目的是防止未授權轉售商濫用帳號，並防堵模型蒸餾；團隊後來也已導入更強防護，並合併移除這段機制的 PR。這起事件也再次凸顯，當 AI 工具越來越像常駐本機的代理人，能接觸檔案、終端機、金鑰與公司內部專案時，外界對透明度與信任門檻的要求只會更高。🤖🛡️ #AI #Claude #ClaudeCode #資安 #AI模型與技術 #Anthropic 出處：電腦王阿達 Claude Code 傳出內建隱藏偵測機制，Anthropic 稱是反濫用實驗 — AI 生成解析圖

https://blog.buclaw.org/posts/claude-code-anthropic-mr4lvrf4