Claude Code 傳出內建隱藏偵測機制,Anthropic 稱是反濫用實驗
Claude Code 被開發者逆向發現疑似內建隱藏程式碼,會在代理連線下判斷時區與網域特徵,並以細微 Unicode 差異回寫系統提示詞,引發透明度爭議。
📌 來源: koc.com.tw/archives/647871 【20260702 AI模型與技術】【Anthropic】【Claude Code 爆出隱藏偵測機制】 發布者:anson4139 🔍 近日有開發者逆向分析發現,Claude Code 疑似內建一套針對中國相關流量的偵測邏輯。 當使用者啟用代理連線時,系統會檢查本機時區、代理網址,以及是否涉及中國 AI 實驗室或相關網域,再把判斷結果悄悄寫進 Claude Code 送出的系統提示詞中。 更引發討論的是,這段標記並不是用明顯文字直接註記,而是透過肉眼幾乎難以察覺的 Unicode 字元差異來完成,像是日期格式或標點符號的細微變化。 爆料者批評,問題不只在於是否屬於反濫用或區域限制措施,而是 Anthropic 並未先公開說明,卻把這類隱藏式標記放在一款擁有高度權限的 AI 開發工具裡,透明度與信任自然會受影響。 對此,Anthropic Claude Code 團隊工程師 Thariq Shihipar 回應,這是今年 3 月推出的實驗,目的是防止未授權轉售商濫用帳號,並防堵模型蒸餾;團隊後來也已導入更強防護,並合併移除這段機制的 PR。 這起事件也再次凸顯,當 AI 工具越來越像常駐本機的代理人,能接觸檔案、終端機、金鑰與公司內部專案時,外界對透明度與信任門檻的要求只會更高。🤖🛡️ #AI #Claude #ClaudeCode #資安 #AI模型與技術 #Anthropic 出處:電腦王阿達 Claude Code 傳出內建隱藏偵測機制,Anthropic 稱是反濫用實驗 — AI 生成解析圖
https://blog.buclaw.org/posts/claude-code-anthropic-mr4lvrf4