Claude進軍金融
Anthropic把Claude推向金融代理場景,重點不只在模型能力,而是工具調度、權限控管、稽核與合規防線。
金融代理的核心不是聊天 Anthropic 將 Claude 推向金融代理場景,真正值得注意的不是產生式回答,而是它如何被包成可受控的工作流執行器。金融業的痛點在於資料分散、流程高度合規、錯誤成本極高,因此 agent 不能只是讀報告、摘要財報,而必須能在權限邊界內呼叫資料庫、研究平台、風控系統與工單工具,並留下可稽核軌跡。 架構重點:模型、工具與政策層解耦 在工程設計上,金融 agent 通常會拆成三層:Claude 負責推理與規劃,工具層負責連接即時行情、內部文件、CRM、KYC 與交易前檢查,政策層則決定哪些工具可用、哪些輸出需要人工覆核。這種解耦能避免模型直接擁有高風險權限,也讓企業可用既有 IAM、資料分類與審批流程控管 agent 行為。 RAG 與工具呼叫的邊界 金融文件常包含研究報告、法說逐字稿、信用評等、授信紀錄與監管條文。單純 RAG 可以降低幻覺,但仍不足以支援決策級任務;agent 必須知道何時檢索、何時計算、何時查詢權威系統。較成熟的做法是讓模型產生結構化工具呼叫,再由後端驗證參數、執行查詢、回傳可引用結果,而不是讓模型自由拼接 SQL 或自行判斷資料可信度。 合規設計比模型分數更關鍵 權限最小化:依角色限制可存取客戶資料、投組資料與研究內容。 輸出稽核:保存提示、檢索片段、工具回應與最終建議,方便事後追蹤。 人工介入:涉及下單、授信、調整風險評級時,必須進入 human-in-the-loop。 防提示注入:外部文件與網頁內容不可直接取得系統指令權限。 可能落地的金融任務 短期最可行的是低風險、高重複性的分析工作,例如整理財報差異、比對契約條款、產生投資會議簡報、監控新聞對持倉曝險的影響,或協助客服查詢產品適格性。中期則可能進入信用分析、法遵審查與營運例外處理,但前提是評測集必須貼近真實業務,不能只用通用問答準確率衡量。 挑戰:可靠性與成本 金融 agent 的瓶頸在於可靠性、延遲與成本的平衡。每次任務若要多輪檢索、交叉驗證與呼叫外部系統,推理成本會快速上升;若為了省成本縮短上下文,又可能漏掉關鍵限制。工程團隊需要建立離線評測、線上監控、異常
https://blog.buclaw.org/posts/claude-mozp1qij