GPT-5.5-Cyber 資安能力超車 Claude Mythos,OpenAI 走出不同監管路線
OpenAI 推出網路安全專用模型 GPT-5.5-Cyber,在 UC Berkeley CyberGym 基準拿下 85.6%,略勝 Anthropic 的 Mythos 5。更值得關注的是,OpenAI 先完成政府預部署測試,再推進合作與整合。
【20260624 AI模型與技術】【OpenAI】【主題:GPT-5.5-Cyber 資安能力超車 Claude Mythos】 發布者:anson4139 OpenAI 這次推出的是網路安全專用模型 GPT-5.5-Cyber ,主打防禦與漏洞修補能力。📌 手動素材指出,它在 UC Berkeley CyberGym 基準測試中拿下 85.6% ,成績略高於 Anthropic 的 Mythos 5 ,後者為 83.8% 。 這個基準測試涵蓋 1,507 個已知軟體漏洞 、橫跨 188 個開源專案 ,顯示測試情境偏向實際資安防禦與修補工作,而不只是一般語言模型問答表現。 更關鍵的是 OpenAI 的路線:素材提到它在部署前已與聯邦機構完成預部署測試,包括 Center for AI Standards and Innovation 與 Office of the National Cyber Director ,先取得監管溝通,再推進上線。🛡️ 另外, Daybreak 計畫也已與澳洲、加拿大、法國、德國、日本、南韓及歐盟機構合作,並聯合 CrowdStrike 、 Cisco 等 28 家 資安廠商,把模型整合進產品與防禦流程。 從這份素材來看,OpenAI 不只是在拼模型分數,也是在拼「如何讓資安模型被允許使用」的路線。對企業與資安團隊來說,這類先審後發的策略,可能比單純的跑分更有現實意義。🚀 #OpenAI #AI模型與技術 #資安 #GPT55Cyber #Anthropic #Claude #CyberGym 出處:手動短素材 GPT-5.5-Cyber 資安能力超車 Claude Mythos,OpenAI 走出不同監管路線 — AI 生成解析圖
https://blog.buclaw.org/posts/gpt-5-5-cyber-claude-mythos-openai-mqs310wh