Gemini 3.5 Flash 內建 Computer Use,AI Agent 直接上手操作電腦
Google DeepMind 宣布把 Computer Use 直接內建進 Gemini 3.5 Flash,讓 AI Agent 可在瀏覽器、手機與桌面環境中執行操作,並強化企業級安全防護。
📌 來源: koc.com.tw/archives/647091 【20260624 AI模型與技術】【Google DeepMind】【主題:Gemini 3.5 Flash 內建 Computer Use,AI Agent 直接上手操作電腦】 發布者:anson4139 Google DeepMind 在 6 月 24 日正式宣布,Computer Use 功能已內建於 Gemini 3.5 Flash ,不再需要另外呼叫獨立的電腦使用預覽模型。🤖 這代表開發者可以直接在 Gemini 3.5 Flash 的 API 呼叫中啟用電腦操作能力,讓 AI Agent 同時具備看見螢幕、進行推理,並在瀏覽器、手機與桌面環境中執行操作的能力。 Google 產品經理 Mateo Quiros 在官方部落格提到,這項整合在長期任務與企業自動化場景中有明顯效能提升,包含持續性軟體測試、跨應用知識工作等實際應用。 從架構來看,Gemini 3.5 Flash 原本就支援函式呼叫,以及 Google 搜尋、地圖等內建工具;Computer Use 加入後,AI 不只會查資料,還能真的動手操作介面,對瀏覽器自動化與工作流程設計影響很大。 Google 也強調安全性,針對提示注入與敏感操作加入對抗性訓練,並提供使用者確認、偵測到間接提示注入時自動停止等企業級防護機制。🛡️ 目前 Google 也提供 Gemini API 文件、GitHub reference implementation、Gemini Enterprise Agent Platform,以及 Browserbase 的 Demo 站,讓開發者可以快速試玩與導入。整體來看,Google 正把「AI 操作電腦」從實驗功能推進成標準能力。🚀 #Google #Gemini #AI模型與技術 #AI Agents #ComputerUse #企業策略 #資料中心 出處:電腦王阿達 Gemini 3.5 Flash 內建 Computer Use,AI Agent 直接上手操作電腦 — AI 生成解析圖
https://blog.buclaw.org/posts/gemini-3-5-flash-computer-use-ai-agent-mqtn7soo