谷歌发布 Gemini 2.5 Computer Use 模型：专攻浏览器交互，支持 13 种操作

资讯
25年10月8日
編輯

admin

10 月 8 日消息，谷歌正在预览一款全新的 Gemini 人工智能模型，该模型旨在通过浏览器浏览网络并与之交互，使 AI 智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为「Gemini 2.5 计算机使用」（Gemini 2.5 Computer Use）的模型，利用「视觉理解与推理能力」分析用户的请求，并完成相应任务，例如填写并提交表单。

谷歌发布 Gemini 2.5 Computer Use 模型：专攻浏览器交互，支持 13 种操作

该模型可用于用户界面测试，或用于操作那些仅面向人类用户、未提供 API 或其他直接接口的系统。此前，此类模型已应用于谷歌 AI 模式（AI Mode）中的智能体功能，以及研究原型项目「Mariner」，该项目利用 AI 智能体在浏览器中自主执行任务，例如根据食材清单自动将商品添加到购物车。

谷歌此次发布恰逢 OpenAI 在其年度开发者日（Dev Day）宣布推出 ChatGPT 新应用的次日。OpenAI 正持续聚焦其「ChatGPT 智能体」（ChatGPT Agent）功能，该功能可代表用户完成复杂任务。与此同时，Anthropic 公司已于去年发布了其 Claude AI 模型的「计算机使用」（computer use）版本。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

谷歌发布 Gemini 2.5 Computer Use 模型：专攻浏览器交互，支持 13 种操作

艾维对话奥尔特曼：为 OpenAI 构思 20 个硬件创意，但不会像 iPhone

OpenAI 与流媒体音乐平台 Spotify 达成合作，用户可通过ChatGPT获取个性化音乐推荐

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

艾维对话奥尔特曼：为 OpenAI 构思 20 个硬件创意，但不会像 iPhone

OpenAI 与流媒体音乐平台 Spotify 达成合作，用户可通过ChatGPT获取个性化音乐推荐

谷歌推AI视频剪辑应用Vids 测试Gemini AI生成演示视频

谷歌：Gemini API 用量 6 个月飙升 14 倍，明年将升级 AI助手

谷歌 Gemini 聊天机器人新增多图上传功能，部分用户已可体验

谷歌 Chrome 浏览器接入 Gemini AI：能帮你解读网页、模糊检索历史记录

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注