就在刚刚,OpenAI 头号竞争对手 Anthropic 推出了 “computer use” 功能,让 Claude 能够像人类一样操作电脑了!看屏幕、动光标、点按钮、打字等。通过 API,开发者可以让 Claude 将指令翻译成计算机指令,从而解放一些枯燥的重复性流程任务。 一、西方的Anthropic 的 ...
本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。 从 Anthropic 的 Claude 3.5 Sonnet 自带 Computer-Use 功能 ...
Google于10月7日发布Gemini 2.5 Computer Use模型,这款基于Gemini 2.5 Pro视觉理解和推理能力开发的专门模型,让AI代理能够像人类一样操控用户界面。 该模型在多个网页和移动设备控制基准测试中,表现超越Anthropic Claude Sonnet 4.5及OpenAI竞争产品,同时保持更低延迟。
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说,与 OpenAI 的 Computer-Using ...
Google近日公开预览全新AI模型Gemini 2.5 Computer Use,主打一项突破性功能:不只看得懂画面、理解需求,更能主动“动手操作UI”,像人类一样在网页或App上点击、输入与滑动。 在多项基准测试中,这款模型表现超越OpenAI与Anthropic竞品,更以超低延迟与高准确率成为 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果