OSWorld-Verified于2025年7月28日发布,是一次全面重构,修复了原版中300+已识别问题,包括失效 URL、反爬 CAPTCHA、不稳定 HTML 结构、含糊指令,以及过严/过松的评测脚本。
2026年刚开年,Agent(智能体)赛道的竞争便趋于白热化,国外Anthropic发布Claude Cowork (以下简称“Cowork”),以及程序员彼得·斯坦伯格开发的 OpenClaw (原Clawdbot/Moltbot)引爆AI社区。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果