新智元报道 编辑:LRST【新智元导读】ContextBench首次从「过程」评测代码智能体,不再只看是否修好代码,而是追踪它是否精准找到并真正使用了关键代码片段,揭示了当前模型多读少用、被关键词误导、复杂架构无效等深层问题,推动AI助手向更可靠、可解释的方向进化。在自动化软件工程(Automated Software ...
、2026年3月初,编程圈迎来历史性一刻:AI助手OpenClaw在GitHub上的星标数正式超越Linux内核,登顶全球开源项目活跃度榜首。从爆火到登顶,仅用了短短2个月——这不仅是GitHub史上的最快纪录,更让“AI智能体”的概念首次大规模进入开发者视野。 OpenClaw的突破在于,它不再是那个只会回答问题的“聊天机器人”,而是一个能7×24小时干活的“数字员工”——帮你回邮件、订机票、写 ...