Claude Code的成功,本质上是Opus 4.5模型在复杂任务中工程化能力的体现。当前行业对传统线性基准的过度关注正逐渐失去意义,在长周期、多步骤的智能体任务中,单一响应质量并非决定性因素。竞争焦点已从“生成最佳回答”转向“实现可交付成果”。
大家好,我是饼干哥哥。 自从 Claude code 上线 sub-agents 后,我一直对其抱很大的期待,每次做 case 都会搭建一支“AI coding 梦之队”。想象中,它们会在主 agent的协调下火力全开, 完成我超级复杂的需求。 然而,它并没有那么好用:主 Agent 经常不调用 sub-agent ...
自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use Agent)的第一枪后,OpenAI 也相继推出 Operator,用强化学习(RL)算法把电脑智能体的能力推向新高,引发全球范围广泛关注。 业界普遍认为,需要海量的轨迹数据或复杂的强化学习才能实现电脑智能体 ...
2026 年初,桌面 Agent 成为 AI 行业的重要话题。继海外 Anthropic 推出 Claude 的 Computer Use 能力后,国内 MiniMax、阶跃星辰以及阿里传闻中的 QoderWork 等产品也开始布局桌面端。表面上看,这只是 AI 产品形态的一次升级,但从本质上看,它意味着 AI 正在从“协作工具”逐渐转变为“执行主体”。 过去的 AI ...
Computer Use是Anthropic为旗下AI大模型Claude打造的、使其直接操控电脑的核心能力,能让Claude可以像人一样“看屏幕、动鼠标、敲键盘、操作软件”,完成多步骤、跨应用的复杂任务,于2024年10月随Claude 3.5 ...
现在,Claude 可以新增「技能」了! Anthropic 刚刚为 Claude 推出了 Skills 功能,这个新能力让 Claude 能够动态加载专门的指令、脚本和资源,从通用 AI 助手变身为各领域的专业助手。 此次的功能升级,将进一步改变我们定制 AI 的方式。 什么是 Agent Skills? Skills 本质 ...
9月30日,Anthropic 发布了新的编程模型 Claude Sonnet 4.5,在新闻稿的第一句就写到:Claude Sonnet 4.5 is the best coding model in the world. 换做别的公司我们可能会吐槽“又疯一个”,但 Anthropic 在 AI 编程上的能力大家有目共睹,无论是大家抢着用的 Claude Sonnet 4 还是引领编程 ...
2025 年底,一个奥地利开发者 Peter Steinberger 用一个小时写了个 Agent 工具,最初叫 Clawdbot,名字蹭了 Claude 的边。Anthropic 发律师函威胁法律行动,Steinberger 被迫改名,先改成 Moltbot,后来又改成 OpenClaw。 这本来是一件小事。 但 OpenClaw 随后爆了。GitHub 上狂飙到 17 万星,单周访问量破 20 ...
Manus 的出现,标志着我们进入了 AI 应用的 L2.5 阶段,也让“入口即应用”的产品形态成为可能。但真正落地一个 Agent,难点远不止模型能力——从规划、执行、观察到工具调用,每一个环节都藏着坑。本文通过 Coze + Claude 的实战组合,拆解 Manus 的核心架构,带 ...
继 MCP(Model Context Protocol)之后,Anthropic 最近又推出了 Skill(技能)。因工作需要,我近期快速上手并实践开发了一个 Skill,过程中积累了一些经验,整理成本文,希望能帮助更多同学: 快速理解 Skill 到底是什么? 掌握关键要点,提升 Skill 的开发质量与效率。
苹果Xcode支持智能体编程,集成Claude和Codex。 苹果Xcode支持智能体编程,集成Claude和Codex。 智东西2月4日报道,今日凌晨,苹果与Anthropic联合宣布,面向苹果平台开发者的官方编程工具Xcode推出26.3候选版本,并首次原生集成Claude Agent,支持以Agentic Coding(智能体 ...
(以下内容从华福证券《传媒行业动态跟踪:海外Agent框架:Claude+Cursor+MCP》研报附件原文摘录) 投资要点: AIAgent行业的最新发展已形成“基座模型(强代码能力模型)+操作平台(作为客户端)+万能接口(MCP搭建桥梁)”的框架逻辑。 一、Agent基座模型-Claude ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果