刚刚,Anthropic 发布 Claude Opus 4.6BenchMark在知识工作评测 GDPval-AA 上,Opus 4.6 赢 GPT-5.2 约 144 Elo,赢自家前代 Opus 4.5 约 190 Elo翻译成人话,就是十局赢七局同时拿下 Terminal-Bench 2.0(Agent 编码)、Humanity's Last Exam(多学科推理)、BrowseComp(A ...
我们在网上也找了一些 Opus 4.6 最新的测试案例,有网友说 Claude 4.6 Opus 只是一次调用,就完全重构了他的整个代码库,将原来混乱的代码「屎山」全部模块化,并且没有模型能像 Opus 这样做到。
【TechWeb】11月25日消息,Anthropic最新的大模型Claude Opus 4.5今天上市。Anthropic团队表示,Claude Opus 4.5智能、高效,是世界上最好的编码、Agent和计算机使用模型。它在深度研究、使用PPT和Excel等日常任务中也表现得更好。 Anthropic认为,Claude Opus 4.5是现实世界软件工程 ...
万众期待的 Sonnet 5 没来,Opus 4.6 先来了。 Anthropic 今天发布了 Claude Opus 4.6,对自家最强模型做了一次全面升级:更会写代码,更能扛长任务,还学会了自己检查自己的错误。 而且,这是 Opus ...
大家好,我是 Boris,Claude Code 的创建者。想跟大家简要分享一些直接来自 Claude Code 团队内部的使用技巧。其实,团队成员的用法和我的习惯并不太一样。请记住:使用 Claude Code 并没有所谓的唯一正解——毕竟每个人的配置环境都各不相同。建议大家多做尝试,找到最适合自己的工作流!
Claude Opus 4.6 offers deeper reasoning, the ability to handle big document sets, and a new PowerPoint skill.
近日,科技界发生了一场引人注目的风波。据《连线》杂志报道,就在OpenAI即将发布其最新的GPT-5模型之际,Anthropic公司突然宣布撤销了对OpenAI的API访问权限,理由是OpenAI违反了服务条款。 Anthropic公司的发言人Christopher Nulty在一份公开声明中透露,他们的编码 ...
Anthropic launched automated security review capabilities for its Claude Code platform on Wednesday, introducing tools that can scan code for vulnerabilities and suggest fixes as artificial ...