OpenAI联合创始人兼首席执行官Sam Altman表示,GPT-5.3-Codex在SWE-Bench Pro为 57%,TerminalBench 2.0 76%,OSWorld 64%成为目前最强代码模型。 首先是编程领域的硬通货测试SWE-Bench Pro,这个测试可不简单,不像以前只考Python ...
Claude Opus 4.6还在高难度Agent 搜索(DeepSearchQA / BrowseComp)上单 Agent比GPT-5.2 Pro多6个点,在多学科推理(Humanity's Last Exam / ARC AGI ...
2 月 10 日,OpenAI CEO 奥特曼在推特上宣布,其 Codex App 上线首周下载量突破 100 万,用户总数增长超过 60%。这一消息标志着 AI 编程工具 正在加速普及,也预示着 人工智能 技术在软件开发领域的应用正在快速渗透。本次推广活动结束后,OpenAI 仍将为免费/Go 用户提供 Codex 服务,尽管可能会适当调整使用限制,但其推广决心可见一斑。
机器之心发布Anthropic 和 OpenAI 硬碰硬推出 Claude Opus 4.6 和 GPT-5.3-Codex 后,基础大模型的较量正式进入了实战比拼阶段。模型规划更加谨慎,维持更长时间的自主工作流等能力提升正在试图回应大模型商业化落地 ...
近日,OpenAI与AI芯片巨头Cerebras联手推出GPT-5.3-Codex-Spark模型,专为实时编程场景做了深度优化,最大亮点是突破了推理速度的瓶颈,实现每秒1000tokens的生成能力,让AI编程反馈和开发者思路同步成为可能。
OpenAI’s new Codex Mac app passed 1 million downloads in a week, spotlighting rising demand for agentic coding tools and tighter free-tier limits.
OpenAI’s GPT-5.3-Codex expands Codex into a full agentic system, delivering faster performance, top benchmarks, and advanced cybersecurity capabilities.
OpenAI today introduced a new artificial intelligence model, GPT-5-Codex, that it says can complete hours-long programming tasks without user assistance. The algorithm is an improved version of GPT-5 ...
Codex, OpenAI’s AI-powered software engineering agent that can work on tasks in parallel, is now generally available. Since being launched as a research preview in May, Codex has added Slack ...
一天之内,两大编程AI轮番轰炸硅谷。Claude Opus 4.6之后,奥特曼紧急放出GPT-5.3-Codex。双雄争霸,彻底撕开AI王座争夺战的帷幕。 作为回应,OpenAI仓促应战,不过半小时紧急祭出最强智能体编程模型—— ...
OpenAI 发布 Codex macOS 应用,作为 AI 智能体指挥中心,并全面翻倍付费用户速率限制。 Vibe Coding 无疑是现在最热的 AI 赛道,作为巨头之一的 OpenAI,近日又在这个赛道,开始了新的动作。
That's why OpenAI's push to own the developer ecosystem end-to-end matters in26. "End-to-end" here doesn't mean only better models. It means the ...