在文章中,李康旭展示了一个实验:通过仅 2 次 API 调用 + 35 行 Python 代码,成功推断出了OpenAI Codex CLI 的上下文压缩流程,并通过一次 prompt injection,诱导模型泄露了内部提示词结构。
在硅谷的工程师鄙视链里,有一群人是站在金字塔绝对顶端的。他们不写炫酷的前端,不搞花哨的产品,他们终日潜伏在操作系统的底层,和编译器、构建系统、虚拟文件系统死磕。他们存在的意义,是保证像 Meta 这样拥有几十亿行代码、上万名工程师的超级代码库,在每一次敲击回车时不会彻底崩溃。 Michael Bolin 就是大厂技术江湖里,真正镇守底层的“扫地僧”。 作为前 Meta 的杰出工程师(Disting ...
OpenAI近日发布了一套新方法论,通过结合Codex与Skills,显著提升了AgentsSDK开源项目的维护效率。在过去三个月里,该团队成功合并了457个PR(Pull Request),较之前的316个PR增加了45%的吞吐量,而团队成员并未增加。这一成果为开源项目的管理提供了新的思路。 该方法论主要由三部分组成:AGENTS.md、Skills和GitHub Actions。AGENTS.
OpenAI宣布对旗下专为科研人员设计的AI工作空间Prism进行全面升级,此次更新不仅将底层模型升级至GPT-5.3,还深度整合了Codex CLI功能,旨在解决科研工作者在文本编辑、文献管理和数据分析等环节频繁切换工具的痛点,推动科研流程向全链路一体化转型。
OpenAI 近日对其面向科研群体的 AI 原生工作空间 Prism 进行了重大升级,引入 Codex CLI,并将底层大模型从 GPT‑5.2 更新为 GPT‑5.3,进一步强化端到端科研自动化能力。Prism 最初于今年 1 月发布,定位为一体化的科学写作与协作平台,旨在让研究人员不必在文本编辑器、PDF 阅读器、LaTeX 编译器、文献管理工具和聊天界面之间频繁切换。 通过 Prism,用户 ...
今年火爆的“龙虾”,就像去年初火爆的Manus,它们基于模型能力提升而生,在爆火的浪潮中不乏争议。但把它们当成严肃的提效工具时会发现,执行任务时的出错概率很高。
上周,GPT-5.4 发了。意图非常明显,直指 Claude Opus4.6 和 Gemini 3.1 Pro。2 月 5 日,Claude Opus 4.6 发了。2 月 19 日,Gemini 3.1 Pro 发了。OpenAI ...
在传闻刚刚两天后,当地时间 3 月 5 日,OpenAI 就正式推出 GPT-5.4。而这次模型更新,主打的正是当下最火热的 AI Agent 方向。 在 GPT-5.4 之前,大模型的能力边界可以用一句话总结:它能告诉你「怎么做」,但它自己做不了。
自从OpenAI发布GPT-5.4以后,我的朋友圈和订阅的公众号就被它占领了。所有人都在讨论同一个词,叫做原生电脑操控能力(Native Computer Use)。铺天盖地的标题写着“AI终于能接管你的电脑了”“GPT-5.4操控桌面超越人类水平” ...
近期,科技圈被一个名为“原生电脑操控能力”(Native Computer Use)的概念刷屏,各大媒体纷纷报道“AI终于能接管你的电脑了”“GPT-5.4操控桌面超越人类水平”等消息,评论区也充斥着“为时已晚,有机体!”的惊叹。然而,面对如此热烈的宣传,不少人心中却充满了怀疑,“AI操控电脑”并非新鲜话题,今年1月OpenClaw爆火时,大家就已见识过类似概念,且过去两年“agent时代”的呼声 ...