整理 | 褚杏娟这段时间,华尔街造了“新神”Anthropic。过去一个月里,多次板块级波动都被市场解读为与 Anthropic 的产品发布直接相关:周一 IBM 股价大跌,有交易员将导火索归因于 Anthropic 宣传的一款工具,它可能自动化 ...
今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
当地时间2月23日,美国大模型公司Anthropic发布官方声明,称旗下大模型Claude遭到了中国模型企业DeepSeek(深度求索)、Moonshot(月之暗面)、MiniMax(稀宇科技)的“非法提取(illicitly extract)”。
最近的 AI 编程圈,实在是太卷了。 感觉我就是睡了一觉,起来天就变了: 前脚Anthropic刚把Claude Code 升级到 2.0、发布Claude sonnet 4.5,后脚 DeepSeek 就密集更新到了 v3.2-exp。 还没等我缓过神,昨晚刷 X,智谱的 GLM-4.6 已经悄悄干到了开源第一,把 DeepSeek 给超了。
北京时间2月12日凌晨,中国AI圈的“春节档”提前爆火。 先是刚刚上市满月的智谱AI,破天荒地发布了一封“调价函”,宣布对旗下核心Coding模型及GLM-5部分API进行价格上调,涨幅30%起步。几乎在同一时间,DeepSeek宣布其上下文窗口从128K暴力拉升至1M(百万级)Token,试图通过技术冗余直接封死对手的溢价空间。 笔者深刻感觉到,这一涨一卷之间,宣告了中国AI产业一个时代的终结: ...
谁能想到,仅仅一个晚上,国内三大AI巨头接连发布了自己的新模型? DeepSeek、智谱和MiniMax无缝衔接上演了这出好戏,AI爱好者们在这个春节可是有的忙了。 在算力紧缺、同质化加剧的当下,国产大模型逐渐走上差异化的路径: 有人押注超长文本的记忆边界,有人攻坚智能体的工程化落地,也有人选择以轻量和效率闯进企业级市场。 01 DeepSeek:百万级上下文定义长文本处理边界 首先是产品端沉寂已 ...
硅谷 AI 领域再迎重磅合作 —— 谷歌与 AI 初创公司 Anthropic 正式敲定一项价值数百亿美元的协议,谷歌将向 Anthropic 提供多达 100 万颗自研 TPU 专用 AI 芯片,计划 2026 年部署 ...
实际上,开源生态的技术上限往往滞后于闭源。DeepSeek必须保迭代速度,以确保其开源模型的能力不被GPT-5、Gemini 3等最新一代闭源模型拉开代差,否则开发者会因为性能差距而回流。
10倍速的一夜:智谱GLM-5官宣,MiniMax与DeepSeek的暗战,deepseek,glm,编程,minimax,代码,agent ...
快速迭代策略:Anthropic说他们观察到了MiniMax攻击的完整生命周期,当Anthropic发布新模型后,对方24小时内就把近一半流量切去抓新模型能力。
1月8日,智谱正式在港交所挂牌上市,在挂牌当日,公司首席科学家、清华大学计算机系教授唐杰向全员发出内部信,确认新一代基座模型GLM-5“即将发布”,并宣布2026年起“全面回归基础模型研究”,同时设立前沿创新部门X-Lab,聚焦架构、学习范式与持续进化三大方向。
如果把人生看作一个开放式的大型多人在线游戏(MMO),那么游戏服务器在刚刚完成一次重大更新的时刻,规则改变了。 自 2022 年 ChatGPT ...