AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: 刚刚 ...
此次华为等国产芯片厂商与 DeepSeek 强强联合,在技术协同迭代、规模化产业落地、本土生态共建三大维度,都具有里程碑意义。此举有望打破英伟达长期主导的垄断生态,推动国内AI国产软硬一体、自主可控产业链发展。
DeepSeek-R1是由深度求索公司开发的开源推理模型,可处理需要逻辑推理、数学问题解决和实时决策的任务。该模型的突出特性之一是能够对其逻辑进行跟踪,因此用户更容易理解其输出,并可以在必要时对其输出提出质疑。 这种透明性在要求结果可解释的领域 ...
而整个测试,我全都是让 Claude Code(Opus 4.7)自己完成的:让它自己设计测试方案,自己写 prompt,分别使用 GLM 5.1 和 DeepSeek V4 Pro 跑同样的任务,最后自己评判结果。 (我现在很多测试、很多工作都是这么做的……主打一个 0 人工介入。效果好不好另说,但一定得是省事的) ...
GLM-5即将发布?我似乎又看到了DeepSeek的影子。 离春节不到一周,过去两年的经验告诉我们,国产AI新产品的爆发期又要来了。 Kimi K2.5在OpenRouter上一骑绝尘,Minimax也在官网上隐隐约约透露出M2.2的版本代号。
编程王者Claude地位不稳了?? 大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。 要知道Claude Opus 4可是公认的“全球最强编码模型”。 so,能在编程上战胜Claude Opus 4,DeepSeek-R1-0528到底啥来头? 看名字你可能以为是个小版本更新,但 ...
星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。 即日起可在官网 chat.deepseek.com 或官方 App 体验,API 服务同步上线。 DeepSeek V4 登场,Agent 玩家迎来大狂欢 Agent 能力是此次升级最核心的方向。 V4-Pro 已在 DeepSeek 内部作为 Agentic Coding 工具日 ...
导读:DeepSeek的训练用到了自研的强化学习算法GRPO,它由OpenAI发明的强化学习算法PPO发展而来。DeepSeek的GRPO算法和OpenAI的PPO算法有何区别?这两种算法相比有何优缺点?为什么DeepSeek要使用GRPO算法而不是PPO算法?本文对这些问题进行解答。本文先简要回顾PPO算法 ...
DeepSeek的野心——想当规则制定者。 “如果顶尖的AI模型被优化在华为芯片上运行,对美国而言将是‘可怕的后果’。” 这是英伟达CEO黄仁勋近期在一档播客节目中发出的警告。让他发出警告的对象,是即将发布新模型的中国AI公司DeepSeek。 让黄仁勋警惕的 ...
千万人翘首以待,但又屡屡跳票的DeepSeek V4终于来了!对于为何屡屡跳票众说纷纭,有说是由于主要技术人员的跳槽所致,也有说主要是由于AI芯片的短缺。但无论如何,DeepSeek V4已正式发布,这可以说是2026年的全球AI产业正在发生一次深刻的改变。 4月初,美国 ...
近日,国内通用大模型DeepSeek以燎原之势在全球各个领域迅猛发展,也为教育行业的高质量发展带来了新的巨大机遇。 目前,清华大学、浙江大学、上海交通大学、华中科技大学、武汉大学、北京航空航天大学等国内多所高校纷纷宣布,已经完成DeepSeek系列大 ...
“整体上,DeepSeek大模型的接入,对‘智慧政府’有较大的推进作用。” 香港科技大学助理教授、香港生成式人工智能研发中心预研部主任韩斯睿告诉澎湃新闻记者,随着人工智能技术的快速发展,“AI+政务”成为推动政府治理现代化的重要路径。各地接入 ...