而整个测试,我全都是让 Claude Code(Opus 4.7)自己完成的:让它自己设计测试方案,自己写 prompt,分别使用 GLM 5.1 和 DeepSeek V4 Pro 跑同样的任务,最后自己评判结果。 (我现在很多测试、很多工作都是这么做的……主打一个 0 人工介入。效果好不好另说,但一定得是省事的) ...
今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。 相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。 一共两个模型,分别是 V3.1 和 V3.1 base。两个模型结构完全一致,V3.1 的 Base 模型在 V3 的基础上 ...
编程王者Claude地位不稳了?? 大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。 要知道Claude Opus 4可是公认的“全球最强编码模型”。 so,能在编程上战胜Claude Opus 4,DeepSeek-R1-0528到底啥来头? 看名字你可能以为是个小版本更新,但 ...
今年1月美国Hunter Bown发起的DeepSeek-TUI用Rust编写,五一因DeepSeek-V4发布及中文宣传爆火,介绍其特性、更新等,贡献者含Claude等。 DeepSeek也有自己专属的Coding Agent了。 名字简单粗暴,就叫DeepSeek-TUI,作者自称是一名“鲸鱼兄弟”的DeepSeek爱好者。 刚刚,这个项目的 ...
AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: 刚刚 ...
DeepSeek-R1是由深度求索公司开发的开源推理模型,可处理需要逻辑推理、数学问题解决和实时决策的任务。该模型的突出特性之一是能够对其逻辑进行跟踪,因此用户更容易理解其输出,并可以在必要时对其输出提出质疑。 这种透明性在要求结果可解释的领域 ...
星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。 即日起可在官网 chat.deepseek.com 或官方 App 体验,API 服务同步上线。 DeepSeek V4 登场,Agent 玩家迎来大狂欢 Agent 能力是此次升级最核心的方向。 V4-Pro 已在 DeepSeek 内部作为 Agentic Coding 工具日 ...
DeepSeek的野心——想当规则制定者。 “如果顶尖的AI模型被优化在华为芯片上运行,对美国而言将是‘可怕的后果’。” 这是英伟达CEO黄仁勋近期在一档播客节目中发出的警告。让他发出警告的对象,是即将发布新模型的中国AI公司DeepSeek。 让黄仁勋警惕的 ...
近日,国内通用大模型DeepSeek以燎原之势在全球各个领域迅猛发展,也为教育行业的高质量发展带来了新的巨大机遇。 目前,清华大学、浙江大学、上海交通大学、华中科技大学、武汉大学、北京航空航天大学等国内多所高校纷纷宣布,已经完成DeepSeek系列大 ...
被调侃“Next Week”近3个月的DeepSeek V4,终于显露真身。 1.6T的最大参数量、1M的上下文窗口、针对Agent的性能优化,以及基于MoE(混合专家模型)和稀疏注意力机制DSA,降低计算和显存需求——这些曾被外界纷纷猜测的参数和性能,随着V4的官宣,一锤定音。