IT之家 12 月 1 日消息,DeepSeek V3.2 正式版今日发布,强化 Agent 能力,融入思考推理。 官方今日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区 ...
DeepSeek开源V3.2-Exp模型,685B参数,引入DSA稀疏注意力机制,显著提升长上下文训练和推理效率,性能与V3.1-Terminus相当。 还是熟悉的节奏! 在假期前一天,DeepSeek 果然搞事了。 在官方介绍中,DeepSeek 表示 DeepSeek-V3.2-Exp 是实验版本。作为迈向下一代架构的过渡,V3 ...
【TechWeb】12月2日消息,昨日晚间,DeepSeek发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale,并开源。DeepSeek-V3.2 达到了 GPT-5 的水平,DeepSeek-V3.2-Speciale在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。 在发布的技术论文中,DeepSeek团队提到,过去几个月中出现 ...
过去DeepSeek的特殊性在于,它背后有幻方量化/High-Flyer的资金、算力和工程积累,所以它可以长时间保持一种“非VC叙事”:不急着融资,不急着商业化,不急着讲增长故事。
DeepSeek V3.2评测:推理能力达GPT-5水平,数学竞赛金牌!但编程领域与Claude、Gemini-3.0-Pro仍有差距。官方承认算力受限,V4版春节前后发布将解决。 日前DeepSeek低调发布了DeepSeek V3.2正式版以及长思考加强版eepSeek-V3.2-Speciale,命名上继续小步快跑。 但DeepSeek V3.2整体 ...
百万Token价格低至2毛钱。 DeepSeek离下一代架构,又近了一步! 智东西9月30日报道,昨日,DeepSeek宣布开源DeepSeek-V3.2-Exp实验版模型。该模型首次引入了DeepSeek Sparse Attention稀疏注意力机制,并在几乎不影响模型输出效果的前提下,大幅度提升了长文本训练和推理 ...
在AI巨头们全力厮杀的当下,昔日“特立独行”、长期将外部资本“拒之门外”的DeepSeek也“缺钱”了?
不敢为天下先,故能成器长。——老子《道德经》昨天是戏剧性的一天,刚刚把龙虾的主模型从GPT5.4切到5.5,还没试几个案例,又切到DeepSeek V4了。比 GPT-5.5 晚几小时,比 Opus 4.7 晚八天——V4 没有选择抢一个"首发"窗口 ...
DeepSeek想让开源模型重回第一梯队。 DeepSeek想让开源模型重回第一梯队。 智东西12月2日报道,昨晚,DeepSeek发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。这是DeepSeek当前性能最强大的模型,在推理、智能体等多领域基准测试中斩获全球开源模型第一的表现。
DeepSeek如果通过有限度的商业化建立起一定规模的经常性收入,那它在下一代模型的研发中就多了一层缓冲,不是替代幻方的输血,而是在幻方之外再加一条供给线,让试错的空间不随算力通胀而萎缩。
这家一度站在中国AI赛道顶峰的公司,长期主要靠创始人梁文锋和背后的量化基金幻方量化支持。梁文锋直接和间接持有DeepSeek ...