TOKEN - 搜索 News

16 小时on MSN

中国日均Token消耗量18个月增300倍，清华系AI Ping让API调用更高效省钱

中国大模型市场正经历一场静默的变革。当开发者还在为选择哪家服务商的API而苦恼时，一个被称为“中国版OpenRouter+Artificial Analysis”的新平台悄然上线，试图用技术手段解决行业长期存在的“黑盒”困境。

17 小时

18个月，中国Token消化狂飙300倍！别乱烧钱了，清华系AI Infra帮你腰斩 ...

中国大模型数量已超过 1500 个，下游开发者已经开始「疯狂盖房子」。数据显示，2024 年初，中国日均 Token 消耗量约为 1000 亿；到 2025 年 6 月，这一数字已突破 30 万亿。一年半时间，增长超过 300 倍。

11 小时

阶跃星辰开源Step 3.5 Flash：推理速度突破350个Token，引领AI新潮流

2026年2月2日，人工智能领域再度迎来一项突破性进展，阶跃星辰公司正式发布并开源其最新的基座大模型——Step 3.5 Flash。此模型的问世，不仅为开发者提供了构建智能体（Agent）的底层支持，还在稳定性和响应速度上进行了全面优化，标志着AI技术又向前迈进了一大步。

腾讯网

Cursor推出动态上下文发现功能，提升Token使用效率

作者 | Sergio De Simone译者 | 张卫滨Cursor 推出了一种新方法，用于减少发送给大语言模型（LLM）的请求上下文的大小。这种方法名为动态上下文发现（Dynamic Context ...

5 天

曦望发布新一代推理GPU芯片S3：2025年交付破万片推动“百万Token一分 ...

曦望发布新一代推理GPU芯片S3：2025年交付破万片推动“百万Token一分钱”落地,芯片,推理,gpu,曦望,token,算力 ...

14 小时

DeepSeek 发布 OCR 2：视觉 Token 消耗锐减 80%，文档解析力超越 Gemini 3 Pro

中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2，在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式，彻底颠覆了传统视觉模型平铺直叙的处理逻辑。

4 天

智源Emu3成果登上Nature：基于“预测下一个Token”

Nature编辑点评这项研究：Emu3仅基于预测下一个词元（Next-token prediction），实现了大规模文本、图像和视频的统一学习，其在生成与感知任务上的性能可与使用专门路线相当，这一成果对构建可扩展、统一的多模态智能系统具有重要意义。

腾讯网Opinion

云市场“分水岭”已现：在token价格战最激烈之时，腾讯云为何选择 ...

然而，对于身处一线的腾讯云高层来说，这场所谓的“价格屠杀”并没有带来预期的黏性，反而让产业生态陷入某种低水平重复的循环。在行业普遍陷入算力资源同质化竞争的当下，腾讯云选择划清界限，明确提出要从“卖资源”全面转向“卖应用”。

5 天

范式智能&曦望|推出“百万Token一分钱”计划重构大模型推理成本边界

1月27日，在曦望2026 SGS产品发布会上，范式智能创始人戴文渊与国产GPU厂商曦望联席CEO王湛共同宣布，推出“百万Token一分钱”推理成本计划。双方将以范式智能PhanthyCloud云服务与曦望新一代推理GPU芯片启望S3的深度融合，将大模型推理成本降至每百万Token仅需1分钱，为AI技术的规模化应用提供更经济的解决方案。

品玩

腾讯云：我们不卷Token

在腾讯云看来，公有云的“上半场”已经结束了。过去十年大家拼IaaS、拼PaaS的阶段，本质上就是比谁家服务器多、带宽便宜。这的确带来了市场规模的增长，但增速已经放缓。

腾讯网

KuCoin成为首个支持泰国政府G-Token发行的全球加密交易所

PANews 8月27日消息，KuCoin携手 KuCoin Thailand、XSpring Digital、Krungthai XSpring及SIX Network，正式成为首个也是唯一一家支持泰国历史性 G-Token 项目的全球加密货币交易所。 G-Token 是全球首个由主权国家财政部发行的代币化政府债券，也是泰国首个在数字资产交易所上市的 ...

36氪

DeepSeek-V3.2被找出bug了：疯狂消耗token，答案还可能出错，研究人员 ...

DeepSeek-V3.2很强很火爆，但随着讨论的深入，还是有bug被发现了。并且是个老问题：浪费token。图源：x@Hangslin 不少网友都提到，DeepSeek-V3.2的长思考增强版Speciale，确确实实以开源之姿又给闭源TOP们上了压力，但问题也很明显：在面对复杂任务时，消耗的token数偏 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果