16 小时on MSN
中国日均Token消耗量18个月增300倍,清华系AI Ping让API调用更高效省钱
中国大模型市场正经历一场静默的变革。当开发者还在为选择哪家服务商的API而苦恼时,一个被称为“中国版OpenRouter+Artificial Analysis”的新平台悄然上线,试图用技术手段解决行业长期存在的“黑盒”困境。
中国大模型数量已超过 1500 个,下游开发者已经开始「疯狂盖房子」。数据显示,2024 年初,中国日均 Token 消耗量约为 1000 亿;到 2025 年 6 月,这一数字已突破 30 万亿。 一年半时间,增长超过 300 倍。
2026年2月2日,人工智能领域再度迎来一项突破性进展,阶跃星辰公司正式发布并开源其最新的基座大模型——Step 3.5 Flash。此模型的问世,不仅为开发者提供了构建智能体(Agent)的底层支持,还在稳定性和响应速度上进行了全面优化,标志着AI技术又向前迈进了一大步。
作者 | Sergio De Simone译者 | 张卫滨Cursor 推出了一种新方法,用于减少发送给大语言模型(LLM)的请求上下文的大小。这种方法名为动态上下文发现(Dynamic Context ...
曦望发布新一代推理GPU芯片S3:2025年交付破万片 推动“百万Token一分钱”落地,芯片,推理,gpu,曦望,token,算力 ...
中国 AI 领军企业 DeepSeek 近日发布了全新的视觉编码器 DeepSeek OCR2,在文档处理和图像识别领域实现重大突破。该模型通过模拟人类视觉的灵活扫描模式,彻底颠覆了传统视觉模型平铺直叙的处理逻辑。
Nature编辑点评这项研究:Emu3仅基于预测下一个词元(Next-token prediction),实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。
然而,对于身处一线的腾讯云高层来说,这场所谓的“价格屠杀”并没有带来预期的黏性,反而让产业生态陷入某种低水平重复的循环。在行业普遍陷入算力资源同质化竞争的当下,腾讯云选择划清界限,明确提出要从“卖资源”全面转向“卖应用”。
1月27日,在曦望2026 SGS产品发布会上,范式智能创始人戴文渊与国产GPU厂商曦望联席CEO王湛共同宣布,推出“百万Token一分钱”推理成本计划。双方将以范式智能PhanthyCloud云服务与曦望新一代推理GPU芯片启望S3的深度融合,将大模型推理成本降至每百万Token仅需1分钱,为AI技术的规模化应用提供更经济的解决方案。
在腾讯云看来,公有云的“上半场”已经结束了。过去十年大家拼IaaS、拼PaaS的阶段,本质上就是比谁家服务器多、带宽便宜。这的确带来了市场规模的增长,但增速已经放缓。
PANews 8月27日消息,KuCoin携手 KuCoin Thailand、XSpring Digital、Krungthai XSpring及SIX Network,正式成为首个也是唯一一家支持泰国历史性 G-Token 项目的全球加密货币交易所。 G-Token 是全球首个由主权国家财政部发行的代币化政府债券,也是泰国首个在数字资产交易所上市的 ...
DeepSeek-V3.2很强很火爆,但随着讨论的深入,还是有bug被发现了。 并且是个老问题:浪费token。 图源:x@Hangslin 不少网友都提到,DeepSeek-V3.2的长思考增强版Speciale,确确实实以开源之姿又给闭源TOP们上了压力,但问题也很明显: 在面对复杂任务时,消耗的token数偏 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果