AI 快用不起了。大模型机构密集发出“涨价信号”。 张鹏说的“算力约束”,不是算力不够,而是 GPU 的架构撑不住 Agent 时代的推理。当 AI Agent 开始 24 小时不睡觉地跑,旧算力基础设施的瓶颈开始暴露。这个瓶颈不在算法,也不在算力规模,而是在更底层的芯片架构—— 2025 年底,英伟达以 200 亿美元拿下了美国公司 Groq 的技术授权和核心团队,在复杂的交易背后,他们瞄准的是 ...
这份去年平安夜达成的协议,号称是英伟达创立30余年来规模最大的一笔交易。而拿下这份协议时,Groq正处于一个处境微妙的节点。如今,英伟达正押宝Groq的极速推理技术,并将其融入全新发布的芯片平台。 罗斯当时不只是在阐述合作理念,还希望获得英伟达 ...
《科创板日报》3月21日讯(编辑 朱凌)在人工智能产业狂飙突进的这些年里,GPU几乎霸占了AI算力江湖,英伟达更是坐拥GPU王座。 但在近日举行的英伟达GTC 2026开发者大会演讲中,一个曾经鲜为人知的AI芯片初创公司名字Groq却响彻全场,英伟达CEO黄仁勋发布了 ...
快科技3月17日消息,CPU、GPU、NPU、VPU、DPU、TPU、PPU、IPU……之后,XPU家族再添新成员! NVIDIA创造了全新的“LPU”,意思是 ...
当地时间周一,英伟达首席执行官黄仁勋表示,受Anthropic公司的Claude Code、OpenAI公司的OpenClaw等工具落地应用的推动,未来约两年内,人工智能芯片领域的营收预计至少将达到1万亿美元。 黄仁勋在这场硅谷举办的、市值达4.5万亿美元的半导体巨头英伟达的旗舰级 ...
文末附资料下载方式,更多资料请进入“智能计算芯知识星球”下载。 3月18日消息,据路透社报道,人工智能(AI)芯片大厂英伟达正准备推出一款可向中国市场出口和销售的Groq语言处理单元(LPU)版本,预计将于今年5月上市。 在近日的GTC 2026大会上(英伟达 ...
去年冬天,Groq联合创始人兼CEO乔纳森·罗斯(Jonathan Ross)与英伟达CEO黄仁勋会面,提议两家公司开展技术合作。此番接受采访,他用物流打了个比方,形容二者的协同效应:搭建AI数据中心时,不应该默认所有计算任务都要配备同一种硬件。模型训练就像大宗 ...
While Nvidia gets most of the press and market volume, there are three startups that have designed custom silicon and rack-scale infrastructure to compete with them head-on: Cerebras, Groq and Samba ...
Right now, major companies are acquiring GPUs to train their AI models. Because of this, Nvidia is one of the most valuable companies in the world. Well, there’s a company named Groq that’s just burst ...
你有没有想过,为啥现在AI芯片越做越大,但单次推理延迟就是降不下来? 你去问做AI部署的哥们,十个有九个会跟你吐槽:GPU这块,大模型推理就是看batch吃满了能跑多少吞吐量,但你要真给用户做实时交互,那延迟真是飘忽不定,完全看脸。 今天咱聊一片 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果