谷歌在大模型领域再掀波澜,正式推出Gemini 3系列中速度最快、性价比最优的Gemini 3 Flash。这款新模型不仅在性能上超越了上一代旗舰产品2.5 Pro,更在速度上实现了三倍提升,同时价格大幅降低,打破了轻量化模型“快则性能打折”的传统认知。 根据谷歌CEO桑达 ...
近期,一项由Flash Attention联合创作者Tri Dao携手普林斯顿大学两位研究生带来的技术创新,在深度学习界掀起了波澜。他们推出的QuACK内核库,凭借纯Python与CuTe-DSL的结合,在不依赖CUDA C++的情况下,于H100显卡上实现了性能上的飞跃,速度超越了PyTorch的torch.compile和 ...