生成式人工智能 (AI) 正在科技领域发挥关键作用,许多企业已经开始将大语言模型 集成到云端和边缘侧的应用中。生成式 AI 的引入也使得许多框架和库得以发展。其中,PyTorch 作为热门的深度学习框架尤为突出,许多企业均会选择其作为开发 AI 应用的库。
这篇文章从头实现 LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures。需要说明的是,这里写的是一个简洁的最小化训练脚本,目标是了解 JEPA 的本质:对同一文本创建两个视图,预测被遮蔽片段的嵌入,用表示对齐损失来训练。 本文的目标是让你真正 ...
【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。 试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰? 又有多少开发者曾因为频频闪烁的警报「 ...
5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + ...
【2026 年 5 月 22 日,北京】鲲鹏昇腾开发者大会 2026(KADC2026)期间,面向超节点,打造开源易用的昇腾 AI 框架专题论坛顺利举办。 论坛聚焦超节点技术创新与开源生态建设,全方位展示了昇腾 AI 框架的最新进展。会上正式发布了 Ascend for PyTorch 社区,并深度复盘了昇思 MindSpore 在分布式并行、图算融合等前沿领域的创新成果作为组件化支撑 PyTor ...
PyTorch,这一广受欢迎的开源机器学习框架,近期正式推出了其最新版本——2.8版。此次版本更新聚焦于提升量化大语言模型(LLM)在Intel CPU上的推理性能,吸引了众多开发者和研究人员的目光。 在PyTorch 2.8中,开发者团队通过算法优化和技术革新,显著提高了 ...
在最近的Hot Chips大会上,谷歌 Gemini 的工程副总裁Noam Shazeer发表了题为“人工智能下一阶段的预测”的演讲。自 2017 年发明 Transformer 模型以来,他已在 LLM 领域耕耘十年。正如他的幻灯片所述,LLM ...
PyTorch公开2024 H2发展路线图,增透明度。 【导读】最近,PyTorch团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。 如果你在AI领域用Python开发,想必PyTorch一定是你的老朋友之一。2017年,Meta AI发布了这个机器 ...