BATCH - 搜索 News

1 天

复旦邱锡鹏团队重新定义预训练超参数，WSD时代的BatchSize与LearningRate ...

在人工智能的快速发展中，预训练大模型的超参数设置显得尤为重要。BatchSize（BS）和LearningRate（LR）这两个超参数，犹如赛车的档位和油门，直接影响着模型训练的效率和效果。然而，随着WSD（Warmup-Stable-Decay）调度器和MoE（Mixture of Experts）架构的普及，传统的理论框架逐渐显露出其局限性。近日，复旦大学邱锡鹏教授团队联合上海人工智能实验室发 ...

腾讯网

JAX性能优化实战：7个变换让TPU/GPU吃满算力

点击上方“Deephub Imba”,关注公众号,好文章不错过 ...

腾讯网

Kafka 性能调优：linger.ms 和 batch.size 的最佳实践

2025 年 3 月 18 日，Apache Kafka 4.0 正式发布。在此次版本更新中，相较于架构层面的升级，开发者们也应关注一个关键的细节变更：官方将生产者参数 linger.ms 的默认值，从沿用多年的 0ms 正式修改为 5ms。这一调整直击传统性能调优的认知盲区，在传统观念中，linger.ms=0 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

复旦邱锡鹏团队重新定义预训练超参数，WSD时代的BatchSize与LearningRate ...

JAX性能优化实战：7个变换让TPU/GPU吃满算力

Kafka 性能调优：linger.ms 和 batch.size 的最佳实践

今日热点