English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
linkedin.com
Reinforcement Learning Tutorial - RLVR with NVIDIA Unsloth | Amjad Raza, Ph.D.
This excellent tutorial demonstrates using GRPO (Group Relative Policy Optimization) to fine-tune an LLM to master the 2048 game—a practical showcase of RL techniques applied to language models. What strikes me: just as we've normalized spending hours training traditional ML models on business-specific parameters, I expect we'll see the same ...
已浏览 4209 次
2 个月之前
Second Life Basics
22:30
How to Play Second Life - Gameplay Options Part 1 - Family & Life Sims
YouTube
Meela Vanderbuilt
已浏览 5805 次
2021年8月19日
2:06:00
Second Life Getting Started | Complete Beginner Guide & Tutorial
YouTube
Meela Vanderbuilt
已浏览 7.2万 次
2020年9月2日
15:44
Second Life | Tutorial for Beginners | How -To | Try On Demos | 2021
YouTube
Ooouuukitty
已浏览 843 次
2021年7月8日
热门视频
6:19
[AI播客]RLHF到RLVR:强化学习的范式演进与实践,突破探索从人类反馈到可验证奖励的强化学习技术变迁 #AI #LLM #智能体 #人工智能
bilibili
烟岚九境
已浏览 337 次
5 个月之前
0:10
Guaranteed Rocket League RLFX Strategies for Success
TikTok
eternalrll
已浏览 8.5万 次
1 个月前
Basic LSL Scripting in Second Life
YouTube
Paul Preibisch
已浏览 2.5万 次
2011年10月23日
Second Life Building
10:06
Second Life Building Tutorial : Quick Start Guide - Part 1
YouTube
ZimberLab
已浏览 6049 次
2017年9月16日
10:22
Second Life Building Tutorial : Quick Start Guide - Part 2
YouTube
ZimberLab
已浏览 2502 次
2017年9月16日
13:16
Basic building tutorial for Second life part 1 (of 3)
YouTube
Guerlin Idlemind
已浏览 9万 次
2014年1月5日
6:19
[AI播客]RLHF到RLVR:强化学习的范式演进与实践,突破探索从人类反
…
已浏览 337 次
5 个月之前
bilibili
烟岚九境
0:10
Guaranteed Rocket League RLFX Strategies for Success
已浏览 8.5万 次
1 个月前
TikTok
eternalrll
Basic LSL Scripting in Second Life
已浏览 2.5万 次
2011年10月23日
YouTube
Paul Preibisch
7:19
rlc全流程攻略
2024年2月19日
douyin.com
5:05
Second Life 教程03 设置和基本操作
已浏览 156 次
2 个月之前
bilibili
鱼鱼愉浴雨
46:35
强化学习 | 可验证奖励的强化学习(RLVR)
已浏览 655 次
10 个月之前
bilibili
FreeMindFall
2:51
Lora训练太简单!RLT开源简易训练器,已更新~ 云端适配开箱即用,支持F
…
已浏览 1137 次
8 个月之前
bilibili
Rick不想上班
1:01:58
第3.2章:具有可验证奖励的强化学习(RLVR)
已浏览 791 次
7 个月之前
bilibili
LearnToCompress
1:10:05
RLHF训练法从零复现,TRL版本复现,代码实战,大语言模型训练
已浏览 8770 次
2024年11月18日
bilibili
蓝斯诺特
24:13
[Agentic RL] 07 limits of RLVR,base vs. RL, pass@k, ppl
…
已浏览 2663 次
3 个月之前
bilibili
五道口纳什
7:44
RLinf-VLA:让VLA模型真正学会“试错”的强化学习框架
已浏览 1176 次
4 个月之前
bilibili
刘靖峰-峰哥讲AI
1:05:47
直播回放 | 清华RLinf团队: RL可以为VLA带来什么?
已浏览 1936 次
3 个月之前
bilibili
TechBeat人工智能社区
6:48
【RLcraft】RLD 自用设置修改和模组添加配置
已浏览 4202 次
2024年11月12日
bilibili
_Ailw
47:56
Sliggytv | 241211-SVL邀请赛-RLF-NRG/DRX-BLG | SVL邀请赛 | 直播
…
已浏览 697 次
2024年12月11日
bilibili
冬浪
12:57
开源RLT简易Lora训练器,一键打标自动训练,好用到爆~
已浏览 3083 次
8 个月之前
bilibili
Rick不想上班
1:20:32
从零开始构建LLM - 对齐技术(RL)
已浏览 208 次
8 个月之前
bilibili
比尔森一撇
36:56
RLinf-VLA框架技术报告——RL如何训练VLA?
已浏览 1594 次
2024年3月25日
bilibili
计算机视觉life
1:50
Second Life QuickTips - Getting Help
已浏览 2.8万 次
2013年3月7日
YouTube
Second Life
1:08
Welcome to Second Life
已浏览 20.5万 次
2014年12月23日
YouTube
Second Life
28:35
04-2-串联RLC电路理论讲解及仿真验证
已浏览 702 次
2025年2月24日
bilibili
SIPI_from_0_to_1
6:06:21
【6小时教程】完整 LLM 实战课程:从 Transformer 到 RLHF 全流程
已浏览 3333 次
5 个月之前
bilibili
AIDeepCoder
1:19
Second Life - The Online 3D Virtual World
已浏览 54.6万 次
2009年8月26日
YouTube
Second Life
23:44
[RL4LLM] 理解 reasoning model Tokenizer 的 chat template,vllm i
…
已浏览 6381 次
1 年前
bilibili
五道口纳什
14:09
Second Life Building Tutorial : Maps & Texturing - Part 1
已浏览 4405 次
2020年6月26日
YouTube
ZimberLab
3:13
RLC一些设置和配置文件还有方便的mod
已浏览 5万 次
2024年2月17日
bilibili
洛哥吖
4:18
Quicksand #1 - Sinking in Second Life
已浏览 27.5万 次
2009年3月3日
YouTube
Toy Wylie
5:24
Second Life - Introduction to the Materials Project
已浏览 3.2万 次
2013年6月19日
YouTube
Second Life
1:00
Second Life QuickTips - Customizing Your Appearance
已浏览 40.2万 次
2013年1月25日
YouTube
Second Life
22:17
RTT直播课-引入LVGL并快速移植及编写UI显示温度
已浏览 2247 次
2023年10月24日
bilibili
达波丁
观看更多视频
更多类似内容
反馈