English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
linkedin.com
Reinforcement Learning Tutorial - RLVR with NVIDIA Unsloth | Amjad Raza, Ph.D.
This excellent tutorial demonstrates using GRPO (Group Relative Policy Optimization) to fine-tune an LLM to master the 2048 game—a practical showcase of RL techniques applied to language models. What strikes me: just as we've normalized spending hours training traditional ML models on business-specific parameters, I expect we'll see the same ...
已浏览 4209 次
2 个月之前
Second Life Basics
19:36
How to start in Second life - Create your avatar - Tutorial
YouTube
My -second- life as Lilith
已浏览 2.8万 次
2017年9月5日
1:08:31
Second Life Avatar Tutorial 👗 | How to Create & Customize Your SL Avatar
YouTube
Meela Vanderbuilt
已浏览 3.8万 次
2019年12月11日
3:11
How To Get Started in Second Life - New User Tutorial
YouTube
Second Life
已浏览 35.1万 次
2019年5月13日
热门视频
8:18
RLinf-VLA:统一高效的具身智能强化学习训练框架
bilibili
伟博科研专注AI3D
已浏览 79 次
1 个月前
1:13:18
【Lumina Talk 第24期】 清华大学于超老师|RLinf:VLA模型的强化学习后训练系列研究
bilibili
Lumina具身智能社区
已浏览 4350 次
1 个月前
6:19
[AI播客]RLHF到RLVR:强化学习的范式演进与实践,突破探索从人类反馈到可验证奖励的强化学习技术变迁 #AI #LLM #智能体 #人工智能
bilibili
烟岚九境
已浏览 337 次
5 个月之前
Second Life Building
13:16
Basic building tutorial for Second life part 1 (of 3)
YouTube
Guerlin Idlemind
已浏览 9万 次
2014年1月5日
10:07
Basic building tutorial for Second Life Part 2 (of 3)
YouTube
Guerlin Idlemind
已浏览 8.5万 次
2014年1月5日
47:25
Bandor Builds - Beginner's Guide to Building in Second Life - Part 1 - The Basics
YouTube
Bandor Tyrell
已浏览 6042 次
2022年10月28日
8:18
RLinf-VLA:统一高效的具身智能强化学习训练框架
已浏览 79 次
1 个月前
bilibili
伟博科研专注AI3D
1:13:18
【Lumina Talk 第24期】 清华大学于超老师|RLinf:VLA模型的强化学
…
已浏览 4350 次
1 个月前
bilibili
Lumina具身智能社区
6:19
[AI播客]RLHF到RLVR:强化学习的范式演进与实践,突破探索从人类反
…
已浏览 337 次
5 个月之前
bilibili
烟岚九境
Basic Texturing : Quick Second Life Tutorial
已浏览 997 次
2009年9月19日
YouTube
NicolettaLefevre
Basic LSL Scripting in Second Life
已浏览 2.5万 次
2011年10月23日
YouTube
Paul Preibisch
7:19
rlc全流程攻略
2024年2月19日
douyin.com
46:35
强化学习 | 可验证奖励的强化学习(RLVR)
已浏览 655 次
10 个月之前
bilibili
FreeMindFall
2:51
Lora训练太简单!RLT开源简易训练器,已更新~ 云端适配开箱即用,支持F
…
已浏览 1137 次
8 个月之前
bilibili
Rick不想上班
1:01:58
第3.2章:具有可验证奖励的强化学习(RLVR)
已浏览 788 次
7 个月之前
bilibili
LearnToCompress
1:10:05
RLHF训练法从零复现,TRL版本复现,代码实战,大语言模型训练
已浏览 8756 次
2024年11月18日
bilibili
蓝斯诺特
3:57
【RLCraft】RLC小知识课堂
已浏览 5.8万 次
2024年3月6日
bilibili
木医-
24:13
[Agentic RL] 07 limits of RLVR,base vs. RL, pass@k, ppl
…
已浏览 2644 次
2 个月之前
bilibili
五道口纳什
7:44
RLinf-VLA:让VLA模型真正学会“试错”的强化学习框架
已浏览 1176 次
4 个月之前
bilibili
刘靖峰-峰哥讲AI
1:05:47
直播回放 | 清华RLinf团队: RL可以为VLA带来什么?
已浏览 1931 次
2 个月之前
bilibili
TechBeat人工智能社区
6:48
【RLcraft】RLD 自用设置修改和模组添加配置
已浏览 4194 次
2024年11月12日
bilibili
_Ailw
47:56
Sliggytv | 241211-SVL邀请赛-RLF-NRG/DRX-BLG | SVL邀请赛 | 直播
…
已浏览 697 次
2024年12月12日
bilibili
冬浪
7:52
手推RLC串联二阶电路的系统建模与响应分析
已浏览 188 次
4 个月之前
bilibili
AkiraCruise
32:26
论文精读系列 - RLVR:错误/随机奖励也能提升推理?
已浏览 5550 次
5 个月之前
bilibili
酸果酿
12:57
开源RLT简易Lora训练器,一键打标自动训练,好用到爆~
已浏览 3083 次
8 个月之前
bilibili
Rick不想上班
36:56
RLinf-VLA框架技术报告——RL如何训练VLA?
已浏览 1582 次
2024年3月25日
bilibili
计算机视觉life
1:50
Second Life QuickTips - Getting Help
已浏览 2.8万 次
2013年3月7日
YouTube
Second Life
1:08
Welcome to Second Life
已浏览 20.4万 次
2014年12月23日
YouTube
Second Life
35:28
LLM后训练SFT、RLHF原理全面解析
已浏览 415 次
4 个月之前
bilibili
AI技术新视界
6:06:21
【6小时教程】完整 LLM 实战课程:从 Transformer 到 RLHF 全流程
已浏览 3320 次
4 个月之前
bilibili
AIDeepCoder
1:19
Second Life - The Online 3D Virtual World
已浏览 54.6万 次
2009年8月26日
YouTube
Second Life
23:44
[RL4LLM] 理解 reasoning model Tokenizer 的 chat template,vllm i
…
已浏览 6363 次
1 年前
bilibili
五道口纳什
14:09
Second Life Building Tutorial : Maps & Texturing - Part 1
已浏览 4405 次
2020年6月26日
YouTube
ZimberLab
3:13
RLC一些设置和配置文件还有方便的mod
已浏览 5.1万 次
2024年2月17日
bilibili
洛哥吖
4:18
Quicksand #1 - Sinking in Second Life
已浏览 27.5万 次
2009年3月3日
YouTube
Toy Wylie
观看更多视频
更多类似内容
反馈