English
全部
搜索
图片
视频
短视频
地图
资讯
更多
购物
航班
旅游
笔记本
报告不当内容
请选择下列任一选项。
无关
低俗内容
成人
儿童性侵犯
Byte Pair Encoding
Paper
Byte Pair Encoding
Python
Byte Pair Encoding
Transformer
Advantages of
Byte Pair Encoding
How to Use
Byte Pair Encoding
Byte Pair Encoding
Byte Pair Encoding
Example
Byte Pair Encoding
Tutorial
Byte Pair Encoding
Algorithm
Byte Pair Encoding
vs Word Piece
时长
全部
短(小于 5 分钟)
中(5-20 分钟)
长(大于 20 分钟)
日期
全部
过去 24 小时
过去一周
过去一个月
去年
清晰度
全部
低于 360p
360p 或更高
480p 或更高
720p 或更高
1080p 或更高
源
全部
Dailymotion
Vimeo
Metacafe
Hulu
VEVO
Myspace
MTV
CBS
Fox
CNN
MSN
价格
全部
免费
付费
清除筛选条件
安全搜索:
中等
严格
中等(默认)
关闭
筛选器
Byte Pair Encoding
Paper
Byte Pair Encoding
Python
Byte Pair Encoding
Transformer
Advantages of
Byte Pair Encoding
How to Use
Byte Pair Encoding
Byte Pair Encoding
Byte Pair Encoding
Example
Byte Pair Encoding
Tutorial
Byte Pair Encoding
Algorithm
Byte Pair Encoding
vs Word Piece
Understanding Byte Pair Encoding (BPE) in Large Language Models
已浏览 3 次
2024年12月25日
substack.com
1:44:17
**斯坦福这场2小时讲座的核心内容总结**(演讲者为斯坦福讲师,主要讲解大语言模型LLM的底层技术逻辑):演讲者用非常硬核、系统的方式,把ChatGPT、Claude等主流大模型的“底层核心逻辑”彻底拆解,重点围绕**训练目标、Tokenizer、评估方法、数据**四个核心模块展开,全程干货密集,几乎没有废话。### 1. **核心训练机制(Loss函数)**- LLM的本质是**下一个token预测**(next token prediction)。- 使用**交叉熵损失(cross-entropy loss)**来训练,目标是**最大化文本的似然度(likelihood)**。- 简单说:模型每一步都在学习“给定前面内容,下一个最可能的词是什么”,通过不断最小化损失来实现。### 2. **Tokenizer(分词器)**- 为什么不用单词或字符直接分?因为**token要更通用、更高效**。- 主流方法是**Byte Pair Encoding (BPE)**: - 从大语料开始,先每个字符一个token; - 反复合并出现频率最高的相邻token对,形成常见子序列作为最终tok
已浏览 78.9万 次
2 周前
x.com
渡边君
33:38
台大资讯 深度学习之应用 | ADL 5.1: BPE (Byte-Pair Encoding) Tokenization 如何将字词切成小单元
已浏览 27 次
2 周前
bilibili
小尹不吱声
0:44
Byte Pair Encoding | CS336
1 个月前
YouTube
aiconcept2reel
4:57
LLM Subword Tokenizer Explained: Byte-Pair Encoding (BPE) with HuggingFace and OpenAI
已浏览 66 次
4 周前
YouTube
AI Simply Explained with Tiyasa
4:45
Explaining BPE Byte Pair Encoding
6 天之前
YouTube
Tech Market Explained
2:58
AI Doesn’t Read Words 😳 | Tokenization Explained Simply #tokenization #llm #BytePairEncoding
已浏览 319 次
2 个月之前
YouTube
SimplfyTech
6:23
Byte Pair Encoding (BPE) Explained: Solving the Rare Word Problem in NMT
已浏览 6 次
2 个月之前
YouTube
White Paper Decoder
17:30
Tokenization Explained - The 2016 paper behind every LLM
已浏览 39 次
1 个月前
YouTube
The Rabit Hole Dev
0:48
What is Tokenization?
已浏览 1.8万 次
2 周前
YouTube
codebasics
3:37
BPE Tokenization Algorithm | The Secret Behind GPT & Transformers 🚀| Arvind Sir
已浏览 301 次
8 个月之前
YouTube
COMPILE KARO
47:45
80、Byte Pair Encoding 源码逐行讲解
已浏览 4870 次
2024年7月17日
bilibili
deep_thoughts
32:50
还不会 BPE 分词?这个视频让你彻底搞懂!
已浏览 843 次
2025年4月6日
bilibili
Tallis-wu
15:28
【西湖大学 张岳老师|自然语言处理在线课程 第十六章 - 4节】BPE(Byte-Pair Encoding)编码
已浏览 1457 次
2022年11月14日
bilibili
WestlakeNLP
6:20
Encoder Decoder Network - Computerphile
已浏览 15.7万 次
2018年6月13日
YouTube
Computerphile
1:00
Byte Pair Encoding (Subword Tokenization Method in NLP) #Shorts
已浏览 3761 次
2021年6月22日
YouTube
TechViz - The Data Science Guy
7:25
Bytes and Bytearray tutorial in Python 3
已浏览 6.9万 次
2018年9月5日
YouTube
DevDungeon
29:14
Text Classification Using BERT & Tensorflow | Deep Learning Tutorial 47 (Tensorflow, Keras & Python)
已浏览 19.4万 次
2021年8月28日
YouTube
codebasics
15:35
什么是BPE算法Byte-Pair Encoding
已浏览 7078 次
2023年5月2日
bilibili
wharton0
15:34
110.XHDX_[14.4.1]--BPE(Byte-Pair Encoding)编码
已浏览 38 次
11 个月之前
bilibili
闻博解码
10:46
Representing Numbers and Letters with Binary: Crash Course Computer Science #4
已浏览 217万 次
2017年3月15日
YouTube
CrashCourse
14:45
NLP - Tokenization
已浏览 5 次
3 个月之前
YouTube
Nathan Rigoni
10:28
ChatGPT - Explained!
已浏览 8万 次
2022年12月12日
YouTube
CodeEmporium
3:50
WordPiece Tokenization
已浏览 2.8万 次
2021年11月15日
YouTube
Hugging Face
3:28
WordPiece Tokenization in NLP
已浏览 4592 次
2022年7月30日
YouTube
TechViz - The Data Science Guy
23:07
L27: Byte pair encoding
已浏览 7380 次
2024年12月26日
YouTube
IIT Madras - B.S. Degree Programme
7:23
Word Piece And Byte Pair Encoding (Natural Language Processing at UT Austin)
已浏览 2201 次
2022年4月7日
YouTube
Greg Durrett
12:28
Byte Pair Encoding Word Segmentation
已浏览 6198 次
2021年5月25日
YouTube
AKAdemy
0:22
BPE Explained: Key to LLM Tokenization
已浏览 50 次
2 个月之前
YouTube
NavaDisha
2:57
Byte Pair Encoding Tokenization in NLP
已浏览 9570 次
2022年7月23日
YouTube
TechViz - The Data Science Guy
展开
更多类似内容
反馈