注册并分享邀请链接,可获得视频播放与邀请奖励。

lifcc (@mylifcc) “LLM 底层到底在干什么? 这篇 0xkato 的《How LLMs Actually Work》可能是目前最清晰” — TopicDigg

lifcc 的个人资料封面
lifcc 的头像
lifcc
@mylifcc
每天用 AI 写代码的工程师 Claude Code | Codex深度用户 |Agentic engineering 在这里分享 AI 工具实测和开发者工作流
加入 January 2022
248 正在关注    3.7K 粉丝
LLM 底层到底在干什么? 这篇 0xkato 的《How LLMs Actually Work》可能是目前最清晰的从头讲解现代大模型工作机制的文章了。没有一堆公式,但把 transformer 的每个零件都拆得明明白白。 Step 1: Tokenization(分词) 模型不认识汉字或字母,它只认识数字。 Tokenization 把文本切成词表里的子词片段(subword),映射成整数 ID。 比如 "running" 可能变成 ["run", "ning"]。 好处是能处理新词,平衡效率和覆盖。 小贴士:这就是为什么有些模型数字母会出错——token 边界不是按字符。 3
显示更多
0
4
242
55
转发到社区