原文的评论中有人说提了这篇文章:《Inside the Transformer: The Life of a Token》
如果看完了原帖这篇文章,可以当这篇文章的进阶版,可以更深的了解,文章详细追踪一个 Token 在现代 Transformer 中的完整前向传播过程,有很多实战实现细节。
图做的很好,而且很丰富,很多细节,结合真实模型讲解,干货很多,但是难度高一些,适合有一定基础的朋友
显示更多
分享一篇文章:《How LLMs Actually Work》
好像是前几天 HackerNews 排名第一来着,类似的文章很多,但是这篇深入浅出和直观的例子非常适合有一定编程但没深入学Transformer的人阅读,里面的比喻也恰当,一看就是活人写的,没什么 AI 味道。
最近重新爱上了写东西,写了两篇技术文章,之后还会继续写,而且我的一个原则,活人写,绝对不用 AI,写作是一种乐趣,梳理逻辑,表达观点,不要让这种乐趣被 AI 剥夺。
显示更多