展示HN:LLM工作原理 – 基于Karpathy讲座的交互式视觉指南
Show HN: How LLMs Work – Interactive visual guide based on Karpathy's lecture

原始链接: https://ynarwal.github.io/how-llms-work/

大型语言模型幕后解析:从原始互联网文本到对话助手——基于Andrej Karpathy的技术深度剖析。 训练数据:15万亿 Tokens 参数:4050亿 文本数据:44 TB Token词汇量:10万

相关文章

原文

A Visual Deep Dive

Live LLM Response

Human: What is behind this text box?

A complete walkthrough of how large language models like ChatGPT are built — from raw internet text to a conversational assistant. Based on Andrej Karpathy's technical deep dive.

Training Tokens
15T

Parameters
405B

Text Data
44 TB

Token Vocabulary
100K

联系我们 contact @ memedata.com