Vibe News
反馈
microGPT: Andrej Karpathy 发布的一个非常精简的 GPT 实现 | Vibe News
Vibe News
反馈
microGPT: Andrej Karpathy 发布的一个非常精简的 GPT 实现
(karpathy.github.io)
1 分 ·
@kalasoo
· 5天前 ·
分享
一个 用纯 Python (~200 行代码) 实现的 GPT 模型
不依赖任何深度学习库(没有 PyTorch / TensorFlow 等依赖)
包含 完整算法 — 数据集载入、分词(tokenizer)、模型架构、训练循环、优化器、inference(推理)等全部步骤
主要用于 教学、理解和实验,而不是用于生产级大模型训练。
登录后评论
暂无评论