网站首页
编程语言
数据库
系统相关
其他分享
编程问答
thy
2024-11-17
从零开始的 LLM: nanoGPT 学习笔记(2/2)
上篇:从零开始的LLM:nanoGPT学习笔记(1/2)尝试了完整的训练的过程,nanoGPT仓库中还有复现GPT2的代码,可惜对计算资源要求太高(基于OpenWebText数据集,8卡A100,训练4天),不是个人电脑玩的转了,只能跳过这一步,尝试后面的finetuning。finetuning1.训练数据跟pre-train一样