MiniMind：已开源！只要3小时就能训练一个26M的大模型，教程非常清晰我感觉我又行了！

很多人都觉得训练大模型是个很难的事情，包括大部分的程序员自己也搞不出来。而且百亿参数个人设备也达不到训练的要求。
MiniMind的开源，恰好是解决了这个问题。让有一点代码基础的人都能很快训练出自己的大模型，注意，是从0开始训练，不是微调。
只需要3小时，就能从0训练一个26M参数的大模型，模型大小是GPT3的1/7000，而且最低最低2G显卡就能推理。
作者说：“这是一个既是开源项目，又是入门LLM教程，同时也是一个初具雏形的开源模型，希望能起到抛砖引玉的作用。”
项目简介
MiniMind 是一个轻量级的大语言模型项目，让用户可以在个人设备上快速训练和运行GPT模型。该项目可以使用极小的数据和计算资源，在3小时内训练出一个26M的模型，使大模型技术使用更加简单。MiniMind 支持单机单卡和多卡训练，兼容多个流行的框架，并提供完整的代码和文档支持，帮助初学者和研究者快速上手并进行定制和扩展。

MiniMind现在总共有5个模型，最小的是26M，已经有不错的对话能力了。