简单几步，免费微调大语言模型

时间：2024-07-12 10:30:40浏览次数：19

标签：几步 AI 免费模型微调 huggingface 学习 autotrain

我总是受大脑运行方式的启发…大脑收集信息，然后对信息进行加权再输出，问题就在于，怎么调整这些权重使这些信息发挥作用。

—— 杰弗里·辛顿

今天和大家分享下，怎么用开源工具免费微调大模型。

要用到的工具有：

autotrain：huggingface开放的零代码大模型微调平台，无需编程，只需要通过简单的界面操作就能够进行
colab：一个在线交互式Python运行环境，主要是用来提供大模型微调时的云端计算资源

接下来大家按照以下步骤操作，就能快速拥有一个属于自己的大模型

>>>环境部署<<<

AutoTrain部署

1、注册huggingface账号

https://huggingface.co/autotrain

2、登录并创建space

3、填写信息

1）SDK选docker下的autotrain

2）pause on failure 最好填0，不然训练失败这个space就用不了了

4、创建完成后，autotrain就部署好了

Colab部署

1、进入colab，先确认有1个google账号

https://colab.research.google.com/github/huggingface/autotrain-advanced/blob/main/colabs/AutoTrain_ngrok.ipynb

2、点击Hugging Face Write Token，获取需要填写的huggingface_token

3、点击ngrok auth token，获取需要填写的ngrok_token

在这里插入图片描述

4、点击run，等待一下

在这里插入图片描述

5、下方出现这个link后点击，进入autotrain的微调界面

>>>参数调整<<<

1、环境部署完成，正式进入大模型微调环节

2、选择模型，这里以参数较小的qwen2_7B为例

2、上传微调模型用到的数据集

1）text:是指数据集中数据所在列和text之间的映射关系，这里就填数据集中的字段名

2）对于数据集的数据结构，不同的微调方法，对应不同的数据结构，在这里采用SFT，数据格式就要求设计成单列的信息

3、选择参数，可以直接使用默认值。如果要做一些个性化调整，可以参考左侧的documentation使用说明

4、点击start training，进入训练阶段

>>>模型微调<<<

1、回到colab，能看到模型微调的进展。训练时间较长，只要没有出现error信息，模型微调就是在正常运行中

在这里插入图片描述

2、训练完成后，会在huggingface个人主页中展示训练好的模型

在这里插入图片描述

恭喜，到这一步，你已经拥有一个自己的大模型了

如何学习AI大模型？

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

标签：几步,AI,免费,模型,微调,huggingface,学习,autotrain
From： https://blog.csdn.net/2401_84205765/article/details/140372063

企业跨国传输文件的需求如何落地？免费白皮书为你提供解决方案
对于企业而言，各行业数据跨境传输也日趋频繁，由于海外市场对于数据驱动的产品和服务的需求不断增加，为企业拓宽海外市场提供了广阔的市场空间。在全球化的背景下，企业进行有效的资源整合，学习海外市场的先进技术和管理经验，寻找新的增长点，实现业务的多元化和可持续发展，不仅有利于开辟......
【乔二参】省钱又实用：推荐几款优质免费工具
https://gitee.com/qercan/software-sharing非常感谢您的支持！您的点赞、关注和评论是我创作的动力。我会继续努力，提供高质量内容，如有任何建议，请随时与我联系。互联网真是个神奇的宝藏库！今天，我给大家推荐几个超赞的网站，它们既有趣又富有内涵，无论你钟爱哪种兴趣，都能在其中......
MathType7.4.6.8最新免费下载，数学表达神器来袭！
大家好啊，我是爱分享的小能手！今天要给大家安利一款神奇的工具——MathType7.4免费版本。这不仅仅是一个简单的数学公式编辑器，而是你学术写作和数学研究的强大助手，简直是数学爱好者的“瑞士军刀”！MathType最新mac官方版本下载如下:https://wm.makeding.com/iclk/?zoneid=61764......
2024年10款免费的项目管理软件推荐
本文向大家推荐10款2024年免费使用的项目管理软件，其中包括桌面应用和基于Web平台的多种产品，同时还涵盖了一些优秀的开源软件。1.禅道开源项目管理软件禅道是一款开源的、基于Web的项目管理软件，其功能丰富且操作简便，为团队提供了一套完整的项目管理解决方案。该软件不仅具......
（免费领取源码）计算机毕业设计项目：宠物店管理系统 19849（开题答辩+程序定制+全套文案）上
目录摘要1绪论1.1背景及意义1.2研究现状1.3springboot框架介绍2 宠物店管理系统系统分析2.1可行性分析2.2系统流程分析2.2.1数据流程3.3.2业务流程2.3系统功能分析2.3.1功能性分析2.3.2非功能性分析2.4系统用例分析2.5本章小结......
超级好用的设计软件CorelDRAW2024永久免费版下载！
......
（免费领源码）Java/Mysql数据库+09536 SSM爱心捐赠物资维护系统，计算机毕业设计项目推荐上
摘要随着信息技术的快速发展，计算机应用已经进入成千上万的家庭。随着物资数量的增加，物资库存管理也存在许多问题。物资数据的处理量正在迅速增加，原来的手工管理模式不适合这种形式。使用计算机可以完成数据收集、处理和分析，减少人力和物力的浪费。需要建立爱心捐赠物资维护系......
本地 AI RAG 系列之使用 OpenLlama、Postgres、Node.js 和 Next.js 进行 100% 免费矢
简介所以你想尝试向量搜索，但你不想付钱给OpenAI，或者使用Huggingface，也不想付钱给向量数据库公司。我来帮你。让我们在自己的机器上免费开始向量搜索吧。推荐文章《知识图谱大模型系列之01利用KeyBERT、HDBSCAN和Zephyr-7B-Beta构建知识图谱，LLM增强的自然语言处......
超好用！3个免费的运营商API实例
今天推荐几个免费的API，支持在线调用，即便是小白也可轻松操作！敲黑板！！注意听课，建议收藏，非常实用！一、运营商三要素传入姓名+身份证号码+手机号，校验此三项是否一致该接口对移动支付、移动银行及其他各种移动应用都非常适用，可以确认用户身份的真实性有效识别和防止欺诈活动。......
面试官无招可施？【独家秘籍】《大模型面试通关宝典》震撼上市！免费分享
截至目前，国内已发布的大模型数量超过200个，特别是在10亿参数规模以上的大模型，已有报道指出数量已超过100个。这些大模型主要集中在自然语言处理领域，且地域分布上以北京和广东最为突出。随着人工智能技术的迅速发展，这个数字仍在持续增长中，反映出中国在大模型研发领域的强劲势......

简单几步，免费微调大语言模型

如何学习AI大模型？

一、全套AGI大模型学习路线

二、640套AI大模型报告合集

三、AI大模型经典PDF籍

四、AI大模型商业化落地方案

相关文章

赞助商

阅读排行