首页 > 其他分享 >简单几步,免费微调大语言模型

简单几步,免费微调大语言模型

时间:2024-07-12 10:30:40浏览次数:19  
标签:几步 AI 免费 模型 微调 huggingface 学习 autotrain

我总是受大脑运行方式的启发…大脑收集信息,然后对信息进行加权再输出,问题就在于,怎么调整这些权重使这些信息发挥作用。

—— 杰弗里·辛顿

今天和大家分享下,怎么用开源工具免费微调大模型。

要用到的工具有:

  • autotrain:huggingface开放的零代码大模型微调平台,无需编程,只需要通过简单的界面操作就能够进行
  • colab:一个在线交互式Python运行环境,主要是用来提供大模型微调时的云端计算资源

接下来大家按照以下步骤操作,就能快速拥有一个属于自己的大模型

>>>环境部署<<<

AutoTrain部署

1、注册huggingface账号

https://huggingface.co/autotrain

图片

2、登录并创建space

图片

3、填写信息

1)SDK选docker下的autotrain

2)pause on failure 最好填0,不然训练失败这个space就用不了了

图片

图片

4、创建完成后,autotrain就部署好了

图片

Colab部署

1、进入colab,先确认有1个google账号

https://colab.research.google.com/github/huggingface/autotrain-advanced/blob/main/colabs/AutoTrain_ngrok.ipynb

2、点击Hugging Face Write Token,获取需要填写的huggingface_token

图片

图片

3、点击ngrok auth token,获取需要填写的ngrok_token

图片

在这里插入图片描述

4、点击run,等待一下

在这里插入图片描述

5、下方出现这个link后点击,进入autotrain的微调界面

图片

>>>参数调整<<<

1、环境部署完成,正式进入大模型微调环节

图片

2、选择模型,这里以参数较小的qwen2_7B为例

图片2、上传微调模型用到的数据集

图片

1)text:是指数据集中数据所在列和text之间的映射关系,这里就填数据集中的字段名

2)对于数据集的数据结构,不同的微调方法,对应不同的数据结构,在这里采用SFT,数据格式就要求设计成单列的信息

3、选择参数,可以直接使用默认值。如果要做一些个性化调整,可以参考左侧的documentation使用说明

图片

4、点击start training,进入训练阶段

图片

>>>模型微调<<<

1、回到colab,能看到模型微调的进展。训练时间较长,只要没有出现error信息,模型微调就是在正常运行中

在这里插入图片描述

2、训练完成后,会在huggingface个人主页中展示训练好的模型

在这里插入图片描述

恭喜,到这一步,你已经拥有一个自己的大模型了

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

标签:几步,AI,免费,模型,微调,huggingface,学习,autotrain
From: https://blog.csdn.net/2401_84205765/article/details/140372063

相关文章

  • 企业跨国传输文件的需求如何落地?免费白皮书为你提供解决方案
    对于企业而言,各行业数据跨境传输也日趋频繁,由于海外市场对于数据驱动的产品和服务的需求不断增加,为企业拓宽海外市场提供了广阔的市场空间。在全球化的背景下,企业进行有效的资源整合,学习海外市场的先进技术和管理经验,寻找新的增长点,实现业务的多元化和可持续发展,不仅有利于开辟......
  • 【乔二参】省钱又实用:推荐几款优质免费工具
    https://gitee.com/qercan/software-sharing非常感谢您的支持!您的点赞、关注和评论是我创作的动力。我会继续努力,提供高质量内容,如有任何建议,请随时与我联系。互联网真是个神奇的宝藏库!今天,我给大家推荐几个超赞的网站,它们既有趣又富有内涵,无论你钟爱哪种兴趣,都能在其中......
  • MathType7.4.6.8最新免费下载,数学表达神器来袭!
    大家好啊,我是爱分享的小能手!今天要给大家安利一款神奇的工具——MathType7.4免费版本。这不仅仅是一个简单的数学公式编辑器,而是你学术写作和数学研究的强大助手,简直是数学爱好者的“瑞士军刀”!MathType最新mac官方版本下载如下:https://wm.makeding.com/iclk/?zoneid=61764......
  • 2024年10款免费的项目管理软件推荐
    本文向大家推荐10款2024年免费使用的项目管理软件,其中包括桌面应用和基于Web平台的多种产品,同时还涵盖了一些优秀的开源软件。1.禅道开源项目管理软件禅道是一款开源的、基于Web的项目管理软件,其功能丰富且操作简便,为团队提供了一套完整的项目管理解决方案。该软件不仅具......
  • (免费领取源码)计算机毕业设计项目:宠物店管理系统 19849(开题答辩+程序定制+全套文案 )上
    目 录摘要1绪论1.1背景及意义1.2研究现状1.3springboot框架介绍2 宠物店管理系统系统分析2.1可行性分析2.2系统流程分析2.2.1数据流程3.3.2业务流程2.3系统功能分析2.3.1功能性分析2.3.2非功能性分析2.4系统用例分析2.5本章小结......
  • 超级好用的设计软件CorelDRAW2024永久免费版下载!
    ......
  • (免费领源码)Java/Mysql数据库+09536 SSM爱心捐赠物资维护系统,计算机毕业设计项目推荐上
    摘要随着信息技术的快速发展,计算机应用已经进入成千上万的家庭。随着物资数量的增加,物资库存管理也存在许多问题。物资数据的处理量正在迅速增加,原来的手工管理模式不适合这种形式。使用计算机可以完成数据收集、处理和分析,减少人力和物力的浪费。需要建立爱心捐赠物资维护系......
  • 本地 AI RAG 系列之 使用 OpenLlama、Postgres、Node.js 和 Next.js 进行 100% 免费矢
    简介所以你想尝试向量搜索,但你不想付钱给OpenAI,或者使用Huggingface,也不想付钱给向量数据库公司。我来帮你。让我们在自己的机器上免费开始向量搜索吧。推荐文章《知识图谱大模型系列之01利用KeyBERT、HDBSCAN和Zephyr-7B-Beta构建知识图谱,LLM增强的自然语言处......
  • 超好用!3个免费的运营商API实例
    今天推荐几个免费的API,支持在线调用,即便是小白也可轻松操作!敲黑板!!注意听课,建议收藏,非常实用!一、运营商三要素传入姓名+身份证号码+手机号,校验此三项是否一致该接口对移动支付、移动银行及其他各种移动应用都非常适用,可以确认用户身份的真实性有效识别和防止欺诈活动。......
  • 面试官无招可施?【独家秘籍】《大模型面试通关宝典》震撼上市!免费分享
    截至目前,国内已发布的大模型数量超过200个,特别是在10亿参数规模以上的大模型,已有报道指出数量已超过100个。这些大模型主要集中在自然语言处理领域,且地域分布上以北京和广东最为突出。随着人工智能技术的迅速发展,这个数字仍在持续增长中,反映出中国在大模型研发领域的强劲势......