首页 > 其他分享 >想转行AI大模型开发但不知如何下手?掌握这四个开源工具,让你领先一步!

想转行AI大模型开发但不知如何下手?掌握这四个开源工具,让你领先一步!

时间:2024-06-19 15:27:43浏览次数:21  
标签:AI 转行 微调 Hugging Face 学习 开源 模型

最近有很多小伙伴问我,之前从事的其他领域的编程,现在想要学习AI大模型开发的相关技能,不知道从哪下手,应该学习些什么,下面四个是我认为从事大模型开发,必须掌握的四个开源工具,大家可以作为参考:

1、Hugging Face(抱抱脸)

Hugging Face是现在最大的AI开源社区,里面提供了很多的预训练模型,是一个模型库,很多人会把自己训练好的模型上传上去,大家可以免费下载使用。下载下来之后,我们就可以在此基础之上,进行微调或者推理,不用从0去训练一个大模型。并且大家可能都知道,微调模型时,数据的准备是一件费时费力的事,而在Hugging Face上也有很多的数据集,可供大家下载使用。所以Hugging Face也被人称作:AI领域的GitHub。

2、PyTorch

现在你从Hugging Face下载了一个模型之后,下一步要开始微调了,此时就需要用到PyTorch了。PyTorch是一个基于Python的开源机器学习库,可以说现在已经成为最流行的机器学习和深度学习框架了,它提供了一套简洁且强大的API,使得模型的构建和操作更加直观,你只需通过几行代码就可以构建自己的大模型。

3、DeepSpeed

在这里插入图片描述

通过上面两步的操作,你已经从Hugging Face上下载了一个模型,用PyTorch写好了微调的代码,现在准备要在服务器上进行训练或微调了,这时候我们就需要用到下面的这个工具了:DeepSpeed。因为大模型在服务器上进行训练或微调时,不可能只在一台服务器上,而DeepSpeed的作用是可以将你的模型快速放在多台服务器上进行并行化的训练或推理,所以你还需要继续完善代码,添加对DeepSpeed的支持。

上面的步骤都完成之后,你可以真正的在服务器上去训练或微调你的大模型了。最后你会得到一个训练或微调后的大模型文件,自己可以推理测试下,看看被你用于微调的数据集,是不是可以被推理出来。

4、LangChain

在这里插入图片描述

大模型被训练后,主要的作用是要用来进行推理。而我们可以开发一些AI应用,去调用大模型完成推理,例如去构建一个结合RAG+LLM的企业内部知识库系统,去开发一个基于AI的聚合搜索引擎,去开发某个领域的AI智能体应用等等。这时候,我们需要用到这个框架:LangChain。LangChain的定位是一个用于构建基于LLM驱动的应用程序开源框架,方便我们快速构建基于LLM的应用程序。里面内置很多API,简化了对大模型的操作。所以如果要基于大模型去开发应用程序,LangChain必不可少。

通过上面介绍的四款开源工具,我们可以从0去构建一个大模型了,并且还可以在此基础上去开发应用程序。我相信,上面这四款工具,现在已经成为了从事AI领域开发从业人员必备的4件套了。

但是上面的四款工具,如果你不是搞大模型的,只是单纯的开发大模型应用程序,掌握LangChain就可以了,无需掌握其他三个。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

#### 一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。
img

四、AI大模型商业化落地方案

img

标签:AI,转行,微调,Hugging,Face,学习,开源,模型
From: https://blog.csdn.net/m0_70486148/article/details/139771666

相关文章

  • 「清新题精讲」UVA 1048 - Low Cost Air Travel
    UVA1048-LowCostAirTravel\(\mathsf{\color{Thistle}{Statement}}\)给定\(n\)张机票和\(q\)次旅行,每张机票都给出飞机所经过的城市,每一次乘座飞机,必须从飞机的起始站开始,且中途不能乘坐其他飞机再回来乘坐该架飞机,但是可以提前离开飞机。对于第\(i\)次旅行,输出一次......
  • AI大模型会如何颠覆手机
    随着人工智能技术的飞速发展,AI大模型在各个领域的应用越来越广泛。手机作为现代人生活中不可或缺的一部分,也将因AI大模型的引入而发生颠覆性的变化。本文将探讨AI大模型在手机上的应用及其带来的深远影响。AI大模型的引入将大幅提升手机的智能化水平。传统的手机智能助手,如Siri、......
  • 掌握异步编程:探索JavaScript中的Promise与async/await
    在现代JavaScript开发中,异步编程已经成为了不可或缺的一部分。为了更好地处理异步操作,JavaScript引入了Promise和async/await两个重要概念。本文将带您了解这两个概念,帮助您掌握异步编程。 PromisePromise是异步编程的一种解决方案,它表示一个异步操作的最终完成(或失败)及其结......
  • 华为 无线控制器 AirEngine9700-M1 AirEngine5760-51 AP供电降档问题
    1故障现象,一台HuaweiSwitchS5720-28TP-PWR-LI-ACpoe交换机接入ap(5760-51)20个,其中一个网口灯不亮,随机拔掉一个AP网线,之前不亮的网口,正常闪亮启动。#AirEngine5760-51满载功率28.8wHuaweiSwitchS5720-28TP-PWR-LI-AC交换机满载功率369w,那明显超载造成的2控制......
  • 龙哥量化:AI时代到来,百度的文心一言能AI选股吗,让AI写一个选股公式20日涨幅>=30%,AI弱智,
    如果您需要代写技术指标公式,请联系我。龙哥QQ:591438821龙哥微信:Long622889选股要求:20日涨幅>=30%首先看我写的HH:=HHV(H,20);LL:=LLV(L,20);HHS:=HHVBARS(H,20);LLS:=LLVBARS(L,20);XG:(HH-LL)/LL*100>30ANDHHS<LLS; 可以在通达信中新建一个条件选股公式验证一......
  • 阿里云PAI大模型评测最佳实践
    作者:施晨、之用、南茵、求伯、一耘、临在背景信息内容简介在大模型时代,随着模型效果的显著提升,模型评测的重要性日益凸显。科学、高效的模型评测,不仅能帮助开发者有效地衡量和对比不同模型的性能,更能指导他们进行精准地模型选择和优化,加速AI创新和应用落地。因此,建立一套平......
  • 一行超长日志引发的 “血案” - Containerd 频繁 OOM 背后的真相
    案发现场:混沌初现2024年6月10日,本应是平静的一天。但从上午9点开始,Sealos公有云的运维监控告警就开始不停地响。北京可用区服务器节点突然出现大量“notready”告警,紧接着,系统自动触发004节点重启,让服务暂时恢复了正常。就在我以为这只是个小插曲的时候,7分钟后,广州可用......
  • 转型AI产品经理(12):“希克定律”如何应用在Chatbot产品中
    信息过载,这个对现代人来说是很常见的问题,信息获取变得越来越便捷的同时,也导致信息过载让我们无法及时做出有效决策,还可能演变成选择困难症。信息过载对用户体验的设计也有着显著的负面影响,如果我们的产品设计让人感觉太多信息,超出用户的认知承受力的话,会给产品带来以下负面的......
  • 转型AI产品经理(13):“峰终定律”如何应用在Chatbot产品中
    峰终定律是心理学中一个关于记忆形成的重要理论,该理论揭示了人们如何记忆过去的体验,特别是那些包含多个环节和情感变化的复杂体验,具体来说,人们在回顾一段体验时,记忆中最鲜明的部分是体验中的高峰和结束时的感受(无论是正面还是负面的)。换句话说,个体对整个体验的整体评价很大程......
  • 打卡信奥刷题(112)用Scratch图形化工具信奥P6181 [普及组][USACO10OPEN] Mountain Watch
    [USACO10OPEN]MountainWatchingS题目描述一天,Bessie望着远处的山脉,在思考:“哪一座山最宽呢?”Bessie设法测量了NNN个位置的高度......