Llama2大语言模型在云GPU（AutoDL）上进行训练微调（自定义数据集）

时间：2024-07-13 21:27:56浏览次数：10

标签：AutoDL 定义数据 cognition 模型 Llama2 json Llama self

Llama2是Meta开源的语言大模型，它经过训练的数据集包含2万亿个token。相比Llama，Llama2的上下文长度已经从2048扩展到4096，这使其能够理解和生成更长的文本。Llama2包括了多个模型，分别是7B、13B和70B的模型。

一、准备工作

在autodl平台租用实例（直接搜索，有许多租用教程，建议租用显存大于24G的显卡）
安装需要用的依赖包

Python 3.8+ 
PyTorch 1.13.1+
transformers 4.31.0
peft 0.5.0

二、模型下载

Llama网址：https://github.com/LlamaFamily/Llama-Chinese
下载代码文件，以及Chinese-Llama-2-7b的模型权重，放在项目里。
在这里插入图片描述

1.将模型文件上传AutoDL

将模型文件放在/root/autodl-tmp下
在这里插入图片描述
2.自定义数据集训练微调

在这里插入图片描述
dataset_info.json包含所有数据集的信息，并且需要重新创建一个self_cognition.json文件，self_cognition-base.json为原来的self_cognition.json文件

self_cognition-base.json文件部分数据展示，可以自行修改内容。

标签：AutoDL,定义数据,cognition,模型,Llama2,json,Llama,self
From： https://blog.csdn.net/qq_52062754/article/details/140405934

Springboot自定义数据源DruidDataSource
1、Druid简介Java程序很大一部分要操作数据库，为了提高性能操作数据库的时候，又不得不使用数据库连接池。Druid是阿里巴巴开源平台上一个数据库连接池实现，结合了C3P0、DBCP等DB池的优点，同时加入了日志监控。Druid可以很好的监控DB池连接和SQL的执行情况，天生就是针对监控而......
一文为你深度解析LLaMA2模型架构
本文分享自华为云社区《【云驻共创】昇思MindSpore技术公开课大咖深度解析LLaMA2模型架构》，作者：Freedom123。一、前言随着人工智能技术的不断发展，自然语言处理（NLP）领域也取得了巨大的进步。在这个领域中，LLaMA展示了令人瞩目的性能。今天我们就来学习LLaMA2模型，我们根据昇思M......
Go自定义数据的序列化流程
......
机器视觉入门学习：YOLOV5自定义数据集部署、网络详解、损失函数（学习笔记）
前言源码学习资源：YOLOV5预处理和后处理，源码详细分析-CSDN博客网络学习资源：YOLOv5网络详解_yolov5网络结构详解-CSDN博客YOLOv5-v6.0学习笔记_yolov5的置信度损失公式-CSDN博客本文为个人学习，整合各路大佬的资料进行V5-6.0版本的网络分析，在开始学习之前最好先去学习YOL......
Llama2的安装部署运行Atom模型的操作步骤
一、Llama2的安装部署操作步骤1.1、docker环境的使用说明：根据服务器部署的环境来分析，由于此服务器为多人使用，且不相互影响，故此服务器需要进行自己的docker环境下，如果是自己部署那么本身便不存在docker直接滤过1.1即可。1.1.1、启用docker环境服务器环境执行dockerrun-i......
实战 | YOLOv10 自定义数据集训练实现车牌检测 (数据集+训练+预测保姆级教程)
导读本文主要介绍如何使用YOLOv10在自定义数据集训练实现车牌检测(数据集+训练+预测保姆级教程)。 YOLOv10简介 YOLOv10是清华大学研究人员在UltralyticsPython包的基础上，引入了一种新的实时目标检测方法，解决了YOLO以前版本在后处理和模型架构方面的不足......
一文看懂llama2（原理&模型&训练）
自从Transformer架构问世以来，大型语言模型（LargeLanguageModels,LLMs）以及AIGC技术的发展速度惊人，它们不仅在技术层面取得了重大突破，还在商业应用、社会影响等多个层面展现出巨大潜力。随着ChatGPT的推出，这一技术日益走进大众视野，这也预示着一个由生成式AI塑造的未来正在加速......
NeMo训练llama2_7b(不用NeMo-Framework-Launcher)
@TOC本文介绍了NeMo如何训练llama2_7b模型1.参考链接支持的模型列表功能特性LLAMA2端到端流程(基于NeMo-Framework-Launcher)2.创建容器dockerrun--gpusall--shm-size=32g-ti-eNVIDIA_VISIBLE_DEVICES=all\--privileged--net=host-v$PWD:/home\......
使用自定义数据训练 YOLOv10
节前，我们星球组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、参加社招和校招面试的同学。针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。合集：持续火爆！！！《AIGC面试宝典》已圈粉无......
1.1k Star！天工Skywork-13B：性能全面超越LLaMA2、0门槛商用、消费级显卡进行部署和推理！
原文链接：（更好排版、视频播放、社群交流、最新AI开源项目、AI工具分享都在这个公众号！）1.1kStar！天工Skywork-13B：性能全面超越LLaMA2、0门槛商用、消费级显卡进行部署和推理！......

Llama2大语言模型在云GPU（AutoDL）上进行训练微调（自定义数据集）

一、准备工作

二、模型下载

相关文章

赞助商

阅读排行