首页 > 其他分享 >开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100(八)

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机单卡-V100(八)

时间:2024-08-23 14:22:30浏览次数:10  
标签:7b qwen2 LoRA 模型 微调 Qwen2 Instruct 单卡 7B

一、前言

    本篇文章将使用LLaMA-Factory去高效微调(命令和界面方式)QWen2系列模型,通过阅读本文,您将能够更好地掌握这些关键技术,理解其中的关键技术要点,并应用于自己的项目中。


二、术语介绍

2.1. LoRA微调

    LoRA (Low-Rank Adaptation) 用于微调大型语言模型 (LLM)。  是一种有效的自适应策略,它不会引入额外的推理延迟,并在保持模型质量的同时显着减少下游任务的可训练参数数量。

2.2.参数高效微调(PEFT) 

    仅微调少量 (额外) 模型参数,同时冻结预训练 LLM 的大部分参数,从而大大降低了计算和存储成本。

2.3. Qwen2-7B-Instruct

    是通义千问 Qwen2 系列中的一个指令微调模型。它在 Qwen2-7B 的基础上进行了指令微调,以提高模型在特定任务上的性能。

    Qwen2-7B-Instruct 具有以下特点:

  • 强大的性能:在多个基准测试中,Qwen2-7B-Instruct 的性能可与 Llama-3-70B-Instruct 相匹敌。
  • 代码和数学能力提升:得益于高质量的数据和指令微调,Qwen2-7B-Instruct 在数学和代码能力上实现了飞升。
  • 多语言能力:模型训练过程中增加了 27 种语言相关的高质量数据

标签:7b,qwen2,LoRA,模型,微调,Qwen2,Instruct,单卡,7B
From: https://blog.csdn.net/qq839019311/article/details/141391066

相关文章

  • YC327B [ 20240821 CQYC NOIP 模拟赛 T2 ] 括号串(bracket)
    题意给定\(S\in\{(,),?\}\)。定义深度为括号嵌套的子序列的最大长度除以\(2\)。求出将\(?\)替换为括号的所有括号串的深度之和,对\(998244353\)取模。\(n\le10^6\)。Sol考虑如何把每次贡献只计算一次。不难想到在括号的中心点计算。可以发现,若当前左右括号......
  • [ARC177B] Puzzle of Lamps
    [ARC177B]PuzzleofLamps思路首先可以发现这题并没有限制最少操作步骤,于是逆序遍历序列,若要将位置$i$的数字变成$1$(下标从$0$开始),则先执行$i+1$次操作$A$,再执行$i$次操作$B$,这样可以保证只将位置$i$的数字变成$1$。由于是逆序遍历,所以不会影响后面的数字。......
  • Qwen2-Math,新一代数学模型
    原文链接:https://qwenlm.github.io/zh/blog/qwen2-math/友情链接Github:https://github.com/QwenLM/Qwen2-MathHuggingFace:https://huggingface.co/QwenModelScope:https://modelscope.cn/organization/qwenDiscord:https://discord.gg/yPEP2vHTu4......
  • 【案例50】护网行动导致系统锁单卡死
    问题现象顾问在系统监视器中发现了大量的锁,手动解锁无效果。查询数据库发现大量的锁表SELECTl.session_idsid,s.serial#,l.locked_mode锁模式,l.oracle_username,l.os_user_name,s.machine,s.terminal,o.objec......
  • DMS:直接可微的网络搜索方法,最快仅需单卡10分钟 | ICML 2024
    DifferentiableModelScaling(DMS)以直接、完全可微的方式对宽度和深度进行建模,是一种高效且多功能的模型缩放方法。与先前的NAS方法相比具有三个优点:1)DMS在搜索方面效率高,易于使用。2)DMS实现了高性能,可与SOTANAS方法相媲美。3)DMS是通用的,与各种任务和架构兼容。来源:晓飞的算法......
  • 解决启动redis:应用程序无法正常启动(0xc000007b)。请单击“确定”关闭应用程序。
    解决处理方法如下目录方法一......
  • Qwen2-Math 开源 AI 模型发布;阿里云推出首个域名 AI 大模型应用丨 RTE 开发者日报
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但......
  • QWen2-72B-Instruct模型安装部署过程
    最近在给我们的客户私有化部署我们的TorchV系统,客户给的资源足够充裕,借此机会记录下部署千问72B模型的过程,分享给大家!一、基础信息操作系统:Ubuntu22.04.3LTSGPU:A800(80GB)*8内存:1TB二、软件信息Python:3.10Pytorch:2.3.0Transformers:4.43.0vLLM:0.5.0cuda:......
  • C221027B
    B抽\(n\)次卡,连续\(i\)次没有抽中时,第\(i+1\)次抽中的概率是\(p_i\),规定\(p_k=1\),求期望抽中次数.标签:矩阵加速递推,动态规划.暴力:记\(f[i][j]\)表示已经抽了\(i\)次,目前连续\(j\)次不中的期望抽中次数,有转移:\[f[i][j]=f[i-1][j-1]\times(1-p......
  • lora微调qwen2-0.5B
    我们利用复旦新闻数据集进行训练:gitclonehttps://www.modelscope.cn/datasets/swift/zh_cls_fudan-news.gitgitclonehttps://www.modelscope.cn/qwen/Qwen2-0.5B.git安装库pipinstalldatasetspipinstallpeftfromdatasetsimportDatasetimportpandasaspdfro......