首页 > 其他分享 >llama-factory fine-tuning 4 (mixtral fine-tuning)

llama-factory fine-tuning 4 (mixtral fine-tuning)

时间:2023-12-19 09:34:12浏览次数:28  
标签:tuning -- fine train steps mixtral

introduction

fine-tuning

command

click to view the code
CUDA_VISIBLE_DEVICES=0 python src/train_bash.py \
    --stage sft \
    --do_train \
    --model_name_or_path ../Mixtral-8x7B-v0.1/ \
    --dataset alpaca_en \
    --template mistral \
    --quantization_bit 4 \
    --lora_target q_proj,v_proj \
    --output_dir ../FINE/mixtral-alpaca_data_en_52k \
    --overwrite_cache \
    --per_device_train_batch_size 4 \
    --gradient_accumulation_steps 4 \
    --lr_scheduler_type cosine \
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate 5e-5 \
    --num_train_epochs 3.0 \
    --plot_loss \
    --fp16

标签:tuning,--,fine,train,steps,mixtral
From: https://www.cnblogs.com/ldzbky/p/17912887.html

相关文章

  • RefineNet: Multi-path Refinement Networks for High-Resolution Semantic Segmentat
    RefineNet:Multi-pathRefinementNetworksforHigh-ResolutionSemanticSegmentation*Authors:[[GuoshengLin]],[[AntonMilan]],[[ChunhuaShen]],[[IanReid]]DOI:10.1109/CVPR.2017.549Locallibrary初读印象comment::(RefineNet)一种多路径的用于高分......
  • 高性能Mixtral:467亿参数MoE技术,逼近GPT-3.5与GPT-4
    模型简介近日,MistralAI团队发布了全新的大型语言模型——Mixtral8x7B。这款以稀疏专家混合模型(SparseMixture-of-Experts,简称SMoE)为基础的语言模型,拥有467亿个参数,是当前市场上最强大的开源权重模型之一。不仅如此,Mixtral8x7B还在Apache2.0许可下开源,为开发者社区提供了一个全......
  • RS232转profinet网关扫码枪自由口与1500程序对比
    RS232转profinet网关扫码枪自由口与1500程序对比RS232转profinet网关(XD-PNR200)自由口是一种用于将RS232串口信号转换为profinet协议的设备,它具有自由口的功能。本文以某自动化生产线为例进行案例研究。通过RS232转Profinet网关(XD-PNR200),将生产线的多个RS232扫码枪与PLC连接起来,......
  • Modbus和Profinet通信协议简介
    Modbus和Profinet通信协议简介Modbus是一种通信协议,广泛应用于工业自动化领域。它通过串口或以太网等物理介质实现设备间的数据交换。Modbus采用主从结构,主设备负责发起通信请求,从设备则负责响应请求并提供数据。Modbus具有简单、可靠、易于实现的特点,被广泛用于传感器、执行器、P......
  • Modbus转Profinet网关的配置步骤和注意事项
     Modbus转Profinet网关的配置步骤和注意事项当拿到Modbus转Profinet网关(XD-MDPN100/200)不会配置或是配置完成后发现Modbus转Profinet网关(XD-MDPN100/200)与设备通讯不上等问题。下面就这些问题给大家详细解读。 首先,确保Modbus转Profinet网关(XD-MDPN100/200)的电源连接正常。检......
  • modbus转profinet网关连接6台232modbus伺服同时控制案例
    modbus转profinet网关连接6台232modbus伺服同时控制案例Modbus转Profinet网关是一种用于连接不同网络之间的通讯设备。它的原理是通过将Modbus协议转换为Profinet协议,实现Modbus设备与Profinet网络之间的数据交换。其功能具体包括将Modbus设备发送的数据转发到Profinet网络中,并将P......
  • 如何理解 SAP UI5 的 sap.ui.define 函数?
    我们在SAPUI5官网能查到sap.ui.define的详细文档:在一个JavaScript文件中,通常和建议的做法是在文件顶部有一个对sap.ui.define的调用。当通过其模块ID首次请求一个模块时,会根据ID和当前配置来确定对应的资源。该资源将被加载并执行,这将反过来执行顶级的sap.ui.define......
  • 工业生产中Profibus主站转Profinet网关优势所在
    应用案例分享:某制造企业拥有一条生产线,生产线上的多个设备之间需要进行数据通讯和相互控制。这些设备原本使用Profibus-DP总线进行通讯,但企业希望将这些设备集成到Profinet网络中,以便能够更好地实现设备监控和管理。我们为此提供了一款Profibus-DP主站转Profinet网关,将多个Profibu......
  • Fine-tuning: 一种针对大模型的优化策略
    在自然语言处理(NLP)领域,预训练模型已成为一种强大的工具,但其效果往往受到诸多因素的限制,包括模型大小、任务类型以及数据集等。针对这些问题,各种优化方法如微调(fine-tuning)、prompting等被相继提出。本文将深度解析P-tuningv2为何对大模型有效,主要体现在以下几个方面:一、连续提示的......
  • vite5报错Uncaught ReferenceError: require is not defined的代替方案
    constfiles=import.meta.glob('./*.js',{eager:true})//会得到一个对象注意引入路径里绝对不能带有变量,会报错//{eager:true}是定义是否同步引入的参数,去掉会得到几个异步函数,根据自己的需求写就行了console.log(files["./env."+import.meta.env.MODE+".js"].default......