LLaMA模型微调版本：斯坦福 Alpaca 详解

时间：2023-06-28 12:57:29浏览次数：46

标签：Alpaca text Self 斯坦福生成 instruct 指令 LLaMA

项目代码：https://github.com/tatsu-lab/stanford_alpaca

博客介绍：https://crfm.stanford.edu/2023/03/13/alpaca.html

Alpaca 总览

Alpaca 是 LLaMA-7B 的微调版本，使用Self-instruct[2]方式借用text-davinct-003构建了52K的数据，同时在其构建策略上做了一些修改。

性能上作者对Alpaca进行了评估，与openai的text-davinct-003模型在self-instruct[2]场景下的性能表现相似。所以比起成本来看，Alpaca更便宜。

text-davinct-003 与 chatGPT 同为 gpt3.5模型之一，比GPT-3模型 curie、babbage、ada 模型更好的质量、更长的输出和一致的指令遵循来完成任何语言任务

整体思路如下图

基于 Self-instruct 的数据生成

Self-instruct

Self-instruct是一个利用LLM来生成指令遵循数据来指令微调模型的框架，核心贡献是生成指令遵循数据。

指令数据由指令、输入、输出组成。作者的数据生成piple包含四个步骤：

1）生成任务指令，

2）确定指令是否代表分类任务，方便3区别

3）正常任务使用输入优先方法，分类任务使用输出优先的prompt指令方法生成实例

4）过滤低质量的数据。

详细的Self-instruct可以看我别的文章。

Alpaca

Alpaca基于self-instruct，

改用GPT-3.5：text-davinci-003来生成指令数据（self-instruct使用的GPT-3：davinci）
指令生成时使用新的prompt，直接一次性生成20个任务的指令（self-instruct是迭代生成的，更费钱）
指令生成不区分分类/非分类任务，可能是GPT3.5更好，不需要区别了。
每个指令只生成1个实例。

最终的结果是以少于$500的便宜价格获得了52K的数据，下图反映了其数据多样性，内圈是词根是动词的指令，外圈是表示目标的指令。

标签：Alpaca,text,Self,斯坦福,生成,instruct,指令,LLaMA
From： https://www.cnblogs.com/chengnan113/p/17511100.html

LLaMA模型微调版本 Vicuna 和 Stable Vicuna 解读
Vicuna和StableVicuna都是LLaMA的微调版本，均遵循CCBY-NC-SA-4.0协议，性能方面Stable版本更好些。CCBY-NC-SA-4.0是一种知识共享许可协议，其全称为"署名-非商业性使用-相同方式共享4.0国际"。即用的时候要署名原作者，不能商用，下游使用也必须是相同的共享原则。VicunaVicun......
本地部署开源大模型的完整教程：LangChain + Streamlit+ Llama
在过去的几个月里，大型语言模型(llm)获得了极大的关注，这些模型创造了令人兴奋的前景，特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm)是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使用广泛的数据集进行训练，这......
吴恩达-斯坦福CS229机器学习课程-2017（秋）最新课程分享
吴恩达主讲的机器学习-2017年秋季课程已经开课啦，今天跟大家分享这套课程。课程介绍本课程主要介绍机器学习和统计模式识别相关的知识。内容主要包括：监督学习（生成/判别学习，参数/非参数学习，神经网络，支持向量机）；无监督学习（聚类，维数规约，核方法）；学习理论（偏差/方差权衡；VC理论；大边缘概率......
斯坦福2020年免费新课-CS221人工智能原理与技术-视频、ppt、参考书籍分享
分享一套斯坦福大学在2020年初，2019年底放出一门免费精品课程-人工智能原理与技术课程，对于对于春节想要系统学习人工智能知识朋友绝对不容错过。课程介绍这门课主要讲什么？网络搜索、语音识别、人脸识别、机器翻译、自动驾驶和自动调度有什么共同之处呢？这些都是复杂......
MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT
MosaicML正在推出其第二个开源大型语言模型（LLM），称为MPT-30B，这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义，我采访了MosaicML联合创始人兼首席执行官NaveenRao。他之前的创业公司是Nervana，这是一家深度学习公司，于2016年被英特尔收购，所以他最近......
MosaicML 推出 30B 模型 — 挑战 LLaMA、Falcon 和 GPT
MosaicML正在推出其第二个开源大型语言模型（LLM），称为MPT-30B，这是继五月份首次推出的较小的MPT-7B模型之后。为了讨论新模型及其对开发人员的意义，我采访了MosaicML联合创始人兼首席执行官NaveenRao。他之前的创业公司是Nervana，这是一家深度学习公司，于2016年被英特尔收购，所以他最近......
双语斯坦福CS224W-图机器学习
课程描述这门课是关于什么的？复杂的数据可以表示为对象之间的关系图。这种网络是社会、技术和生物系统建模的基本工具。本课程着重于大量图形分析的计算、算法和建模挑战。通过研究底层的图结构及其特征，学生们学习机器学习技术和数据挖掘工具，这些工具能够揭示各种网络的底层知识。主......
斯坦福大学新课CS224W-2019-图网络机器学习算法-视频及ppt资源分享
课程内容介绍网络是建模复杂的社会，技术和生物系统的基本工具。结合在线社交网络的出现和生物科学中大规模数据的可用性，本课程着重分析大型网络，这些大型网络提出了一些计算，算法和建模方面的挑战。通过学习他们的底层网络结构和连接关系，向学生介绍了机器学习技术和数据挖掘工......
斯坦福大学李飞飞团队新作：孪生掩码自编码器SiamMAE，刷榜视觉自监督方法
前言只需一个简单操作扩展MAE，即可实现自监督学习新sota！本文转载自新智元仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。CV各大方向专栏与各个部署框架最全教程整理【CV技术指南】CV全栈指......
ChatDoctor：一个基于微调LLaMA模型用于医学领域的医学聊天机器人
ChatDoctor：一个基于微调LLaMA模型用于医学领域的医学聊天机器人https://www.yunxiangli.top/ChatDoctor/资源列表Demo.自动聊天医生与疾病数据库演示。HealthCareMagic-100k.100k患者和医生之间的真实的对话HealthCareMagic.com。icliniq-10k.患者和医生之间的真实的对话来自......

LLaMA模型微调版本：斯坦福 Alpaca 详解

Alpaca 总览

基于 Self-instruct 的数据生成

Self-instruct

Alpaca

相关文章

赞助商

阅读排行