针对特定领域较小的语言模型是否与较大的模型同样有效?

时间：2024-01-22 09:33:23浏览次数：29

经过2023年的发展，大语言模型展示出了非常大的潜力，训练越来越大的模型成为有效性评估的一个关键指标，论文《A Comparative Analysis of Fine-Tuned LLMs and Few-Shot Learning of LLMs for Financial Sentiment Analysis》中，作者全面分析了微调大语言模型(llm)及其在金融情绪分析中的零样本和少样本的能力。

作者通过使用两种方法来探索金融情绪分析背景下的潜力和适用性:

在特定的领域（金融领域）的数据集上，使用小语言模型进行微调，作者测试了250M到3B参数各种模型
以gpt-3.5 turbo为重点的情境学习

作者还将结果与SOTA(最先进的)模型进行比较以评估其性能，我们看看小模型是否还同样有效。

论文证明了以下观点:

微调较小的llm可以达到与SOTA微调llm相当的性能。
零样本和少样本学习的的性能与经过微调的小型llm相当。
增加上下文学习中的样本数量并不一定会提高情感分析任务的性能。
微调较小的llm会降低成本和提高计算效率。

作者专注于使用QLoRa (Quantized low - rank - adaptive)机制对FLAN-T5模型进行微调。使用财务特定数据集，研究了3种尺寸:Flan-T5 base (250M)， Flan-T5 large (780M)和Flan-T5-xl (3B参数)。

https://avoid.overfit.cn/post/c9d9a74fd94444189283a1b3d31f6b28

标签：微调,语言,模型,T5,样本,特定,llm,Flan
From： https://www.cnblogs.com/deephub/p/17979294

fwrite、fread——《初学C语言第59天》
////————————fwrite//#include<stdio.h>//structS//{// chararr[10];// intage;// floatscore;//};//intmain()//{// structSs={"zhangjie",25,50.25};// //以二进制的形式写到文件中// FILE*pf=fopen("text.txt","wb");//......
【Qt之模型视图】5. Qt库提供的视图便捷类
1.前言Qt提供了一些便捷的视图类，如QListWidget提供项目列表，QTreeWidget显示多级树结构，QTableWidget提供单元格项的表格。每个类都继承了QAbstractItemView类的行为，QAbstractItemView类实现了项目选择和标题管理的通用行为。这三个类使用起来方便，但适合于少量数据的存储与显示(存......
【C语言初阶篇】结构体知识点的全面讲解！
<br><br/><center><fontcolor="#006666">......
Go语言核心36讲 38 | bytes包与字节串操作（上）
我相信，经过上一次的学习，你已经对strings.Builder和strings.Reader这两个类型足够熟悉了。我上次还建议你去自行查阅strings代码包中的其他程序实体。如果你认真去看了，那么肯定会对我们今天要讨论的bytes代码包，有种似曾相识的感觉。前导内容：bytes.Buffer基础知识strings包和b......
Go语言核心36讲 37 | strings包与字符串操作
在上一篇文章中，我介绍了Go语言与Unicode编码规范、UTF-8编码格式的渊源及运用。Go语言不但拥有可以独立代表Unicode字符的类型rune，而且还有可以对字符串值进行Unicode字符拆分的for语句。除此之外，标准库中的unicode包及其子包还提供了很多的函数和数据类型，可以帮助我们解析各......
Go语言核心36讲 42 | bufio包中的数据类型（上）
今天，我们来讲另一个与I/O操作强相关的代码包bufio。bufio是“bufferedI/O”的缩写。顾名思义，这个代码包中的程序实体实现的I/O操作都内置了缓冲区。bufio包中的数据类型主要有：Reader；Scanner；Writer和ReadWriter。与io包中的数据类型类似，这些类型的值也都需要在初始化的时......
Go语言核心36讲 41 | io包中的接口和工具（下）
上一篇文章中，我主要讲到了io.Reader的扩展接口和实现类型。当然，io代码包中的核心接口不止io.Reader一个。我们基于它引出的一条主线，只是io包类型体系中的一部分。我们很有必要再从另一个角度去探索一下，以求对io包有更加全面的了解。下面的一个问题就与此有关。知识扩展问题：i......
Go语言核心36讲 40 | io包中的接口和工具（上）
我们在前几篇文章中，主要讨论了strings.Builder、strings.Reader和bytes.Buffer这三个数据类型。知识回顾还记得吗？当时我还问过你“它们都实现了哪些接口”。在我们继续讲解io包中的接口和工具之前，我先来解答一下这个问题。strings.Builder类型主要用于构建字符串，它的指针类型......
Go语言核心36讲 44 | 使用os包中的API （上）
我们今天要讲的是os代码包中的API。这个代码包可以让我们拥有操控计算机操作系统的能力。前导内容：os包中的API这个代码包提供的都是平台不相关的API。那么说，什么叫平台不相关的API呢？它的意思是：这些API基于（或者说抽象自）操作系统，为我们使用操作系统的功能提供高层次的支持，但是，......
Go语言核心36讲 43 | bufio包中的数据类型（下）
你好，我是郝林，我今天继续分享bufio包中的数据类型。在上一篇文章中，我提到了bufio包中的数据类型主要有Reader、Scanner、Writer和ReadWriter。并着重讲到了bufio.Reader类型与bufio.Writer类型，今天，我们继续专注bufio.Reader的内容来进行学习。知识扩展问题：bufio.Reader类型读......

针对特定领域较小的语言模型是否与较大的模型同样有效?

相关文章

赞助商

阅读排行