首页 > 其他分享 >聊聊ShareGPT格式的微调数据集

聊聊ShareGPT格式的微调数据集

时间:2024-03-25 10:13:27浏览次数:25  
标签:function price 函数调用 ShareGPT discount call 聊聊 格式

转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

概述

ShareGPT格式的数据集中,一般是如下格式:

[
  {
    "conversations": [
      {
        "from": "human",
        "value": "I saw a dress that I liked. It was originally priced at $200 but it's on sale for 20% off. Can you tell me how much it will cost after the discount?"
      },
      {
        "from": "function_call",
        "value": "{\"name\": \"calculate_discount\", \"arguments\": {\"original_price\": 200, \"discount_percentage\": 20}}"
      },
      {
        "from": "observation",
        "value": "{\"discounted_price\": 160}"
      },
      {
        "from": "gpt",
        "value": "The dress will cost you $160 after the 20% discount."
      }
    ],
    "system": "系统提示词(选填)",
    "tools": "[{\"name\": \"calculate_discount\", \"description\": \"Calculate the discounted price\", \"parameters\": {\"type\": \"object\", \"properties\": {\"original_price\": {\"type\": \"number\", \"description\": \"The original price of the item\"}, \"discount_percentage\": {\"type\": \"number\", \"description\": \"The percentage of discount\"}}, \"required\": [\"original_price\", \"discount_percentage\"]}}]"
  }
]

function_call表示函数调用,什么是函数调用?其作用是什么?
由于大模型的数据一般都是截止于某个时间点之前的数据,不具备实时性。比如,我要问今天的天气,正常来说,由于模型参数的局限性,是不会知道的。但基于函数调用的功能,就解决了这个问题。
所谓的function_call,在某个程度来说,可以理解为API调用,这个API就是一个function,提供了某种功能。
observation表示观测结果,即function_call的执行结果。
tools表示工具,即对function_call的总结描述。

observation并不是新词汇,对于HMM模型如果有了解的话,在其模型算法的表述中,也有着observation的相关引用。

ShareGPT格式简单明了而且结构强大,不仅仅轻易的支持单轮对话、多轮对话;还引入了强大的函数调用,支持功能扩展。

扩展

function_call的设计引申出来,可以对应到业务开发中的规则引擎、脚本引擎等设计。譬如,支持在json参数的格式中,传入JS脚本参数,做一些强大的运算等。在原有的参数格式中,引入强大的函数调用支持。
如何在聊天模型中调用函数(Function Calling)--金融大模型知识库实战(十六)
大模型开发 - 一文搞懂 Function Calling(函数调用)

转载请注明住处:https://www.cnblogs.com/zhiyong-ITNote

首发于个人公众号
image

标签:function,price,函数调用,ShareGPT,discount,call,聊聊,格式
From: https://www.cnblogs.com/zhiyong-ITNote/p/18093770

相关文章

  • 聊聊功率器件(氮化镓,碳化硅)
    氮化镓和碳化硅是两种具有独特性质和广泛应用的无机物。下面将尽可能详细地解释它们的定义、应用、研究热点以及对我们的价值。1,氮化镓氮化镓(GaN)是一种由氮和镓元素组成的化合物,具有直接能隙的半导体特性。其结构类似于纤锌矿,硬度很高,并且具有宽带隙、高热导率以及稳定的化学......
  • Apache Hudi从零到一:存储格式初探
    在花了大约4年时间致力于ApacheHudi(其中包括3年Committer身份)之后,我决定开始这个博客系列,旨在以有组织且适合初学者的方式展示Hudi的设计和用法。我的目标是确保对分布式数据系统有一定了解的人能够轻松地理解该系列。该系列将包含10篇文章,每篇文章都会深入探讨Hudi......
  • 工业相机里面图像数据格式mono8,packetedmono10是什么意思,还有color是什么意思?
    mono8,即存储下来的图像为单色,8Bit的图片,一般是bmp,jpeg等。packedmono10,即存储下来的图片为单色,10Bit的图片,但是一般都是存储为16Bit图片,packed存储即将10Bit的数据以16Bit的方式填充,剩余的本应填充为0的6个bit被下一帧图片数据填充,这****样做可以减少数据量和数据冗余度,节省空......
  • shell检测文件是windows格式还是unix
    Shell可以检测文件是Windows格式还是Unix格式。有多种方法可以实现这一目的。一种常用的方法是使用cat命令结合-A选项来查看文件的特殊字符。在Unix或Linux系统中,如果文件的行尾是以^M$结束的,那么它就是Windows(DOS)格式,因为^M代表回车符(\r)。而如果行尾只是以$结束,那么它就是Unix格......
  • windows txt怎么转成unix 格式
    将Windows格式的txt文件转换为Unix格式,你可以采取以下几种方法:方法一:使用Notepad++打开Notepad++软件。在菜单栏中,点击“编辑”选项。在下拉菜单中,选择“文档格式转换”。在弹出的子菜单中,选择“转换为UNIX格式”。方法二:使用sed命令打开命令提示符(CMD)或PowerShell。使......
  • c# 调用ImageMagick实现HEIC格式的图片转成jpg
    nuget安装Magick.NET-Q8-AnyCPU我项目Framework未4.5.1这安装的7.17.0版本的包:程序集引用:usingImageMagick;ConvertHeicToJpg方法转换代码如下:点击查看代码///<summary>///Heic转ToJpg///</summary>///<paramname="heicPath......
  • Pr软件支持什么视频格式?可以导入哪些格式的视频素材文件
    某些文件扩展名(如MOV、AVI和MXF)是指容器文件格式,而不是特定的音频、视频或图像数据格式。容器文件可以包含使用各种压缩和编码方案编码的数据。PremierePro可以导入这些容器文件,但是否能导入其中包含的数据,则取决于安装的编解码器(尤其是解码器)。支持的序列、静止图像......
  • CanvasRenderingContext2D: setLineDash() method格式说明
    定义setLineDash(segments)segments一个数组,用于指定交替绘制直线和间隙的距离(以坐标空间单位表示)。如果数组中元素的个数是奇数,数组中的元素会被复制并连接起来。例如,[5,15,25]将变成[5,15,25,5,15,25]。如果数组为空,破折号列表将被清除,行描边将恢复为实线。例子......
  • 让IIS支持flv,mkv等未知格式
    让IIS支持flv,mkv等未知格式2011年08月19日 作者 hkshadow要为特定扩展名定义MIME类型,请按照下列步骤操作:打开IISMicrosoft管理控制台(MMC),右键单击本地计算机名称,然后单击“属性”。单击“MIME类型”。单击“新建”。在“扩展名”框中,键入所需的文件扩展名(例如,.MKV)。......
  • Nginx配置搭建m3u8格式的视频播放服务
    Nginx配置搭建m3u8格式的视频播放服务 本文采用Nginx+FFmpeg来进行m3u8格式的视频播放服务,解决:nginx如何搭建视频服务器,要求流媒体服务,视频hls分片加载FFmpeg概念介绍FFmpeg是一个开源的计算机程序,可以用来记录、转换、编辑和流化数字音频和视频。FFmpeg的名称来自MPEG视频......