首页 > 其他分享 >开源项目相关:ChatGPT学习过程

开源项目相关:ChatGPT学习过程

时间:2024-07-01 10:32:16浏览次数:16  
标签:语言 模型 学习 开源 对话 ChatGPT utterance

大规模无标注数据预训练:
ChatGPT首先使用大规模的无标注数据进行预训练。例如,它可能使用了8.5亿对话对来学习对话的表达与交互方式。
这一步主要依赖Transformer等神经网络结构,通过预测下一个词来学习语言的统计规律和语义知识。
自监督学习:
在预训练过程中,ChatGPT将对话划分为utterance(话语单元),并使用utterance之间的关系作为自监督信号进行学习。
它需要预测下一个utterance,这有助于模型学习到连贯、连续与合理的对话表达能力。
Masked语言建模:
ChatGPT采用掩码语言建模(Masked Language Modeling)的方法,将输入对话sequence中的某些token掩码,让模型预测被掩码的token。
这有助于模型学习对话的条件语言概率。
Next sentence prediction:
ChatGPT还通过输入两个句子,让模型判断第二个句子是否是第一个句子的下一句,来学习对话的逻辑与主题推进。
迁移学习:
ChatGPT基于GPT-2语言模型进行微调得到。GPT-2是在大规模通用文本语料上进行预训练的。
这种以大模型为基础,在特定任务与数据上微调的方式,可以充分利用大模型已经学到的知识,实现有效地迁移学习。
强化学习:
ChatGPT还采用强化学习的方法选择最优的响应utterance。
根据人工评价的奖励信号更新模式选择策略,使其可以生成用户最期望的回复。
交互式学习:
在部署后,ChatGPT可以通过真实的人机交互,获取用户的反馈(如满意度评价),来不断调整和优化模型。
这属于交互式学习方法,使模型在实际使用场景中不断进步。
领域特定训练:
在普通语言模型的基础上,使用特定领域的语料(如电影对话)来继续训练模型,使其对特定领域的语言有更深的理解。

标签:语言,模型,学习,开源,对话,ChatGPT,utterance
From: https://www.cnblogs.com/shendyadmin/p/18277533

相关文章

  • python pyqt5学习记录(一)
    了解pyQt5:PyQt5是一个用于创建图形用户界面(GUI)应用程序的Python库。它是Python编程语言与Qt应用程序框架的绑定,允许开发人员使用Python语言来创建跨平台的桌面应用程序。Qt是一个功能强大且广泛使用的C++库,用于开发图形界面和应用程序功能。关于PyQt5的一些重要信息和功能:1.......
  • 【动画进阶】类 ChatGpt 多行文本打字效果
    今天我们来学习一个有意思的多行文本输入打字效果,像是这样:这个效果其实本身并非特别困难,实现的方式也很多,在本文中,我们更多的会聚焦于整个多行打字效果最后的动态光标的实现。也就是如何在文本不断变长,在不确定行数的情况下,让文字的最末行右侧处,一直有一个不断闪烁的光标效果:......
  • ArchiMate 3 学习
    目录ArchiMate3学习什么是ArchiMateArchiMate3.1规范关系动机元素策略元素业务层应用层技术层物理元素实施和迁移元素复合元素ArchiMate3学习ArchiMate3中文版什么是ArchiMateArchiMate是TheOpenGroup为企业架构提供的开放和独立的建模语言,由不同的工具供应商和......
  • 如何找到并快速上手一个开源项目
    以前有写过两篇文章来简单聊过如何做开源的事情,最近我自己组了一个社区里面也有不少朋友对开源感兴趣,于是我便根据自己的经验系统的梳理了一些关于开源的事情。新手如何快速参与开源项目手把手教你为开源项目贡献代码有兴趣的可以先看看之前这两篇。......
  • React-Native优质开源项目
            ReactNative是一个由Facebook开发的开源框架,允许开发者使用JavaScript和React来构建原生移动应用。它允许开发者编写一次代码,然后可以在iOS和Android平台上运行,而无需为每个平台单独编写代码。以下是ReactNative的一些关键特点和优势:跨平台开......
  • AI引到学习前端开发
    假设你是一位前端技术开发专家,我有几个JavaScript的问题想向你咨询我想用JavaScript来做微信小程序开发,请以表格的方式输出知识要点请叙述JavaScript操作浏览器对象的常用接口和方法把上述表格按照访问对象归类将上述文字制作一个表格来呈现,要求逻辑清晰描述信息简明扼要且......
  • Diffusers代码学习:加载适配器
    有几种用于个性化扩散模型以生成特定主题的图像或特定风格的图像的训练技术。每种训练方法都会产生不同类型的适配器。一些适配器生成一个全新的模型,而其他适配器只修改一组较小的嵌入或权重。这意味着每个适配器的加载过程也不同。DreamBooth仅在一个主题的几个图像上微调整......
  • 开源一款基于 Typecho 开发的博客主题
    主题介绍WaterDrop是水滴的意思,其实并没有什么特殊含义,只是因为每一次项目取名都绞尽脑汁,太麻烦了,于是就想着效法一些大佬,干脆取名随性一点。例如,Java语言因作者经常在办公室喝Java咖啡而得名,MySQL和MariaDB的作者是同一人,命名分别是他两个女儿的名字(看样子作者也是个女儿......
  • 《昇思25天学习打卡营第2天 | 张量 Tensor》
    《昇思25天学习打卡营第2天|张量Tensor》《昇思25天学习打卡营第2天|张量Tensor》《昇思25天学习打卡营第2天|张量Tensor》什么是张量(Tensor)张量的创建方式根据数据直接生成从NumPy数组生成使用init初始化器构造张量继承另一个张量的属性,形成新的张量张量的属......
  • 《昇思25天学习打卡营第3天 | 数据集 Dataset》
    《昇思25天学习打卡营第3天|数据集Dataset》《昇思25天学习打卡营第3天|数据集Dataset》《昇思25天学习打卡营第3天|数据集Dataset》什么是数据集MindSpore的数据集数据集加载数据集迭代数据集常用操作mapbatch自定义数据集可随机访问数据集可迭代数据集生成......