首页 > 其他分享 >【李宏毅机器学习】(一)正确认识ChatGPT

【李宏毅机器学习】(一)正确认识ChatGPT

时间:2023-05-21 18:35:23浏览次数:57  
标签:机器 训练 李宏毅 学习 正确认识 课程 ChatGPT

该文是一篇机器学习的学习笔记,学习内容:李宏毅2023春机器学习课程

ChatGPT(Chat Generative Pre-trained Transformer) 是一个以对话的方式进行交互的语言模型,由 OpenAI 发布。

常见误解

对 ChatGPT 的常见误解:

  • ChatGPT 是从开发者事先准备好的答案里随机抽取一个回答。
  • ChatGPT 的答案是网络搜寻的结果。

ChatGPT 的工作原理是文字接龙


图片来源:李宏毅机器学习课程

ChatGPT 将问题作为 input 传入 function,得到的 output 是 input 后应该接的词汇的概率分布。ChatGPT 从分布中 sample 一个词汇,并将其加到原来的 input 得到新的 input,重复操作,知道 sample 到结束符。


ChatGPT 是如何根据上下文回答问题?
ChatGPT 将同一则对话的历史记录+新问题作为 input 传入 function。


ChatGPT 的 function 是如何找到的?


图片来源:李宏毅机器学习课程

function 是在训练过程中由开发者和大量网络资料一起推导出来的。function 包含上亿个参数(如 f = ax + b 里,a 和 b 就是参数)

预训练(Pre-train)

ChatGPT 背后的关键技术:预训练(Pre-train),又叫自督导式学习(Self-supervised Learning)。预训练得到的模型叫基石模型(Foundation Model)。

ChatGPT 训练的三个步骤:


图片来源:李宏毅机器学习课程
  1. 预训练从网络资料学习文字接龙。网络上每一段文字都可以无痛制造成对资料来教机器做文字接龙,缺点是预训练出的 GPT 对于一些问题的回答不一定是我们想要的。

  2. 为了引导 GPT 产生有用的输出,需要对 GPT 进行督导式学习,由开发者提供成对的资料进行训练,引导文字接龙的方向。

  3. 还会对 ChatGPT 进行增强式学习,相较于督导式学习,开发者不用给出答案,只需要对结果回馈对错。为了节省人力,可以通过模拟人类老师的喜好训练 Teacher Model,用增强式学习向模拟老师学习。


图片来源:李宏毅机器学习课程

图片来源:李宏毅机器学习课程
为什么要有预训练? 开发者提供的成对资料是有限的,基于有限的资料找出函式f,他的能力可能还是非常有限。网络上能低成本收集到的数据是庞大的,将这些数据无痛制造成成对资料,然后投入模型中进行训练。这个训练过程即预训练,预训练会使模型具有更强大的能力。 预训练的另一个优势:在多种语言上做预训练后,只要教某个语言的某一个任务,自动学会其他语言的同样任务。

ChatGPT 带来的研究问题

  1. 如何精准提出需求。

图片来源:李宏毅机器学习课程
  1. 如何更正错误。当回答出现错误时,我们对其进行更正,反而会带来更多新的错误。新研究课题【Neural Editing】就是研究如何避免这种情况。

图片来源:李宏毅机器学习课程
  1. 侦测 AI 生成的物件。怎样用模型侦测一段文字是否为 AI 生成,同样的概念可以被用到语音、影像上。
  2. 不小心泄露隐私。想让 ChatGPT 遗忘一些不该知道的内容,新研究课题【Machine Unlearning】。

标签:机器,训练,李宏毅,学习,正确认识,课程,ChatGPT
From: https://www.cnblogs.com/hzyuan/p/17418954.html

相关文章

  • ChatGpt API接口技术对接教程
    背景:从去年十二月份到现在,chatgpt火了很长一段时间,是继Copliot之后又一个智能AI机器人,而且他的功能不限于写代码,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。引用......
  • OpenAI 官宣首个 ChatGPT iOS 应用
    最近,OpenAI宣布推出官方iOS应用,允许用户随时随地访问其高人气AI聊天机器人,此举也打破了近几个月内苹果AppStore上充斥似是而非的山寨服务的窘境。该应用程序是ChatGPT的首个官方移动应用程序。ChatGPT软件程序在去年推出后迅速获得了超过1亿用户,这也让技术行业火速......
  • 慎与ChatGpt聊天,会后悔!
    起因:    大无语事件啊家人们    大家还习惯使用chatGpt等AI工具为你整理文档或者搜一些资料吗,上点心吧,小心被AI坑了。    起初是偶然看到公司也有AI应用产品了,大家可以看看这个T-Chat(非公测产品),T-Chat是公司新出的一个AI产品,基于ChatGpt核心封装的一个便捷性聊天......
  • 基于ChatGPT和谷歌3D贴图的虚幻引擎5
    作者:githubdaily相信大家小时候躺在床上,都曾设想过这么一个场景:当你闭上眼睛时,感觉身心十分安宁,物理世界慢慢淡出,身体也随着变得飘逸,一切仿佛只剩下呼吸声和心跳声。一阵微风拂过,你缓缓睁开双眼,发现自己摆脱了地心引力,出现在了天空之上,只要一个想法,便可瞬间穿梭到地球上任意位......
  • ChatGPT 推出 iOS 应用,支持语音输入,使用体验如何?
    最近,OpenAI宣布推出官方iOS应用,允许用户随时随地访问其高人气AI聊天机器人,此举也打破了近几个月内苹果AppStore上充斥似是而非的山寨服务的窘境。该应用程序是ChatGPT的首个官方移动应用程序。ChatGPT软件程序在去年推出后迅速获得了超过1亿用户,这也让技术行业火速......
  • 如何在代码开发中便捷使用 ChatGPT 协助开发
    在五一节前后,抽空测试了下网上推荐的开发环境和开发插件,在这里推荐给前后端代码开发的同胞们。方法一:IDEA安装插件bito习惯使用IDEA开发代码的同胞,可以尝试直接在IDEA中安装插件bito,注意操作过程中需要注册账号并登录。如下。安装成功后在右侧栏可以看到快捷导航图标,如下。......
  • 文心一言 VS 讯飞星火 VS chatgpt (18)-- 算法导论4.1 5题
    五、使用如下思想为最大子数组问题设计一个非递归的、线性时间的算法。从数组的左边界开始,由左至右处理,记录到目前为止已经处理过的最大子数组。若已知A[1..j]门的最大子数组,基于如下性质将解扩展为A[1..j+1]的最大子数组:A[1..j+1]的最大子数组要么是A[1..j]的最大子数组,要么是......
  • 文心一言 VS 讯飞星火 VS chatgpt (18)-- 算法导论4.1 5题
    五、使用如下思想为最大子数组问题设计一个非递归的、线性时间的算法。从数组的左边界开始,由左至右处理,记录到目前为止已经处理过的最大子数组。若已知A[1..j]门的最大子数组,基于如下性质将解扩展为A[1..j+1]的最大子数组:A[1..j+1]的最大子数组要么是A[1..j]的最大子数组,要么是......
  • [learn from chatGPT] [vba] 如何使用 Collection 或 Dictionary 对象来代替数组
    在VBA中,`Collection`和`Dictionary`对象可以用来代替数组。它们的主要优点是可以动态地添加、删除和查找元素,而无需调整数组大小。下面是一个简单的例子:```SubUseCollection()DimmyCollectionAsNewCollection'添加元素到Collection中myCollection.Add......
  • 3 分钟利用 FastGPT 和 Laf 将 ChatGPT 接入企业微信
    原文链接:https://forum.laf.run/d/556FastGPT是一个超级......