李宏毅BERT笔记

时间：2023-05-03 21:33:16浏览次数：46

标签：Pre BERT 李宏毅笔记 token supervised Fine tune

Self-supervised是LeCun提出的

常用于NLP，一段文字分成两部分，用第一部分来预测第二部分

BERT有两种训练的方式，

第一种是Masking Input，可以用特殊的MASK token或是Random token来替换原有的，经过BERT模型后，输出为原先的token

第二组是判断两段文字是否相接的，但是后来验证这种训练的方法不是很有效

所以BERT的主要的方式，是完形填空

BERT的架构很像Transformer的Encoder，

所以Pre-train的model无法直接使用，需要加外挂，进行Fine-tune才能用于Downstream Tasks，注意BERT fine-tune的时候是要更新参数的

GPT模型，更像decoder，更适合于生成任务，但GPT使用中，使用的in-context learning是不会改变模型参数的

用于验证BERT这样模型的标准叫GLUE

看下如何Fine tune BERT来生成可使用的模型

BERT的Pre-train是self-supervised学习，但是fine-tune是supervised学习，需要大量的训练集的

第一个例子是，情感分析

这里注意，BERT的参数是在Pre-train时init的，而Linear是随机init的

Fine-tune的时候，Linear和BERT的参数都是要进行调整的

第二个例子比较简单，n to n

第三个例子，NLI，一个前提，一个假设，判断是否符合

第四个例子比较复杂，QA

给出Document和Query，输出答案的index

标签：Pre,BERT,李宏毅,笔记,token,supervised,Fine,tune
From： https://www.cnblogs.com/fxjwind/p/17369715.html

linux学习笔记（29）linux共享目录，NFS，使用autofs实现NFS 自动挂载
【1】NFS简介（1.1）什么是NFS NFS是NetworkFileSystem的缩写，即网络文件系统。英文NetworkFileSystem(NFS)，是基于UDP/IP协议的应用，可以通过网络，让不同的机器、不同的操作系统可以共享彼此的文件。 NFS在文件传送或信息传送过程中依赖于RPC协议。RPC：远程过程调用(R......
Bootstrap学习笔记
目录1总览2Bootstrap网格系统2.1核心特性2.2固定布局2.3响应式布局2.4行列对齐3Bootstrap基础组件4Bootstrap高级组件本文是笔者在学习Bootstrap框架时整理的笔记，通过本文，读者可以初步了解该框架的基本用法和前端开发的大体思路。1总览Bootstrap官网：https://getbootst......
python学习笔记8（json数据格式、pycharts简单折线图）
1.jsonjson是一种轻量级的数据交互格式，可以以json指定的格式去组织和封装数据；json本质上是一个带有特定格式的字符串；json负责不同编程语言中的数据传递和交互；1.1python数据与json数据相互转化引入json模块importjson1.1.1python数据转json数据importjson#python列表......
宽带千兆笔记本只有百兆解决方案
导致的原因有很多如下劣质网线插在路由器上(插入光猫的千兆端口好一点)windwos自动识别误判排除好问题后确定自己插入的是千兆端口打开此电脑右击选择管理接下来找到网线的网卡右击选择属性在高级里面找到"连接速度与双工模式"选择值"1.0GB"这样我们......
Volatility 3 使用入门笔记
下载恶意软件分析诀窍和工具DVD和vol3下载地址：https://codeload.github.com/ganboing/malwarecookbook/zip/refs/heads/master然后，下载vol3，并安装：https://codeload.github.com/volatilityfoundation/volatility3/zip/refs/heads/stable最初运行的时候，pythonD:\Application\v......
R语言可视化学习笔记之ggridges包
作者：严涛浙江大学作物遗传育种在读研究生（生物信息学方向）伪码农，R语言爱好者，爱开源。严涛老师的绘图教程还有：gganimate|诺奖文章里面的动图布局教程来了！！ggplot2学习笔记之图形排列R包ggseqlogo|置换序列分析图ggplot2高效实用指南（可视化脚本，工具，套路，配色）简介ggridges。主要包用来绘......
《深入理解计算机系统》第七章学习笔记链接
链接是将各种代码和数据片段收集并组合成为一个单一文件的过程，这个文件可被加载到内存并执行。链接可以执行于编译时，也就是在源代码被翻译成机器代码时；也可以执行于加载时，也就是在程序被加载器加载到内存并执行时；甚至执行于运行时，也就是由应用程序来执行。在早期计算机系统中，链接......
吉老师线段树学习笔记（内含吉老师ppt）
Segmenttreebeats吉老师线段树SegmenttreeBeats!.pdf_免费高速下载|百度网盘-分享无限制(baidu.com)为广大oier们提供学习ppt（笑）历史最大值未完工作用用于维护区间最值和区间历史最值的线段树区间最值引入问题给定一个长度为n的数列A，有m次操作：1.将区间\([l,r]\)里......
树分治学习笔记
前言既然序列可以分治，那么树也可以分治。树上的分治可以分为点分治与边分治。点分治边分治主要用于处理树上路径问题。考虑一个分治的过程：选中一棵树的根，计算经过根的路径的贡献，然后以其子结点为根对子树递归地计算贡献。容易发现，在构造数据下这种算法的复杂度是可以达到\(O(......
平衡树学习笔记
前置芝士平衡树的前置芝士：全局平衡二叉树。平衡树平衡树是一种基于二叉搜索树的数据结构。满足:左儿子\(<\)根\(<\)右儿子。也就是一切小于根节点的在左边，一切大于根节点的在右边。这样想要查找一个节点的位置时间复杂度就是\(O(\logn)\)。平衡树主要有三种：Splay，Trea......

李宏毅BERT笔记

相关文章

赞助商

阅读排行