为什么在NLP中迟迟没有出现类似CV预训练的范式

时间：2024-06-12 21:03:07浏览次数：32

标签：NLP 范式 AI 学习 2018 word2vec 迁移 CV

Q：2018年前，迁移学习在NLP中的运用情况如何？

我们知道，直到2018年，ULM-FiT、GPT和BERT模型的出现才开启了NLP预训练模型的时代，才真正实现了CV领域那样的迁移学习方法在NLP领域的应用。那么，是不是说2018年前NLP领域就没有迁移学习呢？

答案是，这个说法是非常不准确的！就如我们在6.4.3里预告的，word2vec其实就是NLP中迁移学习运用的祖师爷，它可以利用大规模的未标注文本数据进行训练，从而可以学习到非常通用的单词向量表示。由于word2vec的成功，迁移学习范式已经成为了NLP领域的标配！

Q：那为什么我们会说，NLP一直没有一个类似CV的迁移学习范式？

这是因为，虽然word2vec是将迁移学习引入NLP领域的先驱之一，但是它主要关注的是单词级别的表示学习，而不是针对具体任务的模型迁移。也就是说，在面对一个NLP任务的时候，word2vec可以让我们快速解决从词元到词嵌入的那两层神经网络（对于一个包含V个单词的词典，如果我们用N维稠密向量来表示每一个词，那么word2vec模型其实就是压迫去学习一个V×N的矩阵），但也仅此而已了。很长一段时间内，NLP研究者们依然需要针对每个具体的NLP任务训练不同的模型。

AI科技智库
标签：NLP,范式,AI,学习,2018,word2vec,迁移,CV
From： https://blog.csdn.net/aigchouse/article/details/139636328

中望ZW3D 二次开发输出质量、体积等属性 cvxPartInqShapeMass
svxPointP1={10,0,0};svxPointP2={20,0,0};svxPointP3={20,10,0};svxPointP4={10,10,0};intL1;cvxPartLine2pt(&P1,&P2,&L1);intL2;cvxPartLine2pt(&P2,&P3,&L2);intL3;cvxPartLine2pt(&P3,&P4,&......
NLP--朴素贝叶斯
1.在很多时候，我们不能像抛硬币一样通过客观性的方式来得到正反面的概率，而是常常遇到主观性的概率时，我们就不得不提及贝叶斯学派。贝叶斯概率是一种对概率的解释。概率被解释为代表一种具备某种知识状态的合理预期。因此，贝叶斯原理更符合人们的认知习惯。2.朴素表示假设样本的......
NLP 分类项目：姓—国家名（从MLP到CNN）
文章目录1.项目简介2.前置知识2.1单层感知机2.2多层感知机2.3卷积操作2.4卷积神经网络3.项目实现3.1文本表示（数据集展示+处理）3.2分类模型（MLP模型+CNN网络）3.2.1MLP模型3.2.1CNN网络3.3损失函数3.3.1信息熵3.3.2交叉熵损失3.4优化算法3.5流程组装4.项目效......
卫星通讯传输技术助力电力运维巡检效率提升：EasyCVR实现远程监控与管理的新路径
随着科技的快速发展，视频监控技术已广泛应用于各个领域。而卫星通讯作为一种高效、稳定的通信方式，为视频监控系统的远程传输提供了有力支持。一、方案背景随着电力行业的快速发展，电力运维巡检工作变得愈发重要。传统的巡检方式往往受到地域、环境等因素的限制，难以实现对电力设备......
OpenCV实战案例——直线检测[C++]
0.前言本文以实战案例为背景，一步步讲述如何使用计算机图像处理相关知识提取图片中英语填空题答题线。1.需求背景某公司打算设计一款英语题目批改APP，要求学生上传英语填空题图片，然后该APP自动标注答题线位置(使用红线标注)，方便后续定位和批改答案。下图(图1-1)为某一学生上传的......
腾讯云CVM主机在原分区（主分区）上增加磁盘空间
#现有环境：vdb1000G-vdb1500G-剩余500G需要加在vdb1上#1、安装-yuminstall-ycloud-utils-growpart-一般系统都自带#2、执行以下命令，使用growpart工具扩容分区-growpart/dev/vdb1#1表示是第一个分区：vdb1-返回结果如下图......
pgAdmin未授权命令执行漏洞（CVE-2022-4223）
https://ftp.postgresql.org/pub/pgadmin/pgadmin4/v5.7/source/pgadmin4-5.7.tar.gz 下载pgadmin5.7的源码首先从代码层面进行分析接口 /validate_binary_path最后调用了 subprocess.getoutput(来执行了命令这一部分代码是对传入的路径进行检测，如果是在linu......
OpenCV实战案例——校正+切边[C++]
0.前言本文以实战案例为背景，讲述如何使用计算机图形学知识完成需求，实现最终效果。本文包含实战案例素材以及过程代码讲解，方便读者理解。1.案例需求某公司打算开发一款用于提取学生作业本的程序，学生用手机拍摄自己的作业上传到程序，程序进行处理最终提取出作业本区域方便老师批改......
C# OpenCvSharp Mat操作-创建Mat-zeros
在OpenCvSharp中，zeros函数用于创建一个全零的矩阵（Mat对象）。这个函数有多个重载版本，可以根据不同的需求来创建不同形状和类型的全零矩阵。下面我将详细解释每个重载版本，并通过具体的代码示例来说明如何使用它们。......
OpenCV RotatedRect类中angle参数解析 C++
0.前言本文主要探讨RotatedRect类angle的实际含义，为后续学者提供一定的参考。1.官方手册RotatedRect其一构造函数如下图(图1-1)所示。在OpenCV图形坐标系中，水平方向向右为x轴正方向，垂直方向向下为y轴正方向，左上角为(0,0)点。center表示矩形的中心坐标，size中包含了矩形的宽度......

为什么在NLP中迟迟没有出现类似CV预训练的范式

相关文章

赞助商

阅读排行