自然语言处理概述

以前的自然语言大多数停留在去根据业务来编写相应的规则来解决实际的问题，但是仅仅靠手工编写的规则是无法覆盖全部的内容，而且不同的规则之间也具有一定的矛盾，随着统计学的发展，人们逐渐的用统计的思想去解决一些实际的问题，例如马尔可夫假设，即一个词语出现的概率取决于它前面出现的所有词，但是随着文本长度的增加，对应条件概率的计算也变得困难。随着神经网络的发展，在2013年时，Google提出Word2Vec，这个模型是所有NLP学习者都熟悉的模型，他分为CBOW和Skip-gram两种，其中CBOW是使用周围的词语来进行预测中间的词，Skip-gram则是通过中间词来预测周围的词，但是该模型无法处理一词多义的问题，后面LSTM和CNN等模型也相继出现，来对句子中的词语进行编码，以便捕获词语的上下文的信息。

2018年ELMO的出现，直接在词向量给出了一种优雅的解决方案，使用双向的LSTM作为网络结构，从两个方向编码词语的上下文来进行预测，该模型基于LSTM作为编码器，而不是特征提取能力更强的Transformer。

随后GPT将ELMO中的LSTM替换为Transformer，GPT根据上文来进行下文的预测，但是没有考虑下文的信息，在一些任务上适应性较差，比如阅读理解，后面划时代的BERT出现，在编码方面不仅采用Transformer作为编码器，而且在预训练阶段采用NSP和MLM进行训练，使得词语的信息具有上下文的信息，使得更多的下游任务，后面BERT的变种陆续的出现，例如MacBert、RoBERTa和Ernie等。

时至今日，大模型也逐渐的发展起来，现有开源的大模型无法处理特有的场景，所以很多企业结合自己的知识库，来对问题进行相关的检索，让大模型进行检索结果的总结，到这里自然语言的概述就写完了，后面对不断的更新所学内容。

标签：Transformer,处理,模型,词语,概述,LSTM,自然语言
From： https://www.cnblogs.com/twnlp/p/17813145.html

Luminar Neo：用AI技术打造极致图片处理体验 mac/win版
LuminarNeo是一款备受瞩目的AI图片编辑处理软件，它将先进的人工智能技术融入到图片编辑的各个环节中，为用户带来了前所未有的便捷与高效体验。这款软件不仅具备丰富的功能和工具，还利用AI算法对图像进行智能分析和处理，使编辑效果更自然、更精准。→→↓↓载LuminarNeomac/win版......
SRE服务端预案，应急处理手册
服务端应急处理流程问题升级流程问题升级步骤SRE人员-各端组长-业务线负责人现有降级手段App业务入口降级降级范围以及作用域使用App降级策略，App在各个业务入口会直接降级，关闭对应的业务入口使用场景对应业务出现会持续扩大损失并且短期无法修复的报错，比如应用持续出现......
Spring概述，IOC，AOP使用
Spring简介Spring概述官网地址：https://spring.io/Spring是最受欢迎的企业级Java应用程序开发框架，数以百万的来自世界各地的开发人员使用Spring框架来创建性能好、易于测试、可重用的代码。Spring框架是一个开源的Java平台，它最初是由RodJohnson编写的，并且于2003年6月......
关于文件夹权限不够，引起的安装错误的处理方法
文件夹没有权限，在更改文件夹的权限的时候会报各种错误，很多人在一报错的情况下，都不知道如何设置了。今天给大家带来一个用命令来处理这个问题的方法：假设文件路径为：C:\Windows\System32\en-US 比如：在安装软件的时候，报这个错误：用上面的设置文件权限的方法又报错的情况......
无涯教程-批处理 - ECHO函数
ECHO-ECHO此批处理命令显示消息，或打开或关闭命令回显。ECHO-语法ECHO“string”ECHO-示例以下示例显示了dir命令的不同变体。RemTurnstheechoonsothateachcommandwillbeshownasexecutedechoonecho"HelloWorld"RemTurnstheechooffsotha......
处理mysql中in条件大于1000条的问题
WHERExsfnsrsbhIN<foreachcollection="param.nsrsbhList"index="index"item="nsrsbh"open="("close=")"><iftest="index>0"><choose>......
提升应用性能：Go中的同步与异步处理
提升应用性能：Go中的同步与异步处理原创 TimLiu 爱发白日梦的后端 2023-11-0608:00 发表于广东收录于合集#go90个爱发白日梦的后端专注Go语言领域的发展，学习成为更牛逼的架构师，日常分享Go语言、架构、软件工具的使用。124篇原创内容公众号在开......
无涯教程-批处理 - DIR函数
此批处理命令列出目录的内容。DIR-语法dirDIR-示例以下示例显示了dir命令的不同变体。@echooffRemAllthedirectorylistingsfromC:\willberoutedtothefilelists.txtdirC:\>C:\lists.txtRemListsalldirectoriesandsubdirectoriesrecursivelydir......
解锁多核处理器的力量：探索数据并行化在 Java 8 Stream 中的应用
在Java8中引入的Stream为集合数据的处理带来了现代化的方式，而数据并行化则进一步提升了处理速度，充分发挥了多核处理器的优势。本篇博客将详细介绍数据并行化在Java8Stream中的应用，以及如何利用并行流处理大量数据。什么是数据并行化数据并行化是指将任务分解成多个子任务，......
吃透BGP，永远绕不开这些基础概述，看完再也不怕BGP了！
你们好，我的网工朋友。总有人在私信里抱怨，BGP实在是太难了！一是这玩意儿本来就很复杂，需要处理大量的路由信息和复杂的算法；再一个是需要你有一定的实战经验才能深入理解运作。虽然BGP确实有一定难度，但你总得先从技术理论开始吃透它吧？学习掌握了BGP，对工作中提高网络性能、增强网络稳定......

自然语言处理概述

自然语言处理概述

相关文章

赞助商

阅读排行