学习方法--NLP入门

时间：2024-05-28 18:28:49浏览次数：23

1.了解NLP的最基本知识
Jurafsky和Martin的Speech and Language Processing是领域内的经典教材，对于NLP任务有基本认识，遇到问题知道在书的哪个地方还是非常有意义的。去做一个语言模型的问题，实现神经网络模型之前，第一步要去写一个 bigram 或者 trigram的语言模型。通过简单的N-gram模型实现，可以告诉你这个数据集的语言模型的下限，神经网络模型至少不应该比这个模型差。神经网络模型因为其超参数、梯度爆炸等问题，有时候我们不太容易决定是真的模型不行、参数没调好还是代码有bug。那么通过N-gram LM的给出的下限，我们就可以直观地知道神经网络是有bug还是没调好参数。补充：Chris Manning 的 introduction to information retrieval 电子书也是一本可以扫一下盲的书。

2. 了解早年经典的NLP模型以及论文
相比简单粗暴的神经网络模型，早年的NLP算法确实比较繁琐复杂，但里面有很多早年学者在硬件条件艰苦情况下的智慧结晶。熟悉了这些模型，可以在现在神经网络里面融会贯通。

3. 了解机器学习的基本模型
神经网络的简单暴力并且有效。但是从科研的角度讲，熟悉基本的机器学习算法是必修课。比如吴恩达的 machine learning课程。同时需要搞懂经常用到的算法的原理，比如dropout, batch, layer normalization等等。这样其实可以省去很多时间，磨刀不误砍柴工。推荐Pattern Recognition and Machine Learning电子书，其中部分章节数学要求很高，可以有选择性的把几个重要的chapter 过一遍。

4. 多看NLP其他子领域的论文
不同子领域所运用的模型不会相差太大。但是最开始看不熟悉领域的问题可能会有一点难，原因是对问题的形式不是很了解。这可能就需要多花一些时间，多找懂的同学去问。其实了解不同问题的形式也是对领域知识最好的扩充。

5. 了解 CV（计算机视觉）和数据挖掘领域的基本重大进展
NLP领域里面一些重要的文章其实或多或少借鉴了CV里面的思想，当然也同样出现CV借鉴NLP的情况。可以看看扫盲课的视频。

标签：NLP,入门,--,模型,领域,神经网络,了解,CV
From： https://blog.csdn.net/weixin_53389235/article/details/139239828

ALL IN AI | 第六届金蝶云·苍穹追光者开发大赛正式启动报名！
2024年5月，第六届金蝶云·苍穹追光者开发大赛x第十三届“中国软件杯”金蝶赛道正式启动报名！当下，人工智能正以其空前的速度、广度和深度，引领着新一轮科技革命和产业变革，重塑着经济社会的发展模式，为各行各业注入新动能。2024年政府工作报告中提到，深化大数据、人工智能等研发应用，开......
React中何时使用memo、useCallback、useMemo以及useRef进行性能优化
react无法做到像vue一样自动收集依赖更新（期待react19的ReactCompiler），需要开发人员手动的进行性能优化，此时memo、useCallback、useMemo、useRef就是性能优化中的重要API本文虽然介绍可应用场景，但是正常开发中，尤其是useCallback。除非遇到性能问题或者组件库封装，亦或......
vue 开发环境安装
思考了很久，还是想学学vue，虽然不做前端好多年了，只会jq+layui，挣扎了很久，还是想学习一下，接下来我做个学习笔记【我是初学者，有些错误的地方如果有大佬看到了还请指正】首先，先到 https://nodejs.org/en下载node，下载完毕后，下一步,下一步，下一步，，知道安装完成。然后打开cmd输入node......
在生产服务器 Git clone 一个 Laravel 私有仓库
本教程以aaPanel为例，请根据laravel版本安装好对应phpnginxmysqlredis等web环境所需然后安装好php所需扩展，比如fileinforedis等将php的禁用函数开启putenv()proc_open()proc_get_status() 记得重启php然后应用安装PM2Manager，也就是安装node......
使用skywalking对k8s应用进行链路监控
方案一、修改代码，引入jar包方案二、无侵入，使用探针自动注入到pod以下使用helm安装，提前安装helm环境1.添加SkyWalking的helm仓库helmrepoaddapache-skywalkinghttps://apache.jfrog.io/artifactory/skywalking-helm2.更新Helm仓库helmrepoupdate3.创建一个k8s命......
在Spring Boot应用中使用RestTemplate类发送不同的HTTP GET请求（带请求头、不带请求头）
原文链接：https://www.cnblogs.com/windyWu/p/16872871.html在本文中，你将学会在SpringBoot应用中使用RestTemplate类发送不同的HTTPGET请求。简单GET请求发送GETHTTP请求，可以使用getForObject()或getForEntity()方法。如下示例，使用getForObject()方法获取JSON字符串形式的用......
素数判定算法初级
前置知识Cpp实现基础算法//basemethodboolbasement(intnum){ for(inti=2;i<=sqrt(num);++i) { if(num%i==0) returnfalse; } returntrue;}证明筛法初步根据初等数学的知识，如果一个数不是2的倍数，那么它肯定不是2的倍数的倍数，所以，进一步的......
Docker升级MySQL版本的快速方法
Docker升级MySQL版本的快速方法背景虽然容器跑数据库用于生产不太靠谱因为性能以及其他相关的问题但是用在测试环境上面还是非常方便的昨天有客户想问问最新版的MySQL的兼容性情况今天告知要验证一把最新版本的数据库的情况.所以这里验证一下,遇到了几个小坑.关于mys......
使用脚手架创建Vue程序
首先，选好vue项目的存放地址，例如我存在了我电脑中d:\code\vue,打开cmd切到这个目录输入vuecreatevuedemo,我选择的vue3，然后等待项目创建，如下：创建成功后，切入到demo目录中，然后执行npmrunserve，项目就运行起来了 ......
synchronized原理
对象头(markword,数组长度,类型指针) 实例数据（字段1，字段2) 对齐填充(对其字节)synchronized修饰方法多了一个ACC_SYNCHRONIZED标识符synchronized修饰代码块monitorenter和monitorexitObjectMonitor里_EntryList和_WaitSet1.线程在竞争synchronized锁的时候,jvm首......

学习方法--NLP入门

相关文章

赞助商

阅读排行