回顾
时间过的很快,时间过的很快。不知不觉,我们有三AI-NLP专栏就已经走过了一个季度了。
这三个月,我们的NLP专栏更新了不少的内容,从NLP中最常用的机器学习模型,如HMM、CRF,到如今非常火爆的BERT,XLnet等预训练模型;从RNN等传统的神经网络抽取器,到现今最新的TransformerXL,基本涵盖了NLP中的基本理论、最新的技术等。
同时,作为有三AI-NLP专栏重要的一环,在有三AI-NLP知识星球,注重体系化的介绍NLP的知识。从完成一个实际NLP任务为出发点,同步更新了词向量、Attention、语义匹配、命名实体识别以及聊天机器人等内容,均包括原理讲述,代码解析等。
展望
更新完基本的NLP知识之后,有三AI-NLP专栏会开始介绍不同的NLP任务,例如分词、语义匹配,文本分类,意图识别,命名实体识别,聊天机器人,知识图谱等。
专栏和知识星球的分工还是跟以前一样,专栏介绍梗概性的原理,知识星球系统性的介绍细节和实现。
(1) 分词、语义匹配,文本分类,意图识别,命名实体识别等NLP基础任务。后面计划在专栏中介绍上述任务的基本概念和原理;在知识星球中,介绍如何用深度学习平台完成某一个任务。
(2) 知识图谱。知识图谱对于NLP各项任务效果好坏的重要性,就好比基础知识对于一个学生成绩好坏的重要性。他是NLP最重要的基础设施,目前各大公司都在着力打造知识图谱,作为一个NLP工程师,必须要熟悉和了解他。后面计划在专栏中介绍图谱的基本概念和原理;在知识星球中,介绍如何实际搭建某个领域的知识图谱。
(3) NLP预训练模型。基于海量数据,进行超大规模网络的无监督预训练。具体的任务再通过少量的样本进行Fine-Tune。目前这部分的内容在专栏中已经基本更新结束,后面会在知识星球里重点解析BERT、TransformerXL、GPT以及XLnet等的具体实现。
(4) 聊天机器人。后续会在专栏中介绍机器人的基本原理和概念;在知识星球中,介绍如何实际搭建一个聊天机器人,包括QA,对话系统以及闲聊机器人。