中文文本分类【参考https://github.com/lijqhs/text-classification-cn】
文本分类(Text Classification)是自然语言处理中的一个重要应用技术,根据文档的内容或主题,自动识别文档所属的预先定义的类别标签。文本分类是很多应用场景的基础,比如垃圾邮件识别,舆情分析,情感识别,新闻自动分类,智能客服机器人的知识库分类等等。本文分为两个部分:
- Part 1: 基于scikit-learn机器学习Python库,对比几个传统机器学习方法的文本分类。[Blog Post](https://lijqhs.github.io/2019/05/text-classification-scikit-learn/)
- Part 2: 基于预训练词向量模型,使用Keras工具进行文本分类,用到了CNN。[Blog Post](https://lijqhs.github.io/2019/05/text-classification-pretrained-keras-cnn/)
Text Classification
标签:中文,Part,text,分类,分类器,实例,文本,语料 From: https://www.cnblogs.com/toooooptimiatic/p/16802620.html