专业技术开发,收藏关注不迷路
文章目录
一、项目介绍
随着电商网络经济的兴起,更多的人选择在线上预订酒店出行,电商旅游平台使得旅行者可以通过评论更加自由地选择价格和服务合意的酒店,同时也给人们提供了一条更加方便快捷反馈酒店服务的途径。例如,携程酒店评论之中包含了海量用户或积极或建议或消极的情感观点,酒店可以依据这些评论改善自身的服务,平台可以据此调整对不同评价酒店的资源倾斜,消费者可以就评论选择自己需要的酒店。因此,在如今大数据的背景之下,如何高效地利用这些评论数据就显得尤为重要,其中文本情感分析作为 NLP(Nature Language Processs,自然语言处理)的一个经典问题一直受到相关领域从业人员的广泛关注。现有的研究已经取得了一定的成果,但是鲜有文献对旅游平台酒店评论这一细分领域进行深入地研究,对文本特征很难做到准确提取,同时在一些算法上也有所欠缺。
本文基于Python技术,提出了利用朴素贝叶斯算法实现的评论情感分析系统。首先利用 Scrapy 爬虫框架获取数据集,然后使用 pandas 库和正则表达式等技术完成数据清洗; 对评论文本采用jieba分词后,使用多项式贝叶斯分类器,构造出一个基于朴素贝叶斯的情感分类模型。通过对模型进行训练,并使用携程网站采集的评论数据进行分类预测。实验结果表明,该模型具有良好的分类效果。
二、开发环境
朴素贝叶斯; 情感分析; python; 数据采集
环境:Python3.8、OpenCV4.5、PyCharm2020
三、功能介绍
整体功能展示如图3-3所示。
图3-3 系统整体功能图
四、效果图
五、文章目录
目 录
第1章 引言 1
1.1 研究背景及意义 1
1.1.1 研究背景 1
1.1.2 研究意义 1
1.2国内外研究现状 2
1.3 论文组织架构 3
第2章 相关理论及技术介绍 4
2.1 网络爬虫 4
2.2.1 文本挖掘及预处理 4
2.3 酒店及服务质量相关概念 5
2.3.1高端酒店 5
2.3.2 服务质量 5
2.3.3 服务质量 5
2.4 朴素贝叶斯 6
第3章 携程酒店评论文本的特征工程 8
3.1 携程酒店评论数据的来源与预处理 8
3.2 携程酒店评论的特征集构建 10
第4章 系统整体结构设计 12
4.1 数据采集 12
4.2 数据采集 12
4.3 数据清洗 12
4.4 基于朴素贝叶斯的情感分析算法 12
4.4.1算法流程 12
4.4.2朴素贝叶斯 13
4.4.3朴素贝叶斯分类器 13
第5章 系统界面 14
5.1 登录面 14
5.2 注册界面 15
5.3 网站首页 15
5.4 组界面 16
5.5 用户表 16
5.7 酒店表 17
5.7 评论表界面 17
5.8 可视化界面 18
第6章 总结与展望 19
6.1 总结 19
6.2 展望 19
参考文献 20