全文链接:http://tecdat.cn/?p=16890
最近我们被客户要求撰写关于主题挖掘LDA和情感分析的研究报告,包括一些图形和统计输出。
当前是大数据盛行的时代,各种用户信息行为数据分析的结果影响着人们的生活和学习,同时对图书馆的发展也有着影响
▼
本文在图书馆话题下知乎用户问答行为数据的基础上,分析了图书馆信息资源建设的新要求,并提出了相关建议。
图书馆热门话题
通过主题挖掘分析知乎热门图书馆话题下的问答,了解到目前大多数用户去图书馆不再单纯的以获取资源为目的,除了借还书和查阅文献资料外,更多的读者是选择来图书馆进行自习、复习、备考,他们认为图书馆更有学习的氛围,同时有很多用户关注图书馆交友的话题。
图表1
我们从评论数量、被关注度和赞同数量来评估用户的参与程度,可以看到图书馆交友话题(主题1)关注人数和赞同人数最多(如图书馆怎么认识女生?),其次是考研、复习(主题3)的相关话题(如图书馆应该为考研学生提供特权吗?),该话题下讨论的人数最多。接下来是学校图书馆对外开放(主题2)的话题(如公办大学的图书馆/自习室该不该对外开放?)和学习环境话题(主题4)(如本部图书馆内部环境设置怎么样,在同类高校中是属于很陈旧的还是很现代化的?)。
点击标题查阅往期内容
自然语言处理NLP:主题LDA、情感分析疫情下的新闻文本数据
左右滑动查看更多
01
02
03
04
图书馆话题内容表达的情感
接下来,通过主题挖掘和情感分析(也称为意见挖掘)知乎热门话题下的问答,我们详细看下热门话题中用户表达了哪些情感。
图表2
从图书馆资源设施和学习环境话题来看,环境优美、设施齐全的图书馆的上座率更高,在期末备考或者迎接大型考试的前期图书馆的上座率又普遍上升,大多用户对占座表达出负面情绪,这说明在用户看来图书馆是整个学校最能提供足够学习氛围的场所,融休闲与学习为一体的咖啡厅式图书馆更受广大用户的喜爱。图书馆交友话题最为热门,很多用户有“书中自有颜如玉”的想法,预设图书馆是浪漫邂逅的地方。同时,从聊天、吵闹等负面关键词来看大多数用户表达出他们更愿意在安静愜意的图书馆环境里来读书。
疫情前后的图书馆话题
新型冠状病毒导致的肺炎疫情给大学图书馆信息资源建设工作带来了极大影响和冲击,通过时间线的对比,我们发现疫情前后的图书馆话题数量和情感表现发生明显变化。
图表3
由于疫情原因,图书馆闭馆后,很多用户表达出了开馆少、无法自习、借书逾期等负面情感。从正面情感来看,一些用户回答表示图书馆加强了网络在线服务,确保数据库资源正常使用和相关文献资源使用权,还策划了一些列活动以期更加全面地帮助全校师生在疫情防控期间充分利用网络进行专业资源,助力师生更好地开展学习、生活和科研等工作。同时,图书馆免除读者在疫情防控期间所产生的图书逾期费用。面对新冠病毒导致的肺炎疫情带来的深远冲击,抓住机遇,引入新技术、新模式,更好地保障用户的科研、学习需求,是当前图书馆的必然选择。
本文摘选 《 数据视域下图书馆话题情感分析 》 ,点击“阅读原文”获取全文完整资料。
点击标题查阅往期内容
文本挖掘NLP分析:LDA主题模型分析网购数据
游记数据感知旅游目的地形象
数据类岗位需求的数据面NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
自然语言处理NLP:主题LDA、情感分析疫情下的新闻文本数据
R语言对NASA元数据进行文本挖掘的主题建模分析
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
用于NLP的Python:使用Keras进行深度学习文本生成
长短期记忆网络LSTM在时间序列预测和文本分类中的应用
用Rapidminer做文本挖掘的应用:情感分析
R语言文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究
R语言对推特twitter数据进行文本情感分析
Python使用神经网络进行简单文本分类
用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类
R语言文本挖掘使用tf-idf分析NASA元数据的关键字
R语言NLP案例:LDA主题文本挖掘优惠券推荐网站数据
Python使用神经网络进行简单文本分类
R语言自然语言处理(NLP):情感分析新闻文本数据
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
R语言对推特twitter数据进行文本情感分析
R语言中的LDA模型:对文本数据进行主题模型topic modeling分析
R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)