首页 > 其他分享 >主题挖掘LDA和情感分析图书馆话题知乎用户问答行为数据|附代码数据

主题挖掘LDA和情感分析图书馆话题知乎用户问答行为数据|附代码数据

时间:2023-03-07 23:55:59浏览次数:65  
标签:LDA 知乎 主题 图书馆 情感 挖掘 文本 数据

全文链接:http://tecdat.cn/?p=16890

最近我们被客户要求撰写关于主题挖掘LDA和情感分析的研究报告,包括一些图形和统计输出。

当前是大数据盛行的时代,各种用户信息行为数据分析的结果影响着人们的生活和学习,同时对图书馆的发展也有着影响

 

本文在图书馆话题下知乎用户问答行为数据的基础上,分析了图书馆信息资源建设的新要求,并提出了相关建议。

 

图书馆热门话题

 

通过主题挖掘分析知乎热门图书馆话题下的问答,了解到目前大多数用户去图书馆不再单纯的以获取资源为目的,除了借还书和查阅文献资料外,更多的读者是选择来图书馆进行自习、复习、备考,他们认为图书馆更有学习的氛围,同时有很多用户关注图书馆交友的话题。

 

 


图表1

 

图片


 

我们从评论数量、被关注度和赞同数量来评估用户的参与程度,可以看到图书馆交友话题(主题1)关注人数和赞同人数最多(如图书馆怎么认识女生?),其次是考研、复习(主题3)的相关话题(如图书馆应该为考研学生提供特权吗?),该话题下讨论的人数最多。接下来是学校图书馆对外开放(主题2)的话题(如公办大学的图书馆/自习室该不该对外开放?)和学习环境话题(主题4)(如本部图书馆内部环境设置怎么样,在同类高校中是属于很陈旧的还是很现代化的?)。


点击标题查阅往期内容

图片

自然语言处理NLP:主题LDA、情感分析疫情下的新闻文本数据

图片

左右滑动查看更多

图片

01

图片

02

图片

03

图片

04

图片

 

图书馆话题内容表达的情感

 

接下来,通过主题挖掘和情感分析(也称为意见挖掘)知乎热门话题下的问答,我们详细看下热门话题中用户表达了哪些情感。

 

 


图表2

 

图片


 

从图书馆资源设施和学习环境话题来看,环境优美、设施齐全的图书馆的上座率更高,在期末备考或者迎接大型考试的前期图书馆的上座率又普遍上升,大多用户对占座表达出负面情绪,这说明在用户看来图书馆是整个学校最能提供足够学习氛围的场所,融休闲与学习为一体的咖啡厅式图书馆更受广大用户的喜爱。图书馆交友话题最为热门,很多用户有“书中自有颜如玉”的想法,预设图书馆是浪漫邂逅的地方。同时,从聊天、吵闹等负面关键词来看大多数用户表达出他们更愿意在安静愜意的图书馆环境里来读书。

 

 

疫情前后的图书馆话题

 

 

新型冠状病毒导致的肺炎疫情给大学图书馆信息资源建设工作带来了极大影响和冲击,通过时间线的对比,我们发现疫情前后的图书馆话题数量和情感表现发生明显变化。

 

 


图表3

 

图片


 

由于疫情原因,图书馆闭馆后,很多用户表达出了开馆少、无法自习、借书逾期等负面情感。从正面情感来看,一些用户回答表示图书馆加强了网络在线服务,确保数据库资源正常使用和相关文献资源使用权,还策划了一些列活动以期更加全面地帮助全校师生在疫情防控期间充分利用网络进行专业资源,助力师生更好地开展学习、生活和科研等工作。同时,图书馆免除读者在疫情防控期间所产生的图书逾期费用。面对新冠病毒导致的肺炎疫情带来的深远冲击,抓住机遇,引入新技术、新模式,更好地保障用户的科研、学习需求,是当前图书馆的必然选择。


图片

本文摘选 《 数据视域下图书馆话题情感分析 》 ,点击“阅读原文”获取全文完整资料。


点击标题查阅往期内容

文本挖掘NLP分析:LDA主题模型分析网购数据
游记数据感知旅游目的地形象
数据类岗位需求的数据面NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据
Python主题建模LDA模型、t-SNE 降维聚类、词云可视化文本挖掘新闻组数据集
自然语言处理NLP:主题LDA、情感分析疫情下的新闻文本数据
R语言对NASA元数据进行文本挖掘的主题建模分析
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
用于NLP的Python:使用Keras进行深度学习文本生成
长短期记忆网络LSTM在时间序列预测和文本分类中的应用
用Rapidminer做文本挖掘的应用:情感分析
R语言文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究
R语言对推特twitter数据进行文本情感分析
Python使用神经网络进行简单文本分类
用于NLP的Python:使用Keras的多标签文本LSTM神经网络分类
R语言文本挖掘使用tf-idf分析NASA元数据的关键字
R语言NLP案例:LDA主题文本挖掘优惠券推荐网站数据
Python使用神经网络进行简单文本分类
R语言自然语言处理(NLP):情感分析新闻文本数据
Python、R对小说进行文本挖掘和层次聚类可视化分析案例
R语言对推特twitter数据进行文本情感分析
R语言中的LDA模型:对文本数据进行主题模型topic modeling分析
R语言文本主题模型之潜在语义分析(LDA:Latent Dirichlet Allocation)

标签:LDA,知乎,主题,图书馆,情感,挖掘,文本,数据
From: https://www.cnblogs.com/tecdat/p/17190309.html

相关文章

  • luffy登录注册页面 redis介绍安装 redis普通连接与连接池 redis数据类型 redis字符串
    目录回顾登录页面分析代码登录页面注册页面Redis介绍与安装介绍:面试题:redis为什么这么快?安装安装目录启动客户端连接Redis普通连接和连接池普通连接连接池连接传统方案连接......
  • 《数据库基础语法》1. 在SQL的世界里一切都是关系
    楔子SQL是每个开发人员都应该掌握的,很多人可能觉得SQL没啥大不了的,但是说真的,SQL要是写好了,是很厉害的。下面我们来从零开始学习SQL。基本概念正如Linux中一切皆文......
  • 数据仓库基本概念
    数仓分层都分哪些层?一般来说,数据仓库我们可以分为如下5层:关于数仓分层,不同的公司分的层数是不一样的,并且数仓的每一层的命名也没有一个统一的标准,比如这一层就叫这个名......
  • 数据仓库的数据建模基本流程#yyds干货盘点#
    数据建模基本流程数据仓库的数据建模基本流程一般分为以下三个阶段:概念模型、逻辑模型、物理模型。概念模型:概念模型的主要目的是定义业务概念和关系,描述业务过程、业......
  • matplotlib:python数据处理三剑客之一
    1.基本使用importnumpyasnpimportmatplotlib.pyplotaspltimportpandasaspd#生成一系列xx=np.linspace(-1,1,50)#生成对应的yy1=2*x+1y2=x......
  • 《数据库基础语法》6. 日期和时间的存储与格式转换
    楔子上次我们介绍了SQL中常见的字符函数,学习了如何对文本数据进行连接、大小写转换、子串的查找和替换等处理。下面我们继续讨论常见的日期和时间函数,以及不同数据类型......
  • 《数据库基础语法》5. 什么是函数?如何利用函数提高效率
    楔子SQL语句主要的功能就是对数据进行处理和分析。为了避免重复造轮子,提高数据处理的效率,SQL为我们提供了许多标准的功能模块:函数(Function)。SQL函数是一种具有某种功......
  • 数据结构01
    一.总览二.数据结构的基本概念2.1.导图2.2.什么是数据?数据是信息的载体,是描述客观事物属性的数、字符及所有能够被输入到计算机中并被计算机程序识别和处理的符号的......
  • Mosaic数据增强的实现
    mosaic数据增强是一种在YOLOv4中首次引入的数据增强技术,它可以将4张训练图像以一定的比例合并成一张。这样可以让模型学习如何在比正常更小的尺度上识别物体,也可以在训练中......
  • String类和基本数据类型
    String和基本数据类型笔记String笔记String基础publicfinalclassString  implementsjava.io.Serializable,Comparable<String>,CharSequence{在String源码......