首页 > 其他分享 >R语言语义分析主题建模探析大数据期刊文章研究热点可视化

R语言语义分析主题建模探析大数据期刊文章研究热点可视化

时间:2024-02-21 10:22:27浏览次数:24  
标签:栏目 13 主题 建模 热门 可视化 期刊 探析 数据

原文链接:http://tecdat.cn/?p=13709 

原文出处:拓端数据部落公众号

 

 

大数据已经成为变革和创新的技术力量和思维方式,成为当前研究的热门领域。

 

 

本文对相关主题下的知网期刊文章数据集进行分析,识别出期刊文章内容近年来变化的规律。

期刊热门栏目近年来的变化

经过几年的蓄势待发,13年伊始,“大数据”成为热门概念,人民日报将2013年称为“大数据元年”。我们将2013年作为时间点,对其前后7年的期刊热门栏目数目的变化进行比较。

图表1

可以发现与数据相关的信息技术、统计研究、计算机科学、软件开发等栏目数目在2013年以后出现增加(图1),这在一定程度上说明对于大数据科学的研究处于增长阶段。部分13年以前热门的栏目由于概念逐渐冷门或者名称变化,数量逐渐减少,如微计算机信息、教学研究等。同时可以发现网络技术、农业装备与机械化工程 、医疗信息系统等栏目数量没有发生明显变化。

不同主题下的期刊栏目数目变化

本文对数据集进行概率潜在语义分析主题建模,识别出标题中出现的高频词汇,并研究其分布规律。考虑文章中出现频率最高的词汇,因此我们基于关键词组以及文章主题进行PLSA分析。

图表2

经过多次循环发现,当K =5 时结果最优,因此将数据分配到5个潜在主题下。在此基础上,得到了潜在主题1的抽取概率以及对应的前 3 个标签,并将其最高频率作为主题代表词。 从图2可以发现,对主题1而言,它下面所属的“数据”、“信息”、“链接”、“方法”以及“信息”概括出了此标题主要是针对信息管理方面进行描述,在此将每组中前 3 个标签里概率最大的作为主题元素。

通过 图 2 ,可以很明显的观察到概率潜在语义分析法能够在一定程度上将具有代表性的标签显示出来。根据 图 2 所描述的主题1-主题5下的高频标签情况,可以观察发现,有一些标签如“数据”、“链接”出现在很多潜在语义下面,这有力地解决了一词多义的问题,在特定的某个标题下只有确定的某一个含义,同时也将具有相同或类似含义的标签根据选取的频率值进行过滤。

同时,在对应主题下的标签已经能够基本上将此资源在相应主题下的特征表示出来。比如对于主题 2 而言,它下面所属的“ 教学 ”、“学生”、“信息”概括出了此标题主要是针对学生 的 信息 技术教学 方面进行描述。

热门关键词在期刊栏目中的分布

接下来我们对比了文章中出现的高频关键词在不同期刊栏目中的分布,分析其分布规律。

图表3

从中我们可以看到 ,13年之后”信息“关键词出现最多的栏目是信息管理、教育研究和计算机与网络,13年之前是教育研究和统计研究,可见计算机与网络、信息管理和信息教育成为”信息”关键词相关文章的热门应用和研究领域。同时可以看到13年之后”数据“关键词出现最多的栏目是数据技术和信息管理,13年之前是数据库技术统计研究和微计算机信息,可见数据库技术、信息管理和统计研究成为”数据”关键词相关文章的热门应用和研究领域。

标签:栏目,13,主题,建模,热门,可视化,期刊,探析,数据
From: https://www.cnblogs.com/tecdat/p/18024596

相关文章

  • Python用GAN生成对抗性神经网络判别模型拟合多维数组、分类识别手写数字图像可视化
    全文链接:https://tecdat.cn/?p=33566原文出处:拓端数据部落公众号生成对抗网络(GAN)是一种神经网络,可以生成类似于人类产生的材料,如图像、音乐、语音或文本。最近我们被客户要求撰写关于GAN生成对抗性神经网络的研究报告,包括一些图形和统计输出。近年来,GAN一直是研究的热门话题。F......
  • R语言Apriori关联规则、kmeans聚类、决策树挖掘研究京东商城网络购物用户行为数据可视
    全文链接:http://tecdat.cn/?p=30360最近我们被客户要求撰写关于网络购物用户行为的研究报告,包括一些图形和统计输出。随着网络的迅速发展,依托于网络的购物作为一种新型的消费方式,在全国乃至全球范围内飞速发展电子商务成为越来越多消费者购物的重要途径。我们被客户要求撰写关......
  • R语言基于ARCH模型股价波动率建模分析|附代码数据
    原文链接: http://tecdat.cn/?p=3856原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于ARCH的研究报告,包括一些图形和统计输出。引言金融中一个重要度量是与资产相关的风险,而资产波动率是最常用的风险度量。然而,资产波动率的类型有多种。波动率不能直接观测的性质在波......
  • 可视化视频监控平台EasyCVR如何配置服务参数以免getbaseconfig接口信息泄露?
    可视化云监控平台/安防视频监控系统EasyCVR视频综合管理平台,采用了开放式的网络结构,平台支持高清视频的接入和传输、分发,可以提供实时远程视频监控、视频录像、录像回放与存储、告警、语音对讲、云台控制、平台级联、磁盘阵列存储、视频集中存储、云存储等丰富的视频能力,同时还具......
  • 立体之路:解锁3D可视化模型下的交通新世界
    在科技的浪潮中,每一个革新都是对人类未来生活的深度洞察。而今,当可视化这一技术走进我们的视野,它不仅是一场视觉盛宴,更是一次对未来出行方式的全新探索。 一、从平面到立体,解锁道路新视角你是否曾站在十字路口,对着复杂的交通网络感到迷茫?传统的道路地图,虽然详尽,但总是缺乏直观......
  • 适用于 Amazon Step Functions 的低代码可视化新工作流 Workflow Studio, 现已在 Amaz
    今天,我们非常欣喜地宣布现已在AmazonApplicationCompose中推出AmazonStepFunctionsWorkflowStud。通过这款全新的集成应用,工作流与应用程序资源开发便可整合到统一的可视化基础设施即代码(IaC)生成器。对于使用AmazonStepFunctionsWorkflowStudio创建工作流与......
  • 数据可视化为什么能帮助我们打造智慧城市?
    在数字时代的浪潮中,数据可视化崭露头角,为打造智慧城市注入了强大的活力。不再被深奥的数据所束缚,我们通过数据可视化这一工具,可以更加接近智慧城市的未来。下面我就以可视化从业者的角度来简单聊聊这个话题。数据可视化首先为城市带来了深刻的洞察力。通过直观的图表和图形,城市......
  • 农村高中生源转型期提升学生二次函数建模能力的课堂探究
       良好的教学情境是促使学生开展主动思考和深度学习活动的重要保障。数学知识都源于现实生活,所以在培养高中生建模思想与意识期间,除了注意结合数学教材中的相关内容之外,也要注意紧密联系学生的实际生活。因为建模思想的应用都建立在对生活中实际问题的抽象化表达上,所以如果......
  • 可视化工具:将多种数据格式转化为交互式图形展示的利器
    引言在数据驱动的时代,数据的分析和理解对于决策过程至关重要。然而,不同的数据格式和结构使得数据的解读变得复杂和困难。为了解决这个问题,一种强大的可视化工具应运而生。这个工具具有将多种数据格式(包括JSON、YAML、XML、CSV等)转化为交互式图形展示的能力。它的实用性在于用......
  • 代码变更风险可视化系统建设与实践
    2023年09月22日 作者:桂来 文章链接 9054字 19分钟阅读1软件系统风险与变更变更是软件系统进化的推动力,同时也是孕育风险的温床。如果一个系统没有了相应的迭代和变更,那这个系统就会逐渐失去了活性和价值。不过,随着系统进行了变更迭代,软件风险也会慢慢衍生,而规避变更引......