1 基本情况
题目:基于动态主题聚类的网络舆情反转识别模型构建与实证研究
录用期刊:情报理论与实践
撰写周期:15 days
审稿周期:2 months
2 写作经过
(1)思路来源:OB给的题目,确实好写噢。原始思路是找多个案例;对案例文本反转前聚个类,反转后聚个类,在不断添加中发现区别;在反转瞬间之前提前识别反转。
(2)读文献,发现目前关于反转的研究都不是这样的套路,借鉴价值不大。
(3)定思路:首先学习了一下OB提到的主题聚类算法,LDA输出的是一个文本的主题概率向量,可以很好当一个的喂神经网络的原料,于是就想到了找个深度学习模型。因为要融合时间特征,因此定了LSTM和GRU二选一。于是基本思路就定下来了:首先爬几十个案例的微博数据,对每个案例以小时为单位做主题聚类。将LDA后的概率向量送进GRU/LSTM识别出舆情反转的时间段,最终实现舆情反转识别模型的训练。
(4)数据:结合各种文献+百度找了27个经典反转案例(由于微博删数据删的厉害,好多经典案例相关微博已经快删光了用不了了,所以找了好久好久QAQ)
(5)代码:(1)爬虫->(2)数据清洗->(3)动态主题聚类dyLDA:动态选取文本,提取过去48小时微博至old Textset进行LDA,提取最新1小时微博至 new Textset 套入训练好的LDA model中,将每一个新微博的概率向量提取出来。->(4)反转识别:将概率向量送进神经网络实现二分类->(5)可视化
(6)写论文,改论文
3 论文内容
(1)整体研究框架
(2)DDPOR意见领袖识别模型
(3)章节安排:
0-引言
1-研究综述((1)舆情反转现象与定义(2)舆情反转内因与产生机理(3)舆情反转预测)
2 舆情反转特征与机理(2.1网络舆情反转特征 (1)反转速度快,热度迅速升高 (2)用户注意力转移,产生新的事件主题 (3)反转存在潜伏期,从反转声音出现到爆发需要一定时间 2.2网络舆情反转机理)
3 舆情反转识别模型构建(3.1 LDA主题聚类 3.2 GRU反转识别 3.3 DDPOR舆情反转实时识别模型)
4 实证分析(4.1事件选取 4.2数据采集 4.3实验准备 4.4实验结果 4.5对比实验)
5 结语
4 时间线
被拒了两次,中间磨磨蹭蹭耽误了好久
9月7日 OB给了题目
9月15日 完成前一篇文章,开工
9月20日 完成定思路与事件选取
9月27日 完成程序
9月30日 完成论文
10月19日 第一投情报杂志,退稿
12月27日 第二投知识发现,退稿
2月23日 第三投情报理论与实践
3月21日 退修
4月28日 录用
标签:LDA,反转,案例,舆情,聚类,识别,第二篇 From: https://www.cnblogs.com/rachel0701/p/17398102.html