首页 > 其他分享 >互联网新闻情感分析

互联网新闻情感分析

时间:2023-04-28 14:09:17浏览次数:37  
标签:情绪 新闻 分类器 情感 互联网 文本 预处理

访问【WRITE-BUG数字空间】_[内附完整源码和文档]

随着各种社交平台的兴起,网络上用户的生成内容越来越多,产生大量的文本信息,如新闻、微博、博客等,面对如此庞大且富有情绪表达的文本信息,完全可以考虑通过探索他们潜在的价值为人们服务。因此近年来情绪分析受到计算机语言学领域研究者们的密切关注,成为一项进本的热点研究任务。 本赛题目标为在庞大的数据集中精准的区分文本的情感极性,情感分为正中负三类。面对浩如烟海的新闻信息,精确识别蕴藏在其中的情感倾向。

一、任务描述

1.1 赛题背景

随着各种社交平台的兴起,网络上用户的生成内容越来越多,产生大量的文本信息,如新闻、微博、博客等,面对如此庞大且富有情绪表达的文本信息,完全可以考虑通过探索他们潜在的价值为人们服务。因此近年来情绪分析受到计算机语言学领域研究者们的密切关注,成为一项进本的热点研究任务。

本赛题目标为在庞大的数据集中精准的区分文本的情感极性,情感分为正中负三类。面对浩如烟海的新闻信息,精确识别蕴藏在其中的情感倾向。

1.2 任务要求

对官方提供的新闻数据进行情感极性分类,其中正面情绪对应0,中性情绪对应1以及负面情绪对应2。根据提供的训练数据,通过算法或模型判断出测试集中新闻的情感极性。

1.3 数据描述

数据包由两个csv文件组成:第一个是Train_Dataset,包含7360条新闻的id号,新闻标题和新闻内容。第二个是Train_Dataset_Label,包含了Dataset中新闻的id号,以其新闻的情感得分(用0,1,2表示)。

二、实施方案

该问题实质上为对信息的分类处理,所以核心内容是使用一个合适的分类器。其次,由于新闻是由文本构成的语言,一条新闻的情感通常可以由文本中词语的情感性决定。于是,另一个重要的内容是如何将数据进行预处理,即删除无用文字,并将新闻文本切分成一个个中文词语。

2.1 数据预处理

观察训练集中新闻的内容,发现新闻文本乱七八糟,有各种不属于中文词库的符号。所以预处理的第一步就是将不属于中文的文本删除(包括各种标点符号)。预处理的第二步是将修正后的文本进行词语的切分,从而将一整段话切分为一个个词语。

2.2 分类器选择

情感标签有三种赋值:积极、中立和消极。于是所有的二分类器就不可以使用,比如标准意义下的SVM支持向量机等。考虑到运行时间和效率,我们将选择朴素贝叶斯分类器作为首选(事实上,测试结果也表明朴素贝叶斯分类器是效率和正确率均较高的分类器)

互联网新闻情感分析_数据集

互联网新闻情感分析_数据_02

互联网新闻情感分析_数据集_03

互联网新闻情感分析_预处理_04

标签:情绪,新闻,分类器,情感,互联网,文本,预处理
From: https://blog.51cto.com/u_16075443/6233980

相关文章

  • 手把手教你对抓取的文本进行分词、词频统计、词云可视化和情感分析
    今日鸡汤苍苍竹林寺,杳杳钟声晚。大家好,我是Python进阶者。前言前几天星耀群有个叫【小明】的粉丝在问了一道关于Python处理文本可视化+语义分析的问题,如下图所示。他要构建语料库,目前通过Python网络爬虫抓到的数据存在一个csv文件里边,现在要把数据放进txt里,表示不会,然后还有后面的......
  • 互联网医院APP开发的未来:大数据、人工智能与智慧医疗
    互联网医院APP是智慧医疗行业极其重要的一环,通过它人们可以更好的就医,医生可以更高效率的工作。然而,随着技术的不断进步,互联网医院APP也在不断升级,新的技术也在不断被应用到互联网医院APP的开发中。本文将探讨互联网医院APP开发的未来:大数据、人工智能与智慧医疗。一、大数据在互联......
  • 深度学习--LSTM网络、使用方法、实战情感分类问题
    深度学习--LSTM网络、使用方法、实战情感分类问题1.LSTM基础长短期记忆网络(LongShort-TermMemory,简称LSTM),是RNN的一种,为了解决RNN存在长期依赖问题而设计出来的。LSTM的基本结构:2.LSTM的具体说明LSTM与RNN的结构相比,在参数更新的过程中,增加了三个门,由左到右分别是遗忘门(也......
  • 【NLP教程】用python调用百度AI开放平台进行情感倾向分析
    目录一、背景二、操作步骤2.1创建应用2.2获取token2.3情感倾向分析三、其他情感分析四、讲解视频一、背景Hi,大家!我是@马哥python说,一名10年程序猿。今天我来演示一下:通过百度AI开放平台,利用python调用百度接口进行中文情感倾向分析,并得出情感极性分为积极、消极还是中性以......
  • 互联网医院|互联网医院软件开发|医疗行业的新转机
    互联网医院的出现避免线下就诊可能带来的风险,解决患者就诊需求信息的快速发展,医疗是日常生活中必不可少的需求,随着人们生活水平的提高,对于医疗服务的要求也要求也有所提升,随着互联网技术的不断进步,让医疗也有了新的模式,在线问诊系统的出现让我们就医更加方便,让医院资源也得到节省,下......
  • 基于 Amazon SageMaker 构建细粒度情感分析应用
    背景介绍细粒度情感分析(Aspect-BasedSentimentAnalysis,ABSA)由于其广阔的业务价值而吸引越来越多的从业者投身其中,通过分析客户评论数据中的情感偏好往往有利于企业探寻客户关注点,挖掘客户需求,加速产品迭代,提高营销效率,完善售后服务等。毫不夸张地说,发掘出客户的声音(voiceofcu......
  • 互联网+制造业:图扑数字孪生智慧工厂车间生产线
    前言随着信息技术、自动化技术和人工智能等技术的快速发展和应用,智能制造已成为全球制造业发展的主流趋势。智能制造是将智能化、自动化、数字化和网络化等技术手段运用到制造过程中,使生产过程具有高度智能化、自动化和数字化的特点,进而提高生产效率,降低生产成本,优化产品质量,推动环......
  • 互联网+制造业:图扑数字孪生智慧工厂车间生产线
    前言随着信息技术、自动化技术和人工智能等技术的快速发展和应用,智能制造已成为全球制造业发展的主流趋势。智能制造是将智能化、自动化、数字化和网络化等技术手段运用到制造过程中,使生产过程具有高度智能化、自动化和数字化的特点,进而提高生产效率,降低生产成本,优化产品质量,推动环......
  • 第十二章——电商产品评论数据情感分析
    代码1——评论去重#代码12-1评论去重的代码importpandasaspdimportreimportjieba.possegaspsgimportnumpyasnp#去重,去除完全重复的数据reviews=pd.read_csv("D:/JupyterLab-Portable-3.1.0-3.9/新建文件夹/第十二章/reviews.csv")reviews=reviews[['......
  • 互联网医院:数字化时代下的医疗服务新模式
    随着互联网和数字技术的不断发展,互联网医疗已成为现代医疗领域的新兴趋势。互联网医院是一种基于互联网技术的医疗服务模式,它将医生、患者和医疗资源有机地连接在一起,提供在线咨询、远程诊断、药品配送等医疗服务,为广大患者带来更加便捷、高效、优质的医疗服务。互联网医院系统普遍......