首页 > 其他分享 >R语言Pearson相关性分析就业率和“性别平等”谷歌搜索热度google trend时间序列数据可视化

R语言Pearson相关性分析就业率和“性别平等”谷歌搜索热度google trend时间序列数据可视化

时间:2023-02-13 23:12:27浏览次数:60  
标签:Pearson trend 回归 谷歌 google employed csv

全文链接:http://tecdat.cn/?p=31585

原文出处:拓端数据部落公众号

Google Trends, 即谷歌趋势。谷歌趋势是谷歌旗下一款基于搜索数据推出的一款分析工具。它通过分析谷歌搜索引擎每天数十亿的搜索数据,告诉用户某一关键词或者话题各个时期下在谷歌搜索引擎中展示的频率及其相关统计数据。

我们为一位客户进行了短暂的咨询工作,他正在构建一个主要基于谷歌搜索词热度和就业率的分析应用程序。

思路是这样的: 用本科就业人数employed-bachelor的数据除以总就业人数employed-all的数据,得出百分比,即本科就业率。

然后把关键词“性别平等”(gender equality)的谷歌趋势google trend的数据整合成月的, 两个数据做成一个表格, 然后作pearson correlation相关性的分析,和可视化:

image.png

image.png

image.png

读取数据

employedall=read.csv("employed-all.csv")  
employed_bachelor=read.csv("employed-bachelor.csv")  
google=read.csv("gender equality- google trend.csv",skip=4)

image.png

合并数据

把google trend的数据整合成月的

for(j in c("01","02","03","04","05","06","07","08","09","10","11","12")){  
  ym=paste(i,"-",j,sep="")  
    index=grep(ym, google$Week )  
    monthsum=c(monthsum,sum(as.numeric(google$gender.equality[index])))

image.png

合并google trend的数据和就业数据

result=cbind(monthsum,employed$proportion)

image.png

分析相关性可视化

20200407141144647.png

Pearson's相关性检验

在统计学中,皮尔逊相关系数,是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间,其绝对值越大说明该两个变量越相关。

cor.test(result$employed,result$google)

image.png

首先看Y与X是否有显著关系,即P值大小,接着分析相关关系为正向或负向,也可通过相关系数大小说明关系紧密程度。一般相关系数在0.7以上说明关系非常紧密。p<0.01,因而说明本科就业率和性别平等搜索热度之间有着显著的正相关关系。


QQ截图20220608234324.png

最受欢迎的见解

1.R语言多元Logistic逻辑回归 应用案例

2.面板平滑转移回归(PSTR)分析案例实现

3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R语言泊松Poisson回归模型分析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度检验

6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

标签:Pearson,trend,回归,谷歌,google,employed,csv
From: https://www.cnblogs.com/tecdat/p/17118239.html

相关文章

  • Google_MapReduce中文版
    笔者最近在看MIT6.824的lab1,实验内容是实现一个简易的MapReduce。本篇文章是MapReduce论文的中文翻译。@Author:Akai-yuan@更新时间:2023/2/13摘要MapReduce是一个编程......
  • Google Guice 用户指南 - Ⅰ:概览
    译者:kefate原文:https://github.com/google/guice/wiki/Overview大家好,我是kefate。今天开始我将会把GoogleGuice的官方文档陆续翻译一遍,水平有限,若有翻译不妥之处,还望......
  • ChatGpt*u_ Predict the trend of U.S. stocks in 2023
    question:PredictthetrendofU.S.stocksin2023chatgpt: I'msorry,butasanAIlanguagemodel,Idonothavetheabilitytopredictfuturemarkettrends......
  • ReplaceGoogleCDN扩展 V2版本和V3版本的区别
    文档说明:只记录关键地方;2023-02-11环境:chromium内核备注:firefox目前不支持declarativeNetRequest区别:v2版本允许通过javascript脚本动态修改HTTP请求头、......
  • google广告分类
    Google广告的偏好设置,根据兴趣类别和受众人口统计特点类别来展示广告,可以设置站点Adsense的出现广告的类别,Adsense的分类体系如下:1、类别:1578,不算多,也不算少。2、级别:一级大......
  • Google Apprentice Bard AI chatbot All In One
    GoogleApprenticeBardAIchatbotAllInOneAIchatbot/AI聊天机器人ApprenticeBardApprenticeBardGoogle'spotentialChatGPTrivalAboutApprenticeBar......
  • java.lang.NoSuchMethodError: com.google.gson.GsonBuilder.setLenient()Lcom/google
    引入第三方的工具类,重新启动项目就会奇奇怪怪的报错。加载不到gson类。一开始以为是没有加载到,各种引入,清理问题依然存在。直到仔细看报错信息,里面是spring的类报错,才意识......
  • 谷歌关键词是怎么排名的?google关键词优化
    本文主要分享关于谷歌排名算法的一些分析以及谷歌关键词优化的细节。本文由光算创作,有可能会被修改和剽窃,我们佛系对待这种行为吧。谷歌关键词排名是指确定网站在搜索引擎结......
  • Casbin: 连续3年参加Google Summer of Code的开源授权技术领导者
    Casbin是一个开源的授权解决方案,很自豪的宣布它已经连续三年参加GoogleSummerofCode(GSoC)项目。Casbin是实现访问控制和授权管理的最受欢迎的开源项目之一。该项目广泛应......
  • Casbin: 连续3年参加Google Summer of Code的开源授权技术领导者
    Casbin是一个开源的授权解决方案,很自豪的宣布它已经连续三年参加GoogleSummerofCode(GSoC)项目。Casbin是实现访问控制和授权管理的最受欢迎的开源项目之一。该项目广泛......