首页 > 其他分享 >石家庄铁道大学2024年春季 2020 级课堂测试试卷—数据分析练习

石家庄铁道大学2024年春季 2020 级课堂测试试卷—数据分析练习

时间:2024-03-27 10:03:45浏览次数:24  
标签:数据分析 科技成果 行政区划 地域 2024 关键字 2020 表中 行业

石家庄铁道大学2024年

  2020 课堂测试试卷—数据分析练习

课程名称: 大数据库技术与应用  任课教师: 王建民   考试时间: 实现为止 分钟  

 

一、 原始数据:

 

二、 地域维度标准化:

地域属性在科技成果分析中作为一个重要维度,其标准取值非常必要,目前我国采用的标准行政区划代码由两部分组成,一部分为行政区划编码,六位数字组成,前两位表示省编码,中间两位代表市编码,后两位表示所属市的区或县编码。一部分为行政区划名称。两部分在数据分析中经常用到,行政区划编码的树形结构在实现数据统计时的上钻和下卷功能尤其方便。

行政区划是国家标准中间有调整,需要根据年度确定该年度执行的国家标准。

要求在上次结果表的基础之上完成地域取值标准化。

(1) 增加行政区划编码列,具体取值与国家发布的行政区划标准相对应,例如130102表示河北省石家庄市长安区;

(2) 规范地域取值,统一命名规则为:河北省石家庄市长安区。没有地域属性要根据单位名称或单位地址确定地域数值,尽量规范到区县一级,如果不行至少到市一级。参考方法:可以通过百度地图或高德地图接口查询或者通过网络爬取方式补充完整地域属性信息。

三、 数据初级分析-分类

1.1京津冀科技成果表中字段比较完整其中关键字应用行业字段行业代码在科技成果数据分析中经常使用。1.2河北科技成果2015年第1-2-3期(技术)表中有行业字段,缺少关键字、行业代码。1.3天津科技成果(技术)表中上述三个字段就没有,表中的所属技术领域字段与行业相似,但并不是国家标准规范。

(1)补充关键字字段,从项目简介中提取关键字,补充完成1.2、1.3表中的关键字字段。

(2)补充应用行业字段和行业代码行业国家标准《国民经济行业分类与代码中间有调整,需要根据年度确定该年度执行的国家标准。

根据1.1和1.2表中行业分类,根据项目名称、关键字、项目简介字段,采用机器学习相关算法,补充1.3表中的行业分类和行业代码。

四、 数据可视化展示

(1) 根据地域属性实现数据的可视化展示,可以看到-市-区县三级数据下钻呈现的项目数量。

(2) 结合行业分类,显示省-市-区县不同的项目类型的数量。

(3) 分析京津冀三个省市科技成果中存在的优势和劣势。

 

标签:数据分析,科技成果,行政区划,地域,2024,关键字,2020,表中,行业
From: https://www.cnblogs.com/DREAM2021/p/18098238

相关文章

  • 国赛报名开启 | 2024第十九届全国大学生智能汽车竞赛-天途创意组智慧巡检比赛
    ......
  • 2024年航空航天与智能计算国际学术会议 (ICAIC 2024)
    2024年航空航天与智能计算国际学术会议(ICAIC2024)2024InternationalAcademicConferenceonAerospaceandIntelligentComputing【会议简介】 2024年航空航天与智能计算国际学术会议即将在北京盛大召开。本次会议将汇聚全球航空航天与智能计算领域的专家学者,共同探......
  • 《青少年成长管理2024》 003 “你将面临一个怎样的世界”
    《青少年成长管理2024》003“你将面临一个怎样的世界”一、审视你将面临的世界二、机器替代人类劳动三、人工智能将给这个世界带来怎样的影响本节摘要一个生命降临世间,首要的任务是充分理解所面临的现实世界,这是做出明智选择的基础。机器替代人类的劳动,这本身就是......
  • 2024 年排名前 5 的 Node.js 后端框架
    自2009年以来,Node.js一直是人们谈论的话题,大多数后端开发人员都倾向于使用Node.js。在过去的几年里,它的受欢迎程度有所增加。它被认为是美国最受欢迎的网络开发工具,包括Netflix和PayPal等客户。受欢迎程度增加的原因是加载时间的减少和性能的提高。因此,分析2024......
  • 2024年人工智能、算法与自动化工程国际学术会议(ICAIAAE 2024)
    【会议简介】   2024年人工智能、算法与自动化工程国际学术会议将汇聚来自世界各地的顶尖学者,共同探讨人工智能、算法与自动化工程领域的尖端技术和发展趋势。会议将围绕深度学习、机器学习算法和自动化系统设计等多个主题展开,展示最新的研究成果,推动技术创新和产业应......
  • 算法模板收集 (截至2024.3.26)
    准备线下比赛用的模板,会一直更新,但更新频率不高。找个代码托管平台放一下或许更合适,不过暂时没心思做这个。小提示:点击任意标题旁边的“显示目录导航”,再点击右上角的图钉可以固定目录。约定:所有区间操作都是在闭区间上进行的。编译器要支持gnu++11标准基本框......
  • 【前端素材】推荐5种优质大数据分析展示页面网站设计(16)(附源码)
    一、需求分析1、功能分析大数据分析展示页面是一个用于呈现和分析大数据的平台界面,旨在帮助用户更直观、更高效地理解和利用数据。该页面通常结合了数据分析、可视化技术以及用户交互设计,以提供丰富的数据展示和分析功能。大数据分析展示页面是大数据分析过程中至关重要的一......
  • 【前端素材】推荐5种优质大数据分析展示页面网站设计(18)(附源码)
    一、需求分析1、功能分析大数据分析展示页面是一个用于呈现和分析大数据的平台界面,旨在帮助用户更直观、更高效地理解和利用数据。该页面通常结合了数据分析、可视化技术以及用户交互设计,以提供丰富的数据展示和分析功能。大数据分析展示页面是大数据分析过程中至关重要的一......
  • 2024年3月26号题解
    EightII解题思路使用IDA*算法进行搜索,同时遍历所有高度中最小的,再保存dfs中的路径就可以了代码实现#include<sstream>#include<iostream>#include<algorithm>#include<cstring>#include<unordered_map>#include<queue>#include<set>usingnamespacestd;......
  • NKCTF2024
    myfirstcms搜索版本跳转到登录页面爆破出用户密码adminAdmin123Extensions>UserDefinedTags->AddUserDefinedTag一句话木马Run拿到flag全世界最简单的CTF拿到源码格式化constexpress=require('express');constbodyParser=require('body-parser');......