首页 > 其他分享 >大三入学测试--数据分析练习(题目)

大三入学测试--数据分析练习(题目)

时间:2024-03-06 21:22:48浏览次数:27  
标签:数据分析 科技成果 -- 行政区划 地域 关键字 表中 行业 大三

一、 原始数据:

 

二、 地域维度标准化:

地域属性在科技成果分析中作为一个重要维度,其标准取值非常必要,目前我国采用的标准行政区划代码由两部分组成,一部分为行政区划编码,六位数字组成,前两位表示省编码,中间两位代表市编码,后两位表示所属市的区或县编码。一部分为行政区划名称。两部分在数据分析中经常用到,行政区划编码的树形结构在实现数据统计时的上钻和下卷功能尤其方便。

行政区划是国家标准中间有调整,需要根据年度确定该年度执行的国家标准。

要求在上次结果表的基础之上完成地域取值标准化。

(1) 增加行政区划编码列,具体取值与国家发布的行政区划标准相对应,例如130102表示河北省石家庄市长安区;

(2) 规范地域取值,统一命名规则为:河北省石家庄市长安区。没有地域属性要根据单位名称或单位地址确定地域数值,尽量规范到区县一级,如果不行至少到市一级。参考方法:可以通过百度地图或高德地图接口查询或者通过网络爬取方式补充完整地域属性信息。

三、 数据初级分析-分类

1.1京津冀科技成果表中字段比较完整其中关键字应用行业字段行业代码在科技成果数据分析中经常使用。1.2河北科技成果2015年第1-2-3期(技术)表中有行业字段,缺少关键字、行业代码。1.3天津科技成果(技术)表中上述三个字段就没有,表中的所属技术领域字段与行业相似,但并不是国家标准规范。

(1)补充关键字字段,从项目简介中提取关键字,补充完成1.2、1.3表中的关键字字段。

(2)补充应用行业字段和行业代码行业国家标准《国民经济行业分类与代码中间有调整,需要根据年度确定该年度执行的国家标准。

根据1.1和1.2表中行业分类,根据项目名称、关键字、项目简介字段,采用机器学习相关算法,补充1.3表中的行业分类和行业代码。

四、 数据可视化展示

(1) 根据地域属性实现数据的可视化展示,可以看到-市-区县三级数据下钻呈现的项目数量。

(2) 结合行业分类,显示省-市-区县不同的项目类型的数量。

(3) 分析京津冀三个省市科技成果中存在的优势和劣势。

标签:数据分析,科技成果,--,行政区划,地域,关键字,表中,行业,大三
From: https://www.cnblogs.com/copyjames/p/18057621

相关文章

  • E. Accidental Victory
    https://codeforces.com/problemset/problem/1490/EThisisachanllengingproblemoncodeforceswithadiffcuiltyscoreof1400.Itcanbesolvedbyusingsortandgreedyalgorithms.voidsolve(){intn;cin>>n;vector<pair<int,i......
  • Kob玩家匹配过程
    示意图:匹配流程说明:1.client1与client2向后端发送对战请求2.websocket分别对client1和client2建立两个链接3.websocet将client1和client2的请求发送到匹配系统(MatchingSystem)补充:匹配系统是一个独立的程序3.匹配系统中发现战力相近的两个玩家之后,为这两个玩家建立对局......
  • JDK1.5之后的自动装箱
    JDK1.5引入了一项非常实用的新特性,即自动装箱(Autoboxing)和自动拆箱(Unboxing)。这项特性的引入极大地简化了Java程序员在处理基本类型和它们对应的包装类之间的转换过程。自动装箱:自动装箱是指Java编译器能够在编译期间自动将基本数据类型转换为它们对应的包装类对象。例如,当你......
  • CS144_2020_Fall_lab0(实现开始,准备工作)
    碎碎念开头:三年竞赛无人问,一朝面试全盘输,大三的寒假过的并不是那么舒服,准备春招实习,筹备项目,面对满纸漏洞的简历,决定去做一下这个闻名已久的计算机网络实验:CS144-基于UDP实现TCP。虽说已经做完了,但是对于其中一些知识点扔不是很牢固,有些测试点仅仅也是面向样例编程,不明所以,仅以此......
  • 那年的夏天
    2008年大学暑假没有回老家,在地坛公园打工,学校宿舍不让住,宿舍门给锁上,停电,好像没有停水。当时也没有外面找地方就是每天晚上偷偷的从宿舍后面爬墙近宿舍楼,我们当时是2楼,早出晚归,所以也没有被发现。有一天晚上从外面花了3块买了个鸡架还有一瓶52度红星二锅头扁瓶的,偷偷摸摸的回到了......
  • day05_homework_dict
    点击查看代码#请将列表中的每个元素通过"_"链接起来。#users=['李少奇','李启航','渣渣辉']#print('_'.join(users))#请将列表中的每个元素通过"_"链接起来。"""users=['李少奇','李启航',666,'渣渣辉']......
  • 初三组合恒等式和二项式定理练习 题解
    A.多项式推柿子:\[\begin{aligned}&\sum\limits_{k=0}^{n}b_{k}(x-t)^{k}\\=&\sum\limits_{k=0}^{n}b_{k}\sum\limits_{i=0}^{k}\binom{k}{i}x^{i}(-t)^{k-i}\\=&\sum\limits_{0\leqslanti\leqslantk\leqslantn}\binom{k}{i}b_{......
  • oracle 19c 迁移到11g
    从19c导出数据需指定VERSION=11.2.0.1[qdtais1]@ht19c01[/home/oracle]$expdpet/etdirectory=ncdumpfile=et_%U.dmplogfile=expet.logVERSION=11.2.0.1Export:Release19.0.0.0.0-ProductiononWedMar620:54:512024Version19.15.0.0.0Copyright(c)1982,2......
  • WinRadius 企业版安装教程
    下载方法:WinRadius标准版只支持5个用户WinRadius企业版支持5000个用户安装方法:启动WinRadius。按照WinRadius的提示配置ODBC,然后重新启动WinRadius。把接入服务器(NAS)的Radius设置为WinRadius服务器,缺省端口为:1812(认证)、1813(计费),密钥为:WinRadius。具体配......
  • 飞机大战小游戏改进与创新
    飞机大战小游戏来源:[https://github.com/WindrunnerMax/AirplaneWar]运行环境:visualstudio2019运行截图如下:对源文件的各项代码,我进行了一些修改和创新,Bomb.cpp文件中,我发现以下问题:魔法数值硬编码:在Draw函数中出现了数字12和10,应该将这些魔法数值定义成常量或者宏以提高......