首页 > 其他分享 >京津冀三省的2015年度的科技成果数据数据分析

京津冀三省的2015年度的科技成果数据数据分析

时间:2024-02-28 17:26:23浏览次数:23  
标签:京津冀 plot plt 三省 科技成果 表中 2015 counts data

原始题目要求:

一、 数据结构分析:

(1)京津冀三省的2015年度的科技成果数据原始表,为Access数据库,;

 

(2)要求将三省的科技成果数据汇总到同一表中(要求结果表为MySql数据表);

(3)三个原始数据表结构不一致,要求结果表中包括所有的字段,表达意思相同或相似的字段要进行合并,不允许丢失字段(若只有本表独有字段,在结果表中其他两表数据在该字段填入空值)。

二、 数据同步练习要求采编程实现三个原始表数据同步功能,将三个表的数据同步到一个结果表中。

三、 数据清洗练习:

(1)重复记录清洗,分析结果表中是否存在重复的数据记录,主要是地域和成果名称相同即判定为重复记录,保留一条记录,并补充其他重复记录中独有的数据字段内容,再删除其余记录。

(2)在结果表中追加年份和地域两个标准维度字段,如果原始表中存在该字段则直接转化成维度字段,若不存在则根据单位名称确定地域字段内容,天津科技成果表中不存在年度字段,则直接将年度维度字段确定为2015年。

四、 数据分析

根据提供已知字段名称,自动将科技成果分类,并且分析京津冀三地的科技优势

五、 最终的MySQL数据表导入,放入源程序,将文件夹命名为为班级学号姓名提交

 

 

# -*- coding: utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt

# 从CSV文件中读取数据
data = pd.read_csv('zongbiao.csv', encoding='utf-8')

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']

# 按地域分别筛选数据
hebei_data = data[data['地域'] == '河北']
tianjin_data = data[data['地域'] == '天津']
beijing_data = data[data['地域'] == '北京']

# 绘制各省份科技成果行业分布柱状图
plt.figure(figsize=(18, 6))
plt.subplot(1, 3, 1)
hebei_counts = hebei_data['行业'].value_counts()
hebei_counts[:10].plot(kind='bar')
plt.title('河北省科技成果行业分布')

plt.subplot(1, 3, 2)
tianjin_counts = tianjin_data['行业'].value_counts()
tianjin_counts[:10].plot(kind='bar')
plt.title('天津市科技成果行业分布')

plt.subplot(1, 3, 3)
beijing_counts = beijing_data['行业'].value_counts()
beijing_counts[:10].plot(kind='bar')
plt.title('北京市科技成果行业分布')

plt.tight_layout()
plt.show()

# 绘制各省份科技成果行业分布饼状图
plt.figure(figsize=(18, 6))
plt.subplot(1, 3, 1)
hebei_counts[:5].plot(kind='pie', autopct='%1.1f%%')
plt.title('河北省科技成果行业分布')

plt.subplot(1, 3, 2)
tianjin_counts[:5].plot(kind='pie', autopct='%1.1f%%')
plt.title('天津市科技成果行业分布')

plt.subplot(1, 3, 3)
beijing_counts[:5].plot(kind='pie', autopct='%1.1f%%')
plt.title('北京市科技成果行业分布')

plt.tight_layout()
plt.show()

 

标签:京津冀,plot,plt,三省,科技成果,表中,2015,counts,data
From: https://www.cnblogs.com/pengsuoqun123/p/18041111

相关文章

  • AT_joi2015ho_b (dp思想)
    难度2比较有意思的dp题首先发现这就是将一个环从中间一点一点剥开的过程。其次观察到joi取时右端点减左端点为偶数,ioi取时为奇数,所以一次一次dp即可。看到这种题时,发现有环,就要想到双倍延长再模拟一下题意,手玩一下即可//LUOGU_RID:117752061#include<bits/stdc++.h>using......
  • P4799 [CEOI2015 Day2] 世界冰球锦标赛
    原题链接题解折半搜索前半部分的所有组合(二进制表示)存起来,然后遍历后半部分的组合,找到第一个加起来不大于M的=code#definelllonglong#include<bits/stdc++.h>usingnamespacestd;inlinevoidread(ll&x){ x=0; llflag=1; charc=getchar();whil......
  • C# vs2015 .dll模块联合开发好的应用程序进行调试
    C#vs2015.dll模块联合开发好的应用程序进行调试右键项目->属性,1.点击“调试”侧边菜单,在“启动操作”选项中选择“启动外部程序”,然后选择应用程序的exe文件的路径2.点击“生成”侧边菜单,在“输出”选项中“输出路径”中选择将当前调试项目的最新dll文件(最新的代码)输出到应用......
  • P8026 [ONTAK2015] Bajtocja
    P8026[ONTAK2015]Bajtocja题目描述给定d张无向图,每张图都有n个点。一开始,在任何一张图中都没有任何边。接下来有m次操作,每次操作会给出a,b,k,意为在第k张图中的点a和点b之间添加一条无向边。你需要在每次操作之后输出有序数对(a,b)的个数,使得1≤a,b≤n,且a点......
  • [SDOI2015] 寻宝游戏
    [SDOI2015]寻宝游戏题目大意给你一棵树,边有边权,现在每个村庄可能会突然有宝藏,又可能会突然没宝藏。若可以随意选择起点,问每次修改后从起点遍历完所有宝藏再回到起点的最短路径长度。难度:七星(满分十星)题解注:\(dis(x,y)\)为\(x\)到\(y\)的距离。若目前有的点按照\(df......
  • [POI2015] LOG
    点击查看代码#include<bits/stdc++.h>usingnamespacestd;inta[1000005];introot,tot;intread1(){ charcc=getchar(); while(!(cc>=48&&cc<=57)) { if(cc=='-') { break; } cc=getchar(); } boolf=false; ints=0; if......
  • P5478 [BJOI2015] 骑士的旅行 - 重链剖分
    首先分析一下题目,对于这棵树,操作如下:查询从X到Y的路径上的前k大的值。把$P_i$上的武力值减去一个$F_i$并在Y上的武力值加上一个$F_i$,再把$P_i$改成Y。将$P_i$上的武力值减去一个$F_i$再加上一个Y,并把$F_i$改成Y。由第一个我们可以想到,先用树剖,再用......
  • P2178 [NOI2015] 品酒大会
    题意简述定义后缀\(p,q\)是\(r\)相似的当且仅当\(\forall1\lei\ler,s_{p+i-1}=s_{q+i-1}\)。对于每一个\(0\ler<n\),求出:有多少对\(r\)相似的后缀。每个后缀有权值\(a_i\),求在所有\(r\)相似的后缀对\((p,q)\)中\(a_p\cdota_q\)的最大值。若不存在则答案为......
  • JOISC 2015 题解
    JOISC2015loj上有几乎全部的题目,写了题意的就是loj上没有的。D1T1简单题。因为\(k\)很小,考虑依次确定最后第\(i\)位是什么。我们倒序考虑所有操作,维护最后第\(i\)位当前在第几位,就可以一直推下去。提交记录D1T2直接暴力复杂度就是\(O(k4^k)\)的,可以通过。提交......
  • P5524 [Ynoi2012] NOIP2015 充满了希望 题解
    题目链接:充满了希望一开始以为是传统老题,结果看到有个交换单修操作,ODT这题试了下,应该\(fake\)了,毕竟有单修,很难保证之前的\(log\)级复杂度。有些较为智慧的解法确实不好思考,说个很简单的做法,这里没有问颜色数,而是问的颜色具体情况,那就比之前的很多题简单太多了。颜色的具体......