京津冀三省的2015年度的科技成果数据数据分析

时间：2024-02-28 17:26:23浏览次数：25

标签：京津冀 plot plt 三省科技成果表中 2015 counts data

原始题目要求：

一、 数据结构分析：

（1）京津冀三省的2015年度的科技成果数据原始表，为Access数据库，；

（2）要求将三省的科技成果数据汇总到同一表中（要求结果表为MySql数据表）；

（3）三个原始数据表结构不一致，要求结果表中包括所有的字段，表达意思相同或相似的字段要进行合并，不允许丢失字段（若只有本表独有字段，在结果表中其他两表数据在该字段填入空值）。

二、 数据同步练习：要求采编程实现三个原始表数据同步功能，将三个表的数据同步到一个结果表中。

三、 数据清洗练习：

（1）重复记录清洗，分析结果表中是否存在重复的数据记录，主要是地域和成果名称相同即判定为重复记录，保留一条记录，并补充其他重复记录中独有的数据字段内容，再删除其余记录。

（2）在结果表中追加年份和地域两个标准维度字段，如果原始表中存在该字段则直接转化成维度字段，若不存在则根据单位名称确定地域字段内容，天津科技成果表中不存在年度字段，则直接将年度维度字段确定为2015年。

四、 数据分析：

根据提供的已知字段名称，自动将科技成果分类，并且分析京津冀三地的科技优势。

五、将最终的MySQL数据表导入，放入源程序，将文件夹命名为为班级学号姓名提交。

# -*- coding: utf-8 -*-
import pandas as pd
import matplotlib.pyplot as plt

# 从CSV文件中读取数据
data = pd.read_csv('zongbiao.csv', encoding='utf-8')

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']

# 按地域分别筛选数据
hebei_data = data[data['地域'] == '河北']
tianjin_data = data[data['地域'] == '天津']
beijing_data = data[data['地域'] == '北京']

# 绘制各省份科技成果行业分布柱状图
plt.figure(figsize=(18, 6))
plt.subplot(1, 3, 1)
hebei_counts = hebei_data['行业'].value_counts()
hebei_counts[:10].plot(kind='bar')
plt.title('河北省科技成果行业分布')

plt.subplot(1, 3, 2)
tianjin_counts = tianjin_data['行业'].value_counts()
tianjin_counts[:10].plot(kind='bar')
plt.title('天津市科技成果行业分布')

plt.subplot(1, 3, 3)
beijing_counts = beijing_data['行业'].value_counts()
beijing_counts[:10].plot(kind='bar')
plt.title('北京市科技成果行业分布')

plt.tight_layout()
plt.show()

# 绘制各省份科技成果行业分布饼状图
plt.figure(figsize=(18, 6))
plt.subplot(1, 3, 1)
hebei_counts[:5].plot(kind='pie', autopct='%1.1f%%')
plt.title('河北省科技成果行业分布')

plt.subplot(1, 3, 2)
tianjin_counts[:5].plot(kind='pie', autopct='%1.1f%%')
plt.title('天津市科技成果行业分布')

plt.subplot(1, 3, 3)
beijing_counts[:5].plot(kind='pie', autopct='%1.1f%%')
plt.title('北京市科技成果行业分布')

plt.tight_layout()
plt.show()

标签：京津冀,plot,plt,三省,科技成果,表中,2015,counts,data
From： https://www.cnblogs.com/pengsuoqun123/p/18041111

AT_joi2015ho_b （dp思想）
难度2比较有意思的dp题首先发现这就是将一个环从中间一点一点剥开的过程。其次观察到joi取时右端点减左端点为偶数，ioi取时为奇数，所以一次一次dp即可。看到这种题时，发现有环，就要想到双倍延长再模拟一下题意，手玩一下即可//LUOGU_RID:117752061#include<bits/stdc++.h>using......
P4799 [CEOI2015 Day2] 世界冰球锦标赛
原题链接题解折半搜索前半部分的所有组合（二进制表示）存起来，然后遍历后半部分的组合，找到第一个加起来不大于M的=code#definelllonglong#include<bits/stdc++.h>usingnamespacestd;inlinevoidread(ll&x){ x=0; llflag=1; charc=getchar();whil......
C# vs2015 .dll模块联合开发好的应用程序进行调试
C#vs2015.dll模块联合开发好的应用程序进行调试右键项目->属性，1.点击“调试”侧边菜单，在“启动操作”选项中选择“启动外部程序”，然后选择应用程序的exe文件的路径2.点击“生成”侧边菜单，在“输出”选项中“输出路径”中选择将当前调试项目的最新dll文件（最新的代码）输出到应用......
P8026 [ONTAK2015] Bajtocja
P8026[ONTAK2015]Bajtocja题目描述给定d张无向图，每张图都有n个点。一开始，在任何一张图中都没有任何边。接下来有m次操作，每次操作会给出a,b,k，意为在第k张图中的点a和点b之间添加一条无向边。你需要在每次操作之后输出有序数对(a,b)的个数，使得1≤a,b≤n，且a点......
[SDOI2015] 寻宝游戏
[SDOI2015]寻宝游戏题目大意给你一棵树，边有边权，现在每个村庄可能会突然有宝藏，又可能会突然没宝藏。若可以随意选择起点，问每次修改后从起点遍历完所有宝藏再回到起点的最短路径长度。难度：七星（满分十星）题解注：$dis(x,y)$为$x$到$y$的距离。若目前有的点按照\(df......
[POI2015] LOG
点击查看代码#include<bits/stdc++.h>usingnamespacestd;inta[1000005];introot,tot;intread1(){ charcc=getchar(); while(!(cc>=48&&cc<=57)) { if(cc=='-') { break; } cc=getchar(); } boolf=false; ints=0; if......
P5478 [BJOI2015] 骑士的旅行 - 重链剖分
首先分析一下题目，对于这棵树，操作如下：查询从X到Y的路径上的前k大的值。把$P_i$上的武力值减去一个$F_i$并在Y上的武力值加上一个$F_i$，再把$P_i$改成Y。将$P_i$上的武力值减去一个$F_i$再加上一个Y，并把$F_i$改成Y。由第一个我们可以想到，先用树剖，再用......
P2178 [NOI2015] 品酒大会
题意简述定义后缀$p,q$是$r$相似的当且仅当$\forall1\lei\ler,s_{p+i-1}=s_{q+i-1}$。对于每一个$0\ler<n$，求出：有多少对$r$相似的后缀。每个后缀有权值$a_i$，求在所有$r$相似的后缀对$(p,q)$中$a_p\cdota_q$的最大值。若不存在则答案为......
JOISC 2015 题解
JOISC2015loj上有几乎全部的题目，写了题意的就是loj上没有的。D1T1简单题。因为$k$很小，考虑依次确定最后第$i$位是什么。我们倒序考虑所有操作，维护最后第$i$位当前在第几位，就可以一直推下去。提交记录D1T2直接暴力复杂度就是$O(k4^k)$的，可以通过。提交......
P5524 [Ynoi2012] NOIP2015 充满了希望题解
题目链接：充满了希望一开始以为是传统老题，结果看到有个交换单修操作，ODT这题试了下，应该$fake$了，毕竟有单修，很难保证之前的$log$级复杂度。有些较为智慧的解法确实不好思考，说个很简单的做法，这里没有问颜色数，而是问的颜色具体情况，那就比之前的很多题简单太多了。颜色的具体......

京津冀三省的2015年度的科技成果数据数据分析

相关文章

赞助商

阅读排行