首页 > 其他分享 >大数据——添加行业代码

大数据——添加行业代码

时间:2024-03-26 21:14:04浏览次数:27  
标签:stats df 行业 代码 county 添加 csv 数据

import pandas as pd

# 读取数据
df = pd.read_csv('new_result_05.csv')

# 行业分类与代码映射表
industry_mapping = {
    '农业': 'A01',
    '林业': 'A02',
    '畜牧业': 'A03',
    '采矿业': 'B',
    '农副食品加工业': 'C13',
    '化学原料及化学制品制造业': 'C27',
    '化学纤维制造业':'C28',
    '专用设备制造业':'C35',
    '电力、燃气及水的生产和供应业':'D',
    '建筑业':'E',
    '信息传输、计算机服务和软件业':'J',
    '自然科学研究与试验发展':'M73',
    '工程和技术研究与试验发展':'M74',
    '科技交流和推广服务业':'M75',
    '水利管理业':'N82',
    '环境管理业':'N83',
    '基础医学':'R81',
    '临床医学':'R82',
    '其他':'Z',
    '黑色金属冶炼及压延加工业':'C21',
    '医药制造业':'C21',
    '资源与环境':'E50',
    '先进制造与自动化':'C38',
    '材料与化工':'C27',
    '电子信息':'J72',
    '生物与医药':'C21',
    '现代农业':'A01',
    '社会公益':'S94',
    '航空与航天':'H48',
    '能源与交通':'D44',
    '交通运输设备制造业':'C37'
}

# 将所属技术领域映射为行业代码
df['应用行业代码'] = df['所属技术领域'].map(industry_mapping)

# 根据省市县进行统计
province_stats = df.groupby('省')['应用行业代码'].value_counts()
city_stats = df.groupby(['省', '市'])['应用行业代码'].value_counts()
county_stats = df.groupby(['省', '市', '县'])['应用行业代码'].value_counts()

# 数据下钻到县进行统计不同行业的数量
county_stats_unstacked = county_stats.unstack().fillna(0)
print(county_stats_unstacked)
# 将统计结果保存到 CSV 文件
county_stats_unstacked.to_csv('county_stats.csv', encoding='utf-8')
# 保存结果到新的CSV文件
df.to_csv('result_table06.csv', index=False)

标签:stats,df,行业,代码,county,添加,csv,数据
From: https://www.cnblogs.com/lin513/p/18097568

相关文章

  • Blazor学习记录六_模版化组件_渲染模式_CSS隔离和代码隔离
    17.模版化组件在组件中放置一个可渲染的代码片段供外部调用者来传入要渲染的内容及渲染样式,这样的组件就叫做模版化的组件。一般是一个支持泛型的组件,目标为消费者封装重复使用的通用性良好的UI组件。比如一个用来给用户呈现表格数据的表格组件。示例组件GenaricTable.razor代......
  • Temu api接口 获取商品详情 数据采集
    iDataRiver平台https://www.idatariver.com/zh-cn/提供开箱即用的Temu电商数据采集API,供用户按需调用。接口使用详情请参考Temu接口文档接口列表1.获取商品详情参数类型是否必填默认值示例值描述apikeystring是idr_***从控制台里复制apikeycountryst......
  • C++ 用户输入与数据类型详解:建立基本计算器及变量类型
    C++用户输入你已经学习了cout用于输出(打印)值。现在我们将使用cin来获取用户输入。cin是一个预定义变量,它使用提取运算符(>>)从键盘读取数据。在下面的示例中,用户可以输入一个数字,该数字存储在变量x中。然后我们打印x的值:示例intx;cout<<"Typeanumber:";//......
  • C++ 用户输入与数据类型详解:建立基本计算器及变量类型
    C++用户输入你已经学习了cout用于输出(打印)值。现在我们将使用cin来获取用户输入。cin是一个预定义变量,它使用提取运算符(>>)从键盘读取数据。在下面的示例中,用户可以输入一个数字,该数字存储在变量x中。然后我们打印x的值:示例intx;cout<<"Typeanumber:"......
  • ctgu 2024春数据库3.1-3.4
    3.1任务13.1任务23.1任务33.2任务13.2任务23.2任务33.3任务13.3任务23.3任务33.4任务13.4任务23.4任务3爱门......
  • 警务数据仓库的实现
    目录一、SQLServer2008R2(一)SQLServer的服务功能(二)SQLServerManagementStudio(三)MicrosoftVisualStudio二、创建集成服务项目三、配置“旅馆_ETL”数据流任务四、配置“人员_ETL”数据流任务(一)创建“人员_ETL”对象(二)配置“人员_ETL”参数五、配置“时间_ETL”......
  • iMessage群发之Java源代码功能实现
    iMessage群发软件作为一款内置的、深受用户喜爱的即时通讯工具,不仅为用户提供了高效、安全的通信方式,还允许用户通过群发功能一次性向多个联系人发送消息。Java作为一种广泛使用的编程语言,以其跨平台性、面向对象性、安全性等特点,在开发移动应用、服务器应用、Web应用等领域有着......
  • 数据结构-数组
    数组是一种最为常见和应用广泛的数据结构,不用语言的数组不太一样,对于js的数组来说,和python的列表极其类似,都是可动态拓展值和类型的,还是来大致总结一下这个基础数据结构.创建数组letarr1=newArray('a','b',66)letarr2=['a','b',66]console.log(arr1......
  • WPF —— Menu数据绑定实例
    {Binding}因为我们操作这个集合对象,而不是集中某个对象,所以直接写{Binding}就行      如果绑定是list集合的某个对象属性时候,需要{bindingvpath=属性名}<Menux:Name="m1"ItemsSource="{Binding}"></Menu>树形数据模板:分层数据模板,主要是用于MenuIt......
  • GBase8c 分布式数据库安装步骤
    GBase8c分布式数据库安装步骤GBase8c技术支持分布式安装数据库简介  GBase8c多模多态企业级分布式数据库具备高性能、高可用、弹性伸缩、高安全性等特性,可以部署在物理机、虚拟机、容器、私有云和公有云,为关键行业核心系统、互联网业务系统和政企业务系统提供安全、稳定、......