首页 > 其他分享 >行业代码补充

行业代码补充

时间:2024-04-08 16:22:06浏览次数:19  
标签:name 补充 res 代码 res1 list len t2 行业

很简陋。。。就这样子吧。。

只根据大类来编码,不区分中小类了。。。

国民经济行业分类(大类)里面有敏感词,贴不出来,要的话去这篇文章下载吧:中国国民经济行业分类数据下载(含爬取代码) - 田智凯 - 博客园 (cnblogs.com)

我是直接模糊查询了,因为给出的行业不规范。

import pandas as pd
import difflib

df = pd.read_csv("国民经济行业分类(大类).csv",encoding= 'utf-8',sep='\t')
df2 = pd.read_csv("../关键词提取/t2_add.csv",encoding= 'utf-8')
# 将dataframe的某一列转换为list
code_list = df['code'].values.tolist()
name_list = df['name'].values.tolist()
t2_name = df2['行业'].values.tolist()
print('t2_name.len',len(t2_name))
res = []    # 行业代码结果
res_name=[]     # 行业标准名称结果
for i in range(len(t2_name)):
    # 模糊查询
    res1 = difflib.get_close_matches(t2_name[i], name_list, 1, cutoff=0.6)
    if len(res1) == 0:
        res.append('')
        res_name.append('')
    else:
        res_name.append(res1[0])
        for j in range(len(name_list)):
            # 这里需要注意一下是res1[0],如果是res1是取不出来的,res1是一个数组
            if res1[0] == name_list[j]:
                res.append(code_list[j])

print('res.len',len(res))
print(res)
df2['行业代码'] = res
df2['行业标准字段']=res_name
df2.to_csv('t2_add.csv',index=False)

结果:

 

 

参考:

Python List 高性能模糊搜索,模糊搜索优化_python 数组 筛选 模糊查找-CSDN博客

pandas学习笔记—dataframe与list相互转化_dataframe转list-CSDN博客

标签:name,补充,res,代码,res1,list,len,t2,行业
From: https://www.cnblogs.com/hmy22466/p/18116204

相关文章

  • 19天【代码随想录算法训练营34期】第六章 二叉树 part06(● 654.最大二叉树 ● 617.合
    654.最大二叉树#Definitionforabinarytreenode.#classTreeNode:#def__init__(self,val=0,left=None,right=None):#self.val=val#self.left=left#self.right=rightclassSolution:defconstructMaximumBinaryTree(s......
  • 9 年蝉联 IM 第一!艾瑞咨询发布最新报告,融云持续引领专业通信云行业
    近期,艾瑞咨询发布的《2024年全球互联网通信云(IM+RTC)行业研究报告》(下简称《报告》)显示,2023年全球互联网通信云市场规模达65亿元,其中中国市场占比约39%。过去一年,IMPaaS和 RTC PaaS市场均呈现头部集中态势,经对月独立设备数排名前1000的App进行测算,融云IM仍处......
  • 【图像融合】基于位置无关的相对辐射校正LIRRN的双时相遥感图像融合附matlab代码
     ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。......
  • 统计git代码行数 git统计代码提交行数
    项目中遇到写报告的时候要反馈某个人或者某个功能的代码量,可以简单的使用以下命令统计代码提交量,后续可以考虑集成到CI。--统计某个人的提交代码gitlog--author="username"--pretty=tformat:--numstat|gawk'{add+=$1;subs+=$2;loc+=$1-$2}END{printf"......
  • DMA第四版代码
    描述:我发现并不是所有的任务都有同步信号,这一期版本使用参数来控制是否需要同步信号;Test_Flow_Mode参数为高的时候意味着需要同步,否则不需要,仅检测数据流。不需要同步的情况如果丢包会出现严重后果。参考这篇笔记:https://www.cnblogs.com/VerweileDoch/p/18111545代码:`tim......
  • (译) 理解 Elixir 中的宏 Macro, 第六部分:原地代码生成
    ElixirMacros系列文章译文[1](译)UnderstandingElixirMacros,Part1Basics[2](译)UnderstandingElixirMacros,Part2-MacroTheory[3](译)UnderstandingElixirMacros,Part3-GettingintotheAST[4](译)UnderstandingElixirMacros,Part4-Div......
  • 如何选择靠谱的分离小三公司,邦贝分离小三公司揭秘行业内幕
    在当今社会,婚姻家庭的稳定性是社会稳定的基石。然而,随着社会的发展,人们面临的压力也越来越大,婚姻问题也日益凸显。其中,婚外情问题尤为突出,它不仅影响到夫妻双方的感情,还可能导致家庭破裂。在这种情况下,一些夫妻为了挽救婚姻,会选择寻求分离小三公司帮助。那么如何选择一家靠谱的......
  • 【对接方案】低代码对接微信公众号自动回复消息
    前言相信大家都有关注过不少微信公众号,其中有很多微信公众号提供了自动回复消息的功能,用户给微信公众号发送消息时,微信公众号会自动回复对应的消息,比如下图:接下来,小编就为大家介绍一下如何使用葡萄城公司的企业级低代码开发平台——活字格实现微信公众号自动回复消息。环境准......
  • 工程师首选:PW2202 NMOS管,200V1A/2A高效稳定,引领行业新潮流
    在当今日新月异的电子科技领域,功率开关电路的设计和应用对于整个系统的性能至关重要。PW2202硅N沟道增强型VDMOSFET以其独特的优势和卓越的性能,在各类功率开关电路中发挥着不可替代的作用。接下来,我们将从描述、特点和应用三个方面,深入剖析PW2202的优异表现。首先,PW2202硅N沟道增......
  • 模型代码理解本地知识库
    importosfromlangchain.chainsimportRetrievalQAfromlangchain_community.document_loadersimportTextLoaderfromlangchain_community.embeddingsimportOllamaEmbeddingsfromlangchain_community.llms.ollamaimportOllamafromlangchain_community.vectors......