首页 > 编程语言 >Python拆分列中文和 字符

Python拆分列中文和 字符

时间:2023-10-23 18:15:02浏览次数:34  
标签:字符 中文 sheet name 分列 Python text df

import pandas as pd

def extract_characters(file_path, sheet_name, column_name):
    # 读取Excel文件
    df = pd.read_excel(file_path, sheet_name=sheet_name)

    # 创建两个新的列
    df['中文'] = ''
    df['其他字符'] = ''

    # 遍历每行数据
    for index, row in df.iterrows():
        text = str(row[column_name])  # 获取指定列的值
        chinese = ''
        other = ''
        # 遍历每个字符
        for char in text:
            if '\u4e00' <= char <= '\u9fff':  # 判断当前字符是否为中文字符
                chinese += char  # 如果是中文字符,则添加到中文字符集合中
            else:
                other += char   # 如果不是中文字符,则添加到其他字符集合中
        df.at[index, '中文'] = chinese  # 将中文字符集合添加到新的“中文”列中
        df.at[index, '其他字符'] = other  # 将其他字符集合添加到新的“其他字符”列中

    # 返回处理后的DataFrame对象
    return df

# 测试示例
file_path = r'测试.xlsx'
sheet_name = 'Sheet1'
column_name = '店铺销售sku'

result_df = extract_characters(file_path, sheet_name, column_name)
result_df.to_excel('result.xlsx', index=False)

 

标签:字符,中文,sheet,name,分列,Python,text,df
From: https://www.cnblogs.com/lcl-cn/p/17783106.html

相关文章

  • Mysql新增分区-Python版
    importdatetimeimportsysimportpandasaspdimportpymysqlimportsqlalchemy.engine.urlasengineUrlfromsqlalchemyimportcreate_engineDB_INFO={"host":"IP","port":3306,"username":"ro......
  • Qt - Label标签显示特殊字符
    1.创建一个带Ui界面的测试工程,把特殊字符拷贝到label标签里,点击保存。 2.打开qt安装目录,找到designer.exe文件双击打开 3.把刚刚创建的ui界面拖进来 4.点击窗口-》ViewC++Code...5.会弹出一个窗口里面有ui文件的源码,还有一串特殊数字,这串特殊数字就是那个特......
  • 【文心一言】百度千帆 Python 和 JavaScript 调用上下文 API
    接口为:百度ERNIE-Bot-4(邀测)控制台直达链接JavascriptconstAK="urAK"constSK="urSK"constaxios=require("axios").default;letaccess_token="urtoken"varurl='https://aip.baidubce.com/rpc/2.0/ai_custom/v1/w......
  • 【Python微信机器人】第二篇:将python注入到其他进程
    目录修整目前的系列目录(后面会根据实际情况变动):在windows11上编译python将python注入到其他进程并运行使用C++写一个python的pyd库,用于实现inlinehookPythonctypes库的使用使用ctypes主动调用进程内的任意函数使用汇编引擎调用进程内的任意函数(为了调用不遵守任何一......
  • Python生成器
    Python生成器1、什么是生成器根据程序员制定的规则循环生成数据,当规则不成立时则生成数据结束。数据不是一次性全部生成出来的,而是使用一个,再生成一个,可以节约大量的内存。创建生成器的方式:①生成器推导式②yield关键字2、生成器推导式#创建生成器#生成器推导式=》(......
  • Python:深拷贝与浅拷贝
    python:深拷贝与浅拷贝一、了解几个概念变量:是一个系统表的元素,拥有指向对象的连接空间对象:被分配的一块内存,存储所代表的值引用:是自动形成的从变量到对象的指针类型:属于对象,而非变量不可变对象:一旦创建就不可修改的对象(值内存地址固定后不可以再修改其值),包括字符......
  • java8 map过滤 map转字符串
    Map<String,Long>map=newHashMap<>();map.put("aaa",1L);map.put("bbb",2L);map.put("ccc",1L);Map<String,Long>map2=map.entrySet().stream().filter(e->e.getValue().intValue()>1).collect(Coll......
  • 栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)
    诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。BERT的核心思想是通过在大规模文本语料上进行无监督预......
  • python通过脚本路径获取对应脚本里的内容
    importinspectfromimportlib.utilimportspec_from_file_location,module_from_specscript_path="test.py"spec=spec_from_file_location("test",script_path)module=module_from_spec(spec)spec.loader.exec_module(module)print(modul......
  • [Leetcode] 0821. 字符的最短距离
    821.字符的最短距离题目描述给你一个字符串s和一个字符c,且c是s中出现过的字符。返回一个整数数组answer,其中answer.length==s.length且answer[i]是s中从下标i到离它最近的字符c的距离。两个下标 i和j之间的距离为abs(i-j),其中abs是绝......