首页 > 其他分享 >提取图片名称到excel中

提取图片名称到excel中

时间:2023-12-13 15:44:06浏览次数:32  
标签:字符 提取 文件名 Excel excel 文件夹 名称 文件 图片

脚本介绍

功能

这个Python脚本旨在自动化处理一个特定文件夹中的图片文件名,提取每个文件名中的中文字符,并将这些字符保存到一个Excel表格中。它特别适用于那些需要从大量图片文件中提取文本信息以进行进一步分析或记录的情况。

使用场景

  • 餐饮业:从包含菜品图片的文件夹中提取菜名,用于菜单创建或库存管理。
  • 档案管理:整理包含中文名称的文档或图片,方便后续的索引和查找。
  • 数据整理:对大量包含中文名称的图片文件进行快速整理和分类。

工作流程

  1. 输入文件夹地址:用户需要提供包含.jpg图片文件的目标文件夹路径。
  2. 处理文件名:脚本遍历文件夹中的所有.jpg文件,移除文件名中的非中文字符,包括文件扩展名和前面的编号。
  3. 生成Excel表格:处理后的文件名(即中文字符)被保存到一个新创建的Excel表格中,这个表格位于同一目标文件夹下。

注意事项

  • 确保目标文件夹路径正确且该文件夹包含.jpg格式的图片文件。
  • 脚本只处理文件名中的中文字符,非中文内容(包括数字和英文)将被忽略。
  • 生成的Excel文件将保存在提供的目标文件夹内。
import os
import pandas as pd

# 函数:处理文件名,只保留中文字符
def process_filename_chinese_only(filename):
    # 移除扩展名和前面的数字
    processed_name = filename.split('.')[0][4:]
    # 仅保留中文字符
    return ''.join(char for char in processed_name if '\u4e00' <= char <= '\u9fff')

def main():
    # 请求用户输入目标文件夹地址
    directory_path = input("请输入目标文件夹地址: ")

    # 存储处理后的文件名
    processed_filenames = []

    # 遍历目录中的每个文件并处理
    for filename in os.listdir(directory_path):
        if filename.endswith(".jpg"):
            processed_filenames.append(process_filename_chinese_only(filename))

    # 创建DataFrame
    df = pd.DataFrame(processed_filenames, columns=["菜名"])

    # 将DataFrame保存到同一目录下的Excel文件
    excel_path = os.path.join(directory_path, "菜名列表.xlsx")
    df.to_excel(excel_path, index=False)

    print(f"文件已保存到:{excel_path}")

if __name__ == "__main__":
    main()

 

标签:字符,提取,文件名,Excel,excel,文件夹,名称,文件,图片
From: https://www.cnblogs.com/zly324/p/17899189.html

相关文章

  • 通过excel表格批量修改文件夹名称
    脚本功能这个脚本用于重命名文件夹,特别是在多层嵌套的文件夹结构中。它通过读取一个Excel表格来获取重命名的信息。表格的第一列应包含当前的文件夹名称,第二列包含您想要更改为的新名称。脚本会递归地遍历指定路径下的所有文件夹,并根据表格中的信息重命名匹配的文件夹。 impo......
  • springboot+vue小白升级之路07-快速实现批量删除、小白升级之路08-实现批量导入导出ex
    我们接着之前的内容,全部代码我贴一下,大家参考使用。数据库droptableifexistsan_user;createtablean_user( idintnotnullauto_incrementprimarykeycomment'主键id', namevarchar(255)notnulluniquecomment'姓名', `password`varchar(255)notnullcomment......
  • 【APP小程序】移动安全系统&资产提取&评估扫描
    AppinfoScanner资产提取AppinfoScanner一款适用于以HW行动/红队/渗透测试团队为场景的移动端(Android、iOS、WEB、H5、静态网站)信息收集扫描工具,可以帮助渗透测试工程师、攻击队成员、红队成员快速收集到移动端或者静态WEB站点中关键的资产信息并提供基本的信息输出,如:Title、Do......
  • DevExpress WinForms Pivot Grid组件,一个类似Excel的数据透视表控件(二)
    界面控件DevExpressWinForms的PivotGrid组件是一个类似Excel的数据透视表控件,用于多维(OLAP)数据分析和跨选项卡报表。在上文中(点击这里回顾>>)我们介绍了DevExpressWinFormsPivotGrid组件的性能、分析服务、数据塑造能力等,本文将继续介绍该组件的其他功能,欢迎持续关注我们哦~......
  • Excel-排序和筛选
    一、排序单条目排序多条目排序【根据订单好、日期进行排序,注意先订单号,再日期】 自定义排序二、筛选 ......
  • 前端实现Excel导出功能的详细示例
    前言在前端开发中,有时我们需要将数据导出为Excel文件,以便用户可以在本地进行查看和编辑。本文将详细介绍如何在前端实现Excel导出功能,并给出一个详细的示例代码。准备工作在开始之前,我们需要引入一个用于处理Excel文件的库。在本示例中,我们将使用xlsx库,它是一个功能强大且易于......
  • TmsFlexcelExports
    unitTmsFlexcelExports;interfaceUsesWindows,System.SysUtils,System.Classes,VCL.FlexCel.Core,FlexCel.XlsAdapter,Data.DB;procedureDataSetToXLS(fName:string;DataSet:TDataSet;WorkSheetCount:Integer=1;ActiveSheet:Integer=1);proce......
  • 用python将csv转excel (.xls和.xlsx)的几种方式
    excel后缀有2种格式,.xls是从Excel97到Excel2003的默认文件格式,而.xlsx是Excel2007及更高版本的默认文件格式。.xlsx和.xls格式的主要区别在于,.xls格式单个工作表最多支持65536行,256列。.xlsx格式最多支持1048576行,16384列。此外就是,存储同样多的数据,.xlsx格式文......
  • GridView的复制粘贴和Excel数据处理
    首先开启GridView的属性:view.OptionsClipboard.AllowCopy=DefaultBoolean.True;//允许复制view.OptionsClipboard.CopyColumnHeaders=DefaultBoolean.False;//是否复制表头view.OptionsClipboard.PasteMode=DevExpress.Export.PasteMode.Append;//粘贴模式view.Optio......
  • uniapp插件市场上架插件,提示components不包含对应包名称的组件
    第一次在uniapp上架了一个小组件,所有的都按照文档填写上传了,但是提交的时候一直提示不行原来是在压缩组件源码的时候出问题,不要把components和static放在一个文件夹下面压缩文件夹,要直接把components和`static``组合压缩就行。这是错误的这是正确的......