脚本介绍
功能
这个Python脚本旨在自动化处理一个特定文件夹中的图片文件名,提取每个文件名中的中文字符,并将这些字符保存到一个Excel表格中。它特别适用于那些需要从大量图片文件中提取文本信息以进行进一步分析或记录的情况。
使用场景
- 餐饮业:从包含菜品图片的文件夹中提取菜名,用于菜单创建或库存管理。
- 档案管理:整理包含中文名称的文档或图片,方便后续的索引和查找。
- 数据整理:对大量包含中文名称的图片文件进行快速整理和分类。
工作流程
- 输入文件夹地址:用户需要提供包含.jpg图片文件的目标文件夹路径。
- 处理文件名:脚本遍历文件夹中的所有.jpg文件,移除文件名中的非中文字符,包括文件扩展名和前面的编号。
- 生成Excel表格:处理后的文件名(即中文字符)被保存到一个新创建的Excel表格中,这个表格位于同一目标文件夹下。
注意事项
- 确保目标文件夹路径正确且该文件夹包含.jpg格式的图片文件。
- 脚本只处理文件名中的中文字符,非中文内容(包括数字和英文)将被忽略。
- 生成的Excel文件将保存在提供的目标文件夹内。
import os import pandas as pd # 函数:处理文件名,只保留中文字符 def process_filename_chinese_only(filename): # 移除扩展名和前面的数字 processed_name = filename.split('.')[0][4:] # 仅保留中文字符 return ''.join(char for char in processed_name if '\u4e00' <= char <= '\u9fff') def main(): # 请求用户输入目标文件夹地址 directory_path = input("请输入目标文件夹地址: ") # 存储处理后的文件名 processed_filenames = [] # 遍历目录中的每个文件并处理 for filename in os.listdir(directory_path): if filename.endswith(".jpg"): processed_filenames.append(process_filename_chinese_only(filename)) # 创建DataFrame df = pd.DataFrame(processed_filenames, columns=["菜名"]) # 将DataFrame保存到同一目录下的Excel文件 excel_path = os.path.join(directory_path, "菜名列表.xlsx") df.to_excel(excel_path, index=False) print(f"文件已保存到:{excel_path}") if __name__ == "__main__": main()
标签:字符,提取,文件名,Excel,excel,文件夹,名称,文件,图片 From: https://www.cnblogs.com/zly324/p/17899189.html