首页 > 数据库 >根据后缀名把Excel文件转换成可以插入MongoDB数据库的数据

根据后缀名把Excel文件转换成可以插入MongoDB数据库的数据

时间:2024-11-13 15:44:08浏览次数:1  
标签:为空 df MongoDB Excel 后缀名 json file 字符串 path

import pandas as pd
import os

def convert_file_to_json(file_path):
    # 检查文件扩展名并读取文件
    _, file_extension = os.path.splitext(file_path)
    if file_extension.lower() == '.csv':
        df = pd.read_csv(file_path)
    elif file_extension.lower() in ['.xlsx', '.xls']:
        df = pd.read_excel(file_path)
    else:
        raise ValueError("Unsupported file format. Only CSV and XLSX files are supported.")

    # 将\N、NaN值、空字符串、换行符等转换为空字符串
    df = df.replace(r'\N', '', regex=False)  # 替换\N为空字符串
    df = df.fillna('')  # 替换NaN值为空字符串
    df = df.replace('\n', '', regex=True)  # 替换换行符为空字符串
    df = df.replace('undefined', '', regex=True)  # 替换换行符为空字符串

    # 将DataFrame转换为JSON格式的字符串
    json_str = df.to_json(orient='records', lines=False, force_ascii=False)

    # 保存为JSON文件,文件名与原文件相同,但扩展名为.json
    json_file_path = os.path.splitext(file_path)[0] + '.json'
    with open(json_file_path, 'w', encoding='utf-8') as json_file:
        json_file.write(json_str)

    print(f"File {file_path} has been successfully converted to JSON and saved as {json_file_path}")
# 使用示例
file_path = '装修.xlsx'
convert_file_to_json(file_path)

 

标签:为空,df,MongoDB,Excel,后缀名,json,file,字符串,path
From: https://www.cnblogs.com/wolvies/p/18544092

相关文章

  • 勤哲EXCEL服务器自动生成企业计件薪酬管理系统
    近日,《关于加强中央企业薪酬管理信息系统建设的通知》并召开工作部署会议,提出所有中央企业基本建成能够上线运行的薪酬管理信息系统,实现各级子企业薪酬管理全流程在线以及在2025年6月底前,全面建成国资监管一体化智慧薪酬管理系统。实际上,国家一直在高度重视国有企业内部薪酬分......
  • ATE测试 - STDF文件分析 - Excel报表格式探讨
    1、转换对象:STDF文件2、适用人员:TE或解决方案人员或需要对测试项TestItem原始测试值进行分析的2、Excel格式:如下示意图4、局限性:Excel一个sheet中,列数最大不能超过16384列,行数最大不能超过1048576行,因此这种格式对于超过16384颗Die的文件就无法生成Excel文件了,但对于TE来......
  • 【Java】Java读写Excel文件
    常见的JavaExcel操作方法Java中常用的Excel操作方式有什么呢?ApachePOIEasyExcel这两种方法有什么区别和联系?ApachePOI是一个用于操作MicrosoftOffice格式文件(如Excel、Word等)的Java库。它提供了一系列的API来读写Excel文件。POI的基本功能如下:结构说......
  • 【NPOI】读取Excel文件
    NPOI是一个流行的.NET库,用于读取和写入Excel文件(包括XLS和XLSX格式)。以下是一个快速的指南,展示如何使用NPOI读取Excel文件的基本步骤。1.安装NPOI首先,你需要在项目中安装NPOI库。可以通过NuGet包管理器安装:Install-PackageNPOI或者通过.NETCLI安装......
  • excel 字符比较函数
    ‌在Excel中,用于字符比较的函数主要有以下几种‌:‌EXACT函数‌:用于比较两个文本字符串是否完全相同,包括大小写。如果两个字符串完全相同(包括大小写),则返回TRUE;否则返回FALSE。例如,=EXACT("ABC","abc")的结果为FALSE,而=EXACT("ABC","ABC")的结果为TRUE‌12。‌FIND函数‌:用......
  • 使用VBS对Excel文件内容进行批量替换
    1、通过读取外部txt文件的方式进行替换OptionExplicitIfWscript.Arguments.Count=0ThenWScript.EchoChr(10)&_"[正确操作]"&Chr(10)&Chr(10)&_Chr(9)&"拖拽导出的Excel文件到本程序"&Chr(10)&Chr(10)&_"[错误操作]"&C......
  • R - 读取excel 文件
    #使用readxl包来读取Excel文件install.packages("readxl")#仅需运行一次library(readxl)#假设Excel文件名为"your_file.xlsx"#默认读取第一个工作表df<-read_excel("your_file.xlsx")#指定读取特定的工作表df<-read_excel("your_file.xlsx",......
  • [经典] 前端js将文件流导出为csv/excel文件
    前端将文件流导出为csv/excel文件有两种方式:1.后端直接返回文件连接:前端正常请求,后端返回一个静态文件链接,直接使用:window.location.href=url简单,但是缺点是耗资源,后端需要把数据转化为excel存起来,并且直接暴露连接。2.后台返回二进制流:前台请求后台接口拿到二进制流转......
  • excel中查找亏损第一大第二大第三大的商品的亏损金额;涨出第一大,第二大,第三大的金额;以
     k2里的公式 =LARGE(IF(B:B="品类1",E:E),1)lL里的公式 =LARGE(IF(B:B="品类1",E:E),2)M2里额公式 =LARGE(IF(B:B="品类1",E:E),3)N2里的公式=MIN(IF(B:B="品类1",E:E),1)O2里的公式=SMALL(IF(B:B="品类1",E:E),2)P2里的公式 =SMALL(IF(B:B="品类1&......
  • Excel.Application使用手册(摘自:https://www.cnblogs.com/codingking/p/6484461.html)
    定制模块行为(1)OptionExplicit'强制对模块内所有变量进行声明  OptionPrivateModule'标记模块为私有,仅对同一工程中其它模块有用,在宏对话框中不显示  OptionCompareText'字符串不区分大小写  OptionBase1'指定数组的第一个下标为1(2)OnErrorResumeNe......