首页 > 其他分享 >拆分文本文件

拆分文本文件

时间:2023-06-18 11:25:13浏览次数:27  
标签:拆分 num2 encoding 文本文件 flag num file name

# -*- coding: utf-8 -*-

import os
import pandas as pd


def split_csv(src_file_name, num, flag, file_encoding):
    df = pd.read_csv(src_file_name, encoding='gbk')
    # total_num,原始文件总行数;num_tmp根据num计算出文件个数或每个文件行数
    total_num = df.shape[0]
    num_tmp = float(total_num / num)
    # 算出有小数时,加1
    if int(num_tmp) < num_tmp:
        num2 = int(num_tmp) + 1
    else:
        num2 = int(num_tmp)
    # print(num2)

    if flag == 0:
        pass
    elif flag == 1:
        # 原始脚本是当flag ==0 时设计的;当为1时,交换一下参数
        num, num2 = num2, num

    print(num, num2, total_num)

    # 文件名和扩展名分开
    f_name, f_extension = os.path.splitext(src_file_name)

    for i in range(1, num2 + 1):
        df.iloc[(i - 1) * num:i * num].to_csv(
            f"{f_name}{i}{file_encoding}{f_extension}",
            index=False,
            encoding=file_encoding)
        print(i)


if __name__ == '__main__':
    # 设置原始数据名称
    src_file_name = '银行交易流水.txt'
    # 设置结果每个文件数据行数
    num = 10000
    # 设置结果文件编码格式
    file_encoding = 'utf-8'
    # flag:0:num为每个文件的行数;1:num为分成文件数
    flag = 0
    # main函数
    split_csv(src_file_name, num, flag, file_encoding)

 

标签:拆分,num2,encoding,文本文件,flag,num,file,name
From: https://www.cnblogs.com/daizichuan/p/17488839.html

相关文章

  • excel一个sheet拆分成几个文件
    #-*-coding:utf8-*-importpandasaspdfile_name='查询银行汇总_20w.xlsx'file_name_prefix=file_name.split('.')[0]df=pd.DataFrame(pd.read_excel(file_name))#每个文件的行数file_num=35000#共分成多少个文件sheet_num=float(df.shape[0]/fi......
  • 跟据sheet名拆分Excel文件
    #第一步:调用pandas包importpandasaspd#第二步:读取数据iris=pd.read_excel('./test1.xlsx',None)#读入数据文件keys=list(iris.keys())#iris.keys()得到test.xls的sheet名称##第三步:数据合并foriinkeys:iris_concat=pd.DataFrame()#iris[......
  • uniapp vue.config.js配置chunk-vendors.js文件拆分
    constpath=require('path')functionresolve(dir){returnpath.join(__dirname,dir);}constCompressionPlugin=require('compression-webpack-plugin')consthtmlWebpackPlugin=require('html-webpack-plugin')htmlWebpackPl......
  • 【Tabby】如何拆分窗口和取消拆分窗口
    如下图,在设置->快捷键中进行设置  ......
  • 把一个整数拆分成两个平方的和 $x^2+y^2=n$
    首先是一个结论,若\(n=2^\alpha\prodp_i^{\beta_i}\prodq_i^{2\gamma_i}\),其中\(p_i\equiv1\pmod4,q_i\equiv3\pmod4\),那么有解,否则无解。然后考虑如果\(n_1=x_1^2+y_1^2,n_2=x_2^2+y_2^2\),那么\(n_1n_2\)也是可以被表示的,即\(n_1n_2=(x_1y_1+x_2y_2)^2+(x_1y_2-x......
  • 使用Python读写文本文件内容
    本文主要演示如何读写文本文件的内容,以及上下文管理语句with的用法。使用上下文管理语句with时,即使在操作文件内容时引发异常也能保证文件被正确关闭。#'w'表示写入文件,默认为文本文件#如果文件test1.txt不存在,就创建#如果文件test1.txt已存在,就覆盖withopen('test1.txt','w')......
  • Python批量拆分Excel文件中已合并的单元格
    目录(二级)第1章 基础知识/1  1.1 如何选择Python版本  1.2 Python安装与简单使用  1.3 使用pip管理扩展库  1.4 Python基础知识  1.5 Python代码编写规范  1.6 Python文件名  1.7 Python程序的__name__属性  1.8 编写自己的包 ......
  • 将一个数组拆分为一个为奇数数组,一个为偶数数组
    将一个数组拆分为一个为奇数数组,一个为偶数数组#include<stdio.h>intmain(){inta[10]={0,1,2,3,4,5,6,7,8,9};inti[10],j[10];intb,c,d;c=d=0;for(b=0;b<10;b++){if(a[b]%2==0){i[c]=a[b];c......
  • 从0开始学pytorch【4】--维度变换、拼接与拆分
    从0开始学pytorch【4】--维度变换、拼接与拆分学习内容:维度变换:张量拆分与拼接:小结学习内容:维度变换、张量拆分与拼接维度变换:1、viewimporttorcha=torch.rand(4,1,28,28)print(a.shape)print(a.view(4,28*28))print(a.shape)b=a.view(4,28,-1)b.view(4,28,28,-1......
  • js 分页拆分数据
    splitData(data,pageSize,pageNum){ constresult=[]; constpageTotal=Math.ceil(data.length/pageSize);//计算总页数 //for(leti=0;i<pageTotal;i++){ //conststartIndex=i*pageSize;//计算本页数据的起始位置 //constendI......