python读取大文件

时间：2023-01-10 19:55:50浏览次数：43

标签：文件读取 encoding python open file big path data

"""
每次固定读取10000行
"""
with open(filename) as f:
    while True:
        next10k = list(islice(f, 10000))  # need list to do len, 3 lines down
        for ln in next10k:
            process(ln)
        if len(next10k) < 10000:
            break

# 利用yield生成器读取
def read_big_file(file_path, size=1024, encoding='utf-8'):
    with open(file_path, 'r', encoding=encoding) as f:
        while True:
            part = f.read(size)
            if part:
                yield part
            else:
                return None
 
 
file_path = 'data/big_data.txt'
size = 100  # 每次读取指定大小的内容到内存，为了测试更加明显，这儿写的小一些
 
# 注意：以'a'追加模式下，大文件也不会占用太多内存
for part in read_big_file(file_path, size):
    with open('data/new_big_data.txt', 'a', encoding='utf-8') as w:
        w.write(part)
    print(part)

'''
利用open()自带方法生成迭代对象
注意：这是一行一行的读取，在数据量比较大的时候效率是极低的。
'''
file_path = 'data/big_data.txt'
new_file_path = 'data/new_big_data.txt'
with open(file_path, 'r', encoding='utf-8') as f:
    for line in f:
        print(line)
        with open(new_file_path, 'a', encoding='utf-8') as a:
            a.write(line)

标签：文件,读取,encoding,python,open,file,big,path,data
From： https://www.cnblogs.com/kopok/p/16174096.html

【python小课堂专栏】python小课堂24 - 正则表达式(二)
python小课堂24-正则表达式(二)前言今天继续来介绍一下python的正则表达式，回顾一下上次介绍的re模块整篇文章围绕着re.findall()来进行实例的讲解，也就是所谓的查询操作。......
dart file and directory（目录或者文件操作）
文件读写Filefile=File("XXX");file.exists();//在假设为文件的时候判定文件是否存在，如果是目录返回false目录Directorydirectory=Directory("XXX");direc......
Linux day2：文件和文件夹相关命令文件内容编辑命令 Linux常用目录 Linux重要文件
目录问题说明前期必备知识系统运行命令shutdown-c快捷方式命令ctrl+e目录结构相关命令mkdir-p文件和文件夹相关命令创建文件touch查看文件和目录ls-al查看文件内......
electron-builder双击文件打开关联应用(文件关联)
[参考文章](https://blog.csdn.net/jingjingchen1014/article/details/121223905)##配置文件关联[官方配置文档](https://www.electron.build/configuration/configu......
mapserver服务请求服务xml文件
mapserver服务请求服务xml文件方法：在链接后面添加 REQUEST=getcapabilities例如：http://127.0.0.1/mapserver/vmap/WMTS/1.0/XZQH/11?REQUEST=getcapabilities ......
python：reshape()函数
a.reshape(m,n)表示将原有数组a转化为一个m行n列的新数组，a自身不变。m与n的乘积等于数组中的元素总数reshape(m,n)中参数m或n其中一个可写为"-1"，"-1"的作用在于计算机根据......
python 使用函数名的字符串调用函数(4种方法)
先看一个例子：>>>deffoo():print"foo">>>defbar():print"bar">>>func_list=["foo","bar"]>>>forfuncinfunc_list:func()TypeError......
pycharm：无法加载文件 C:\Users\admin\PycharmProjects\pythonProject1\venv\Scr
以前一直在vmware虚机上用pycharm，这次想在win10pc上试试安装pycharm后，打开终端直接报错：无法加载文件C:\Users\admin\PycharmProjects\pythonProject1\venv\Scripts......
liinux-目录、文件结构及相关命令
1.前期必备知识1.命令提示符[root@max001~]#:root表示用户信息,max001表示主机名称。[root@max001~]%:普通用户结尾是$符号。2.命令格式规范（语法规范） 01.linux中......
用python做个简单的监控
今天在看博客园的时候看到一篇文章，忘记是什么地址了，之前我也做过一个类似的监控，不过不好控制。之前的模式是通过内网地址访问相应的php程序，php调用python程序，能捕获到摄像......

python读取大文件

相关文章

赞助商

阅读排行