首页 > 编程语言 >Python开发 之 批量读取文件中指定字符

Python开发 之 批量读取文件中指定字符

时间:2022-10-31 18:31:09浏览次数:41  
标签:文件 读取 批量 Python text train file Msg


目录

  • ​​1、背景​​
  • ​​2、待读取文件​​
  • ​​3、读取每一句中的汉字​​

1、背景

从指定的NLP生成的文件中读取指定的字符。

2、待读取文件

Python开发 之 批量读取文件中指定字符_读取文件


是以":"作为分隔符的数据,每一行以回车结束。此文件为XXX.train

3、读取每一句中的汉字

...
file_train = os.path.join(rootDir,"data/train/rg_train_"+modle_date+"_"+aiscene+".train")
with open(file_train, 'r')as fp:
textlist = fp.readlines()
for text in textlist:
if ":" in text:
L4ID = text.split(":")[-2]
Msg = text.split(":")[-1]
if query_start == Msg.strip("\n"):
print("Msg is in train:",Msg)
...

代码中先获取文件,然后读取每一行,然后以":"作为分隔符。(-1代表倒数第一个,-2代表倒数第二个)


标签:文件,读取,批量,Python,text,train,file,Msg
From: https://blog.51cto.com/u_15854865/5810888

相关文章

  • 开启iTunes访问文件权限,读取Documents本地txt文件
    一、开启iTunes访问沙盒文件夹权限在Info.plist文件中添加UIFileSharingEnabled这个Key,并设置该值为 YES 即可在填写完 UIFileSharingEnabled并回车后,发现会自动......
  • Python开发 之 Python3打包(windows/linux)详解
    文章目录​​1、唠唠叨叨​​​​2、背景​​​​3、Python打包工具​​​​3.1、py2exe​​​​3.2、cx_Freeze​​​​3.3、PyInstaller​​​​4、Windows打包​​​​4.......
  • Python 复杂版贪食蛇(源代码)
    Python复杂版贪食蛇(源代码)简易版贪食蛇代码如下,直接运行即可。备注:案例来源于书:Pygame游戏开发指南1.效果图2.源代码#!/usr/bin/envpython#-*-coding:utf-8......
  • python三大基础函数
    在Python中有三个基础函数,分别是filter()、map()和reduce(),他们分别为我们提供过滤、映射和聚合的功能。1. filter()函数在数据筛选和过滤的时候我们通常会采用filter()......
  • python爬取公众号文章发布时间
    使用xpath取出来的是空,爬取到本地的html,时间的标签如下,内容也是是空的<emid="publish_time"class="rich_media_metarich_media_meta_text"></em>经过查找发现网页使......
  • python-函数
    打算今天花三个小时学习一下python,要不然强化学习的很多内容看不懂一、参数1.形式参数和实际参数形式参数:定义函数的时候在括号中的参数,在函数内部会使用这个参数进......
  • 随机化算法解决圆排列问题 - python解法
    问题描述给定n个大小不等的圆,现要将这n个圆排进一个矩形框中,且要求各圆与矩形框的底边相切。圆排列问题要求从n个圆的所有排列中找出有最小长度的圆排列。例如,当n=3,且所给......
  • python中*的用法
    python中*是非常常见的一个运算符,它主要有以下几个功能:乘法运算符;函数形参表示可变参数;函数实参代表tuple;序列解包为tuple;zip解包运算;参考资料:​​Python3*和**运算符​......
  • python多继承及其super的用法
    python也具有多继承的功能,而同样的,大家能想到多继承必须要引入一些特定的方法来准确调用子类或基类的重载、重写的方法,否则会出现混乱。本文参考​​Multipleinheritance......
  • python中的round
    参考资料:​python的round函数使用​​python的round函数作用是四舍五入,其函数定义如下:round接收两个参数,第一个是数字,第二个是保留的位数,如果不显式给定第二位,则默认不保留......