首页 > 编程语言 >python读取任意编码格式的文本

python读取任意编码格式的文本

时间:2023-11-02 16:14:02浏览次数:49  
标签:读取 get python read file path 文本

前言

有的时候默认使用utf8格式来读取文本,会导致报错。
如果对性能没有要求,可以在读取前使用chartdet库来判断文本编码。

代码示例

import chardet

def get_code(file_path):
    with open(file_path, 'rb') as f:
        data = f.read()
        result = chardet.detect(data)
        f.close()
    return result.get("encoding", None)
		
file_path = r"C:\Users\Hurys\Desktop\track.txt"
encode_type = get_code(file_path)  

with open(file_path, 'r', encoding=encode_type) as read_file:
	lines = read_file.readlines()

标签:读取,get,python,read,file,path,文本
From: https://www.cnblogs.com/wxkabc/p/17805636.html

相关文章

  • 【视频】风险价值VaR原理与Python蒙特卡罗Monte Carlo模拟计算投资组合实例|附代码数
    原文链接:http://tecdat.cn/?p=22862 最近我们被客户要求撰写关于风险价值的研究报告,包括一些图形和统计输出。风险价值(VaR)是一种统计数据,用于量化公司、投资组合在特定时间范围内可能发生的财务损失程度什么是风险价值(VaR)?该指标最常被投资银行和商业银行用来确定其机构......
  • Python中判断为false
    列表和元祖、字典为空、数字0、布尔False、空字符串==》if判断为Falsex=()ifx:print(x)print('不为空')else:print(x)print('空')#输出:()空注意:x={}这里的类型为空字典x={1,2,3,4}这里的类型为set集合列表和元祖、字......
  • Python循环数组的方法
    Python的遍历数组的三种方式。遍历方式假设:nums=[4,5,6,10,1]第一种,forin的语法,这种语法很方便,但是在写Python算法里面用到的少fornuminnums:print(num)第二种是下标访问,range生成0到数组最大长度的下标数组forindexinrange(len(nums)):print(index,nu......
  • 搓一个Pythonic list
      总所周知,Python语言当中的list是可以存储不同类型的元素的,对应到现代C++当中,可以用std::variant或者std::any实现类似的功能。而Python官方的实现当中用到了二级指针,不过抛开这些,我们也可以自己设计一个list的架构,实现多类型值的存储容器。  下图是自己实现的list的架构,按......
  • javaapi、spark、flink 创建Iceberg表,hive 和impala无法正常读取解决
    spark、flink创建Iceberg表中,元数据存储在hive的meta_store,发现hive或者impala无法正常读取报错。事实上解决方案是在spark、flink的SQL中执行语句:addiceberg相关引擎的runntime的jar;ALTERTABLEtSETTBLPROPERTIES('storage_handler'='org.apache.iceberg.mr.hive......
  • 直播小程序源码,react-native自定义文本输入框
    直播小程序源码,react-native自定义文本输入框Examplesfromprops: ... _onChange=(label,value)=>{  this.setState({[label]:value}); }; render(){  return(   <Viewstyle={styles.container}>    <Text>     {this.stat......
  • python @staticmethod 静态方法的使用
    `@staticmethod`是Python中的一个装饰器,用于将一个方法声明为静态方法。静态方法是一种不需要访问类实例的方法,可以直接通过类名调用,而不需要创建类的实例。静态方法的使用场景包括:1.辅助类或工具类:静态方法可以用于辅助其他类或提供一些通用的工具功能,而不需要与类的实例进......
  • Python语法规则,变量与输出,字符集处理
    print方法1、默认输出内容后会自动换行2、输出内容后不换行,加上end=''3、查看源码:ctrl+鼠标左键点击方法注释作用:给开发测试人员看1、#:井号,注释一行代码,快捷方式ctrl+/2、“”“:三引号,注释多行代码代码的结束符换行如果一行代码需要分多行来写,怎么解决1、如果代码是包裹在括号里面......
  • python的Selenium基础
    前言:今日写hackergame2023时需要使用pythonselenium库故特此来学习1.1什么是SeleniumSelenium是python的一个库,作为一套web网站的程序自动化操作解决方案,可以帮我们自动干很多事情。比如像人一样再浏览器里操纵web界面,比如点击界面,在文本框中输入文字等操作。而且还能从web......
  • 不会代码,也能批量数据合并,使用Python开发一个图形交互界面
    不会代码,也能批量数据合并,使用Python开发一个图形交互界面大话数据分析​​京东物流经营分析岗​关注他 作为一名数据分析师,日报,周报,月报是少不了的,经常在整理周报或者月报的时候,需要将这周的数据或者该月的数据进行一个汇总,常规地做法是将每一天的数据......