首页 > 其他分享 >字符编码记with管理文件md

字符编码记with管理文件md

时间:2023-10-20 16:26:37浏览次数:24  
标签:字符 编码 md 管理文件 gbk unicode 编码方式 ascii

目录

字符编码

二进制和字符之间的转换过程 --> 字符编码

ascii,gbk,shit,fuck 每个国家都有自己的编码方式

美国电脑内存中的编码方式为ascii ; 中国电脑内存中的编码方式为gbk , 美国电脑无法识别中国电脑写的程序 , 中国电脑无法识别美国电脑写的程序

现在硬盘中躺着 ascii/gbk/shit/fuck 编码的文件, 他们的编码格式已经无法修改了, 所以内存中出现unicode编码, 内存中的unicode编码方式可以识别 ascii/gbk/shit/fuck 编码的文件

用unicode编码方式运行了 ascii/gbk/shit/fuck 编码的文件, 最后还是要装入硬盘, 装入硬盘早期用unicode存进去,但是 他在识别ascii的时候, 会把8位数字转换成16位数字存入硬盘, 浪费空间, 所以出现了utf8(与unicode对应,并且压缩unicode编码的字符)

utf8 能识别其他国家的编码,只识别unicode, utf8目前还不能放在内存,. 但是现在写的代码都是utf8, 历史遗留ascii/gbk/shit/fuck 编码的文件迟早消失/淘汰,要么被转换成utf8格式.所以迟早有一天内存中也是utf8.

Python2和3字符编码的区别

  1. 打开python解释器
  2. python解释器相当于文本编辑器,读取二进制转化为普通字符 a = 1
  3. 对转化后的普通字符进行解释(定义变量就要新开辟内存空间存放变量)

python2

用文件指定的编码方式存储定义后的变量

如果文件指定编码为'gbk' ,那就会以gbk的形式存储变量, 本来打印的是0和1,但是终端会自动对你的0和1安装终端默认的编码转换成字符 ,如果终端的默认编码是utf8 ,乱码; 如果终端默认编码是gbk,不乱吗

如果定义变量前加上u,coding:xxx不会对他造成任何影响, 因为会用unicode编码存储变量, 终端是任何类型的编码都可以识别

python3

用unicode编码方式存储定义后的变量

以后写文件以什么格式存储,就以什么格式读取

文件的三种打开方式

r : 只读

f.read()

w: 清空后写入(文件不存在自动创建)

f.write()

a: 追加(文件不存在自动创建)

f.write()

文本模式:t

二进制模式:b

t/b无法单独使用,只能和r/w/a一起使用

with管理文件上下文

with open() as f: # 自动关闭

pyinstaller的使用

pip instlal pyinstaller

切换路径到文件夹(文件夹包含img.ico和test.py这两个文件)

pyinstaller -i img.ico -F test.py

标签:字符,编码,md,管理文件,gbk,unicode,编码方式,ascii
From: https://www.cnblogs.com/JunLeewarehouse/p/17777363.html

相关文章

  • python实现可视化的MD5、sha256哈希加密小工具
    python实现可视化的MD5、sha256哈希加密小工具,分享给大家,具体如下:效果图:刚启动的状态超过十条不全量显示importhashlibimporttkinterastk#窗口控制windowss=tk.Tk()windowss.title('Python_md5')#窗口title,并非第一行windowss.geometry('820x550')windowss.res......
  • cmd删除巨量本地文件下的文件(windows)
    当文件夹中的文件数量非常庞大时,尤其是在老旧或资源有限的系统上,直接通过图形用户界面(GUI)来删除文件可能会非常缓慢甚至导致系统卡死。作为一名程序员,当然要想更底层的办法解决啦。这种情况下,可以尝试使用命令行来高效、快速地删除大量文件:.打开命令提示符:按Win+R键打开......
  • 《动手学深度学习 Pytorch版》 9.6 编码器-解码器架构
    为了处理这种长度可变的输入和输出,可以设计一个包含两个主要组件的编码器-解码器(encoder-decoder)架构:编码器(encoder):它接受一个长度可变的序列作为输入,并将其转换为具有固定形状的编码状态。解码器(decoder):它将固定形状的编码状态映射到长度可变的序列。9.6.1编码器编......
  • Systemd集成Golang二进制程序
    首先新建Service,名称叫做server-apivim/lib/systemd/system/server-api.service[Unit]Description=serverapi[Service]Type=simpleRestart=alwaysRestartSec=5sExecStart=/root/go/mainWorkingDirectory=/root/go/[Install]WantedBy=multi-user.targetExecStart......
  • C# 实现MD5加密
    C#实现MD5加密C#MD5加密日常程序开发中,涉及到敏感数据内容,通常会采取加密处理以保证数据安全,本篇文章讲述了在C#中使用MD5方法加密数据MD5介绍MD5的全称是message-digestalgorithm5,MD5算法属于hash算法的一类,对消息进行运算,产生一个128位的消息摘要(32位数字字母),并且......
  • AMD线程撕裂者7000实拍图赏:1+12和你从未见过的1+8
    盼望着,盼望着,AMDZen4架构的新一代线程撕裂者7000系列终于来了!这一次,AMD提供了两种选择:一是面向顶级工作站的线程撕裂者PRO7000WX系列,满血状态,最多96核心192线程、480MB缓存、8通道DDR5内存、128条PCIe5.0通道。二是面向桌面发烧友的线程撕裂者7000X系列,最多64核心128线程、3......
  • 解决:Exception: URL fetch failure on https://storage.googleapis.com/tensorflow/tf
    首次装载IMDB数据集时可能会出现的错误。解决方案:1、先将数据集单独下载下来:datasets/imdb.npz·黄健/keras-datasets-Gitee.com2、将其复制到 ~/.keras/dataset目录下:cpimdb.npz ~/.keras/dataset ......
  • 各类编码之间的关系
    面试遇到的问题,发现我对编码字符集还没系统总结过,今天来学习一下主要是ASCII、UTF-8、Unicode、gkb等ASCII1.AmericanStandardCodeforInformationInterchange,美国信息交换标注码2.ASCII字符集是单字节存储,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号......
  • 编码的奥秘pdf电子版 Charles Petzold
    编码的奥秘pdf电子版CharlesPetzold作者:CharlesPetzold原作名:Code:TheHiddenLanguageofComputerHardwareandSoftwareISBN:9787111080787连接提取码:fpcn类似微机原理的书,讲的很透......
  • HS编码:电子元件分类的关键 | 百能云芯
    电子元件的HS编码是一种国际通用的分类系统,用于标识和跟踪不同类型的商品和产品。HS代表HarmonizedSystem,即协调制度,这个系统由世界关务组织(WorldCustomsOrganization)维护和管理。它的主要目的是为了简化国际贸易,降低关税和非关税壁垒,促进跨国商品流通。云芯将带您深入探讨......