字符编码
由于计算机只认识01,字符编码就是我们人看的懂的字符对应机器认识的数字,方便我们与机器交互
1.字符编码的发展史
1.一家独大(ASCII码表)
最开始计算器是由美国人发明的,争对他们国家的语言发明了一种编码表 ASCII码表,ASCII码表内置使用一个字节代表一个字符。
需要记忆:
A-Z:65—
a-z:97—
0-9:48—
字符串的比较是按照ASCII的十进制数进行比较的
2.群雄割据
各个国家也想使用计算器,就自己开发了一套自己的编码表
GBK码表(中国):它的内部记录了英文、中文和数字之间的对应关系,它是一个字节保存英文,两个字节保存中文。
shift_JIS表(日本)、Euc-kr表(韩国)
3.一统天下(unicode→utf8编码)
为了让世界上的所有国家之间能够彼此无障碍的交流,统一使用了编码,unicode(万国码),他的内部统一使用两个字节保存字符或者更多字符。
占用内存多了,进行优化就产生了utf8编码,中文现在用三个字节保存
PS:
其他编码:utf-8、utf-16、utf-32·····utf8mb4(存表情)
字符编码实操
1.编码(encode)
1 s = 'hello你好哈' 2 res = s.encode('utf8') 3 print(res) # b'hello\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x93\x88'
2。解码(decode)
1 s = 'hello你好哈' 2 res = s.encode('utf8') 3 print(res) # b'hello\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x93\x88' 4 res1 = res.decode('utf8') 5 print(res1) # hello你好哈
文件操作
当文件数量比较多的时候,借助代码来打开文件
1.操作文件
三步骤:
1.打开文件
2.操作文件
3.关闭文件
1.方式一
1 f = open('a.txt', 'r', encoding='utf8') 2 print(f.read()) 3 4 # 关闭文件 5 f.close()
2.方式二(with上下文管理器)
1 with open('a.txt', 'r', encoding='utf8') as f: 2 print(f.read()) 3 # 内部自动关闭close
标签:编码,文件,utf8,字符,print,hello From: https://www.cnblogs.com/caicaix/p/17425383.html