首页 > 其他分享 >02 字符编码

02 字符编码

时间:2023-02-27 17:33:44浏览次数:35  
标签:02 编码 字符 二进制 unicode 字符串 格式

分析过程

x="上"

内存
上-------翻译-----》0101010
上《----翻译《-----0101010

字符编码表就是一张字符与数字对应关系的表


a-00
b-01
c-10
d-11

ASCII表:
1、只支持英文字符串
2、采用8位二进制数对应一个英文字符串

GBK表:
1、支持英文字符、中文字符
2、
采用8位(8bit=1Bytes)二进制数对应一个英文字符串
采用16位(16bit=2Bytes)二进制数对应一个中文字符串


unicode(内存中统一使用unicode):
1、
兼容万国字符
与万国字符都有对应关系
2、
采用16位(16bit=2Bytes)二进制数对应一个中文字符串
个别生僻会采用4Bytes、8Bytes


unicode表:
内存
人类的字符---------unicode格式的数字----------
| |
| |
|
硬盘 |
|
| |
| |
GBK格式的二进制 Shift-JIS格式的二进制

老的字符编码都可以转换成unicode,但是不能通过unicode互转

 

utf-8:
英文->1Bytes
汉字->3Bytes

 

结论:
1、内存固定使用unicode,我们可以改变的是存入硬盘采用格式
英文+汉字-》unicode-》gbk
英文+日文-》unicode-》shift-jis
万国字符》-unicode-》utf-8

2、文本文件存取乱码问题
存乱了:解决方法是,编码格式应该设置成支持文件内字符串的格式
取乱了:解决方法是,文件是以什么编码格式存如硬盘的,就应该以什么编码格式读入内存

 

3、python解释器默认读文件的编码
python3默认:utf-8
python2默认:ASCII

指定文件头修改默认的编码:
在py文件的首行写:
#coding:gbk

4、保证运行python程序前两个阶段不乱码的核心法则:
指定文件头
# coding:文件当初存入硬盘时所采用的编码格式


5、
python3的str类型默认直接存成unicode格式,无论如何都不会乱码
保证python2的str类型不乱码
x=u'上'


6、了解
python2解释器有两种字符串类型:str、unicode
# str类型
x='上' # 字符串值会按照文件头指定的编码格式存入变量值的内存空间
# unicode类型
x=u'上' # 强制存成unicode

 

标签:02,编码,字符,二进制,unicode,字符串,格式
From: https://www.cnblogs.com/wiii/p/17160582.html

相关文章

  • 【编码】csv文件打开是乱码
    原因:CSV是用UTF-8编码的,而EXCEL是ANSI编码,由于编码方式不一致导致出现乱码。解决办法:用记事本打开CSV文件----->文件------>另存为------>点编码------>选择ANSI----->保存,......
  • 【Python】判断字符串输入合法化
    Python判断字符串输入合法化​​只包含数字​​​​包含数字​​​​只包含中文​​​​包含中文​​​​只包含字母​​​​包含字母​​只包含数字判断字符串是否只包含数......
  • 2021cspj省选
    1.#include<bits/stdc++.h>usingnamespacestd;vector<string>split(strings,charch){intstart=0;intlen=0;vector<string>ret;for(inti=0;i<s.len......
  • Redis 缓存穿透,击穿,雪崩 并发 之 读写数据编码实战
     什么是缓存穿透  缓存穿透是指查询一个缓存中和数据库中都不存在的数据,导致每次查询这条数据都会透过缓存,直接查库,最后返回空。当用户使用这条不存在的数据疯狂......
  • 02 条件
    #2、什么是条件?什么可以当做条件?为何要要用条件?#第一大类:显式布尔值#2.1条件可以是:比较运算符#age=18#print(age>16)#条件判断之后会得到一个布尔值#2.1条......
  • 2023-02-13 Set `"volar.inlayHints.eventArgumentInInlineHandlers": false` to hide
    Set`"volar.inlayHints.eventArgumentInInlineHandlers":false`tohideEventArgumentinInlineHandlers.设置`“volar.inlayHints.eventArgumentInInlineHandlers......
  • python文件操作02 文件指针
    #一:读相关操作#1、readline:一次读一行#withopen(r'g.txt',mode='rt',encoding='utf-8')asf:##res1=f.readline()##res2=f.readline()##prin......
  • [ZJOI2022] 树
    题目描述九条可怜是一个喜欢树的女孩子,她想生成两棵均有\(n\)个节点的树。第一棵树的生成方式是:节点\(1\)作为树的根。对于\(i\in[2,n]\),从\([1,i-1]\)......
  • 2022-03-15 最新博客爬虫
    importrequestsurl="https://www.cnblogs.com/AggSite/AggSitePostList"data={"CategoryType":"SiteHome","ParentCategoryId":0,"CategoryId":808,......
  • AMD Xilinx Linux 2022.1 USB Gadget使用
    问题有客户使用Linux中的USBGadget功能,把MPSoC器件做USB从设备。在执行“mkdirfunctions/.”时,得到错误“Deviceorresourcebusy”。mkdir:can'tcreatedirectory......