首页 > 编程语言 >python学习之字符编码

python学习之字符编码

时间:2024-07-05 11:35:30浏览次数:18  
标签:编码 utf 字符 python GBK unicode ASCII

字符分类及历史

ASCII

0-255 从数字到小写大写英文字母,加上一些特殊符号,常用的低字节(0-127)也是基本表,非常用的高字节(128-255)也是扩展表,8位为1字节,ASCII中每一个字符占一个字节

GB2312

中国1980年,为中文在计算机应用而制定的编码系统,一个字符占两个字节,中英文环境下兼容ASCII码,以连续两个高字节在一起就为中文字符

GBK

在GB2312的基础上扩展而来,一个字符占两个字节

unicode

unicode称之为万国码,包括各国语言字母及文字,与所有国家的编码有映射关系,2-4字节存一个字符是,在这当中一个中文字符占3个字符
其它编码转换为unicode为解码(decode),unicode转换为utf-8为编码(encode)

utf-8 union transfor format 可变长编码

为优化unicode存储空间过大的问题而出现了UTF-8
UTF-8用于文件存储和网络传输,但在内存中依然是unicode
mac、linux系统默认为utf-8,windows中国版系统默认为GBK

字符在python中的应用

python2中字符都以ASCII码解释存储

如GBK编码存储字符
python2代码涉及字符时,需要在第一行申明(如#coding:utf-8),其实就是告诉解释器这后面的代码是UTF-8编码写的,以UTF-8解释并存储,但因py2只支持ASCII码所以打印出来通常是乱码,需要转为unicode才能正常显示(str.decode("utf-8")以UTF-8转为unicode)

python3中字符在内存中以unicode存储,在文件中以utf-8存储

python3中代码以GBK编码,运行时解释器会以GBK编码转为unicode存在内存中

标签:编码,utf,字符,python,GBK,unicode,ASCII
From: https://www.cnblogs.com/merlin-lan/p/17772937.html

相关文章

  • Visual Studio 使用 EditorConfig 定义一致的编码样式
    代码一致性EditorConfig文件设置可在代码库中保持一致的编码样式和约定,无论使用哪种编辑器或IDE。可以控制缩进样式、制表符宽度、行尾字符和编码等编码样式。例如,如果C#代码库具有缩进使用五个空格字符、文档使用UTF-8编码,并且行以CR/LF结尾的约定,则可以将EditorCon......
  • Arduino 驱动360度旋转传感器(如旋转编码器)
    以下是使用ArduinoUnoR3驱动一个360度旋转传感器(如旋转编码器)的详细说明、接线图和代码示例,其中传感器引脚为CLK、DT、SW、+、GND。所需材料ArduinoUnoR3360度旋转传感器(旋转编码器)面包板和连接线接线步骤连接旋转传感器:将旋转编码器的CLK引脚连接到ArduinoUno的......
  • PYTHON如何下载第三方库
    相信小伙伴们在python之路上,难免需要引用python的第三方库来完成自己那个独属于自己的那个.py程序例如,小伙伴想引用pygame库来完善python程序但是,它却提示:其原因就是你的python没有检测到这个库的存在,因此报错下载python第三方库首先win+R打开运行输入cmd回车确认......
  • Python速通(输入输出)
    1.(牛牛最喜欢的语言)牛牛认为Python是世界上最好的语言,因为Python是一种简单、方便、易学习的语言,牛牛最喜欢Python了!现在请你输出字符串"Pythonisthebestlanguage!"表达牛牛对Python的喜爱。print("Pythonisthebestlanguage!")2.(冲击offer的牛牛)即将毕业的牛牛在牛......
  • Python数据分析代码示例
    数据清洗在进行数据分析之前,通常需要对原始数据进行清洗,即处理缺失值、异常值、重复值等问题。下面是一个数据清洗的示例代码:importpandasaspd#读取原始数据data=pd.read_csv('data.csv')#处理缺失值data=data.dropna()#处理异常值data=data[data['value'......
  • python - [12] 脚本一文通
    题记部分 一、文件夹&文件(1)删除空文件夹#删除目录中的空文件夹importosdefmove_epty_folders(directory_path):forroot,dirs,filesinos.walk(directory_path,topdown=False):forfolderindirs:folder_path=os.path.join(root,f......
  • Python-字典
    字典1.字典Python字典的主要属性如下:通过键而不是偏移量来读取:字典通过键将一系列值联系起来,这样就可以使用键从字典中取出存储于该键下的一项任意对象的无序集合:与列表不同,保存在字典中的项并没有特定的顺序,实际上,Python将各项伪随机地从左到右随机排序,以便快速查找长度可......
  • Python数据分析方法与技巧
    背景介绍数据分析是数据科学领域的核心技能之一,它涉及到数据的收集、清洗、处理、分析和可视化。数据分析是指通过收集、清洗、处理、分析和可视化数据来发现隐藏的模式、趋势和关系的过程。数据分析是数据科学的一个重要环节,它可以帮助我们解决各种问题,如预测、优化、决策等。......
  • Windows中配置python3.11环境安装教程
    在Windows中配置Python3.11环境,可以按照以下步骤进行:1.下载Python3.11打开Python的官方网站:https://www.python.org/导航到“Downloads”部分,并选择“Windows”。在“Windows”页面中,找到Python3.11的版本,点击下载适合你系统架构(32-bit或64-bit)的安装程序。2.安装Py......
  • Python初学者必须掌握的基础知识点
    1.数据类型和变量1.1缩进和注释的规则Python使用缩进来表示代码块,通常使用四个空格或一个制表符。注释使用#开头。#这是一个注释ifTrue:print("Hello,World!")#这是另一个注释1.2基本数据类型Python支持多种基本数据类型,包括整数、浮点数、......