首页 > 其他分享 >Unicode 与 UTF-8 编码的转换

Unicode 与 UTF-8 编码的转换

时间:2023-01-03 19:08:18浏览次数:45  
标签:编码 0111 UTF 16 汉字 Unicode 0000


Unicode 与 UTF-8 编码的转换_编码

 

注意:下面这两段是代理区。即第1——16平面的间接表示,四个字节的汉字就在这里表示D800-DBFF:High-half zone of UTF-16 DC00-DFFF:Low-half zone of UTF-16 本篇中包含了所有常用汉字27973个,剩余汉字使用代理区标识欢迎查看字符编码相关博客专栏比如:由iPhone emoji问题牵出的UTF-16编码,UTF-8编码探究从以上链接中查询到汉字 “”的码值为 7700

Unicode 与 UTF-8 编码的转换_码表_02

汉字“明” 的7700 的二进制为

0111 0111 0000 0000

转换为十进制是 30464

Unicode 与 UTF-8 编码的转换_编码_03

所以码值范围在第三行。

填充值如下:

1110 0111 1001 1100 1000 0000

填充后对应的十六进制为:

E79C80

接下来我们把这个字符在16进制编辑器中保存在Txt文件中

Unicode 与 UTF-8 编码的转换_ico_04

 保存完Txt 文件,再打开

Unicode 与 UTF-8 编码的转换_16进制_05

 以上就是Unicode 与 UTF-8 转换的方式。

标签:编码,0111,UTF,16,汉字,Unicode,0000
From: https://blog.51cto.com/zhaoyanfei/5986579

相关文章

  • m基于matlab的协作mimo分布式空时编码技术的仿真
    1.算法描述基于matlab的协作mimo分布式空时编码技术的仿真,包括规则LDPC级联D-STBC,ML,ZF,DFE均衡,Fincke-Pohst-MAP算法检测。将规则LDPC加入这个协作MIMO的D-STBC里,......
  • NASA关于MSL(火星科学实验室,好奇号)的UML状态图自动编码讲座
    NASA关于MSL(火星科学实验室,好奇号)的UML状态图自动编码讲座火星科学实验室(MarsScienceLaboratory,MSL)好奇号(Curiosity)是美国国家航空航天局(NASA)的探测车计划,探测器已......
  • base64编码和解码
    引言:最近做爬虫的时候,解析对方网站中自定义字体时遇到的base64解码问题,对这个一直不理解,今天学习一下,总结一下。base64Base64是一种任意二进制到文本字符串的编码方法,基于64......
  • VLQ & Base64 VLQ 编码方式的原理及代码实现
    VLQ&Base64VLQ编码方式的原理及代码实现  目录VLQBase64VLQ VLQVLQ (Variable-lengthquantity)是一种通用的,使用任意位数的二进制来表示一个任意......
  • 202209-1 如此编码
    题意:第一行给定n和m,表示有n个题目,m表示依据这n个题目的答案计算的结果。第二行给定n个数A1,A2,……An,表示n个题目各自的选项个数。开辟A,B,C三个大小均为n+1的数组。Ci =......
  • 【李宏毅机器学习】自编码器auto-encoder
    note:VAE的本质结构:重构的过程是希望没噪声的,而KLloss则希望有高斯噪声的,两者是对立的。所以,VAE跟GAN一样,内部其实是包含了一个对抗的过程,只不过它们两者是混合起来,共......
  • 字符编码:Unicode & UTF-16 & UTF-8
    ASCII码使用一个字节(8位),对128个字符进行编码;最高位始终为0;码数范围为0000_0000(0x00)到0111_1111(0x7F);Unicode开始的编码设计使用两个字节(16位),对65536个字符进行编......
  • 第九章《字符串》第5节:字符编码常识
    ​专业上,把有公认意义的符号称之为“字符”,而一组字符形成的集合被称为“字符集”。字符集当中的每一个字符都有唯一的序号,这个序号是一个整数,用来和其他字符进行区别。内存......
  • 基于Alamouti 空间时间分组编码模拟瑞利衰落信道 BPSK 调制并计算误码率附matlab完整
    ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。......
  • Stata outsheet outfile
    usedentlab//保存逗号或制表符分隔符的文件//打开dentlab.dtaoutsheetusingdentists_tab.out,replace//将当前文件导出为dentists_tab.out,如果有同名直接覆盖,默认......