字节顺序标记

字节顺序标记

时间：2022-09-18 22:57:19浏览次数：98

标签：编码顺序 UTF 字节标记 32 FEFF BOM

UTF-32 和 UTF-16 的一个 Code Unit，需要转换成多个字节的序列，因此存在字节序的问题。

可以在 UTF-32 或 UTF-16 编码的字节流开头，添加字节顺序标记 (byte-order mark, BOM)，来标识字节序。

BOM 是 U+FEFF 字符的名称。编码时，将 U+FEFF 编码在字节流的开头。解码时，读取前几个字节，就知道编码时的字节序了。

例如 UTF-16 的大端序，U+FEFF 会被编码成 0xFEFF，而小端序则会编码成 0xFFFE。这样根据开头是 0xFEFF 还是 0xFFFE，就知道编码时使用的大端序还是小端序了。

同理 UTF-32 的大端序，U+FEFF 会被编码成 0x00 00 FE FF，而小端序则会编码成 0xFF FE 00 00。这样根据开头，不光能区分出字节序，还能区分出是 UTF-32 还是 UTF-16。

UTF-8 的一个 Code Unit 只需要转换为 1 个字节，因此不存在字节序的问题，也就不需要 BOM。而且 0xFEFF 或 0xFFFE 字节序列，在 UTF-8 中都是不可能出现的。所以根据 BOM，也能区分出编码方式是不是 UTF-8。

如果硬要给 UTF-8 加 BOM，那就是将 0xFEFF (0b1111 1110 1111 1111) 进行 UTF-8 编码，得到 0xEF BB BF (0b1110 1111 1011 1011 1011 1111)，放在字节流的最前面。

之所以使用 U+FEFF 这个字符来标识字节序，可能是因为这个字符本身就表示“零宽非断空格”的含义。把他放在最前面，解码的时候支持 BOM，就把他按照字节序去理解；不支持的就把他解析成一个“零宽非断空格”，展示起来也没有任何影响。当然这是我瞎猜的，而且从 Unicode 3.2 开始，U+FEFF 已经专门用来标记字节序，没有其他含义了。

标签：编码,顺序,UTF,字节,标记,32,FEFF,BOM
From： https://www.cnblogs.com/val3344/p/16706139.html

pytest测试框架2【控制用例的执行顺序】
1.pytest加载所有的测试用例都是乱序的，如果想指定用例的顺序，可以使用pytest-ordering插件，指定用例的执行顺序只需要在测试用例的方法前面加上装饰器@pytest.mark.run(order......
SQL数据库语句执行顺序
数据库查询语句完整的执行顺序：逻辑查询处理阶段简介：1、FROM：对FROM子句中的前两个表执行笛卡尔积(交叉联接)，生成虚拟表VT1。2、ON：对VT1应用ON筛选器，只有那些使......
nodejs <a>带参数返回路由标记执行数据库操作
今天在测试mongo数据库操作维护的时候，测试了一下直接在表内添加操作列来完成数据的删除操作，直接返回数据库ID1、mongo数据操作functiondelStudentid(id,callback){ ......
mq中如何保证消息的顺序性
先说结论不建议在mq当中使用消息的投递顺序来保证消息的顺序一致性反思为什么需要保留消息的顺序性日常思维中，顺序大部分情况会和时间关联起来，即时间的先后表示事件的顺......
Vue2：数据的劫持顺序
this组件对象有很对属性和方法都是劫持的"别人"的:比如datamethodspropsthis在构建时给this设置成员的时间顺序data>props属性>方法>计算属性>事件中给this添......
字节跳动 DanceCC 工具链系列之Xcode LLDB耗时监控统计方案
作者：李卓立仲凯宁背景介绍在《字节跳动DanceCC工具链系列之Swift调试性能的优化方案》[1]一文中，我们介绍了如何使用自定义的工具链，来针对性优化调试器的性能，解决大......
idea 查看类的字节码信息( jclassLib Bytecode viewer插件、javap tools)
idea查看类的字节码信息第一种方式：IntelliJIDEA--Preferences---Plugins安装插件：jclassLibBytecodeviewer第二种方式：IntelliJIDEA--Preferenc......
vue3 组件-上升下降趋势标记
https://kuangyx.cn/docs/文章/vue3组件/趋势标记.html......
三个稠密矩阵A,B,C的乘积ABC，假设三个矩阵的尺寸分别为mn,np,pq,且m<n<p<q，以下计算顺序
题目在深度学习中，涉及到大量矩阵相乘，现在需要计算三个稠密矩阵A,B,C的乘积ABC，假设三个矩阵的尺寸分别为mn,np,p*q,且m<n<p<q，以下计算顺序效率最高的是：（）a.A(BC)b.(AB)C......
浏览器垃圾回收机制：栈垃圾回收、堆垃圾回收、新生区老生区、Scavenge算法、标记-清除
浏览器垃圾回收机制根据数据的存储方式分为栈垃圾回收和堆垃圾回收。栈垃圾回收的方式非常简便，当一个函数执行结束之后，JavaScript引擎会通过向下移动ESP来销毁该函数保......

相关文章

赞助商

阅读排行