查看字符集
- 读取标签 特定字符集(0008,0005)
字符集
- unicode是字符集,ASCII、GB2312、GBK、GB18030既是字符集也是编码方式,UTF-8只是编码方式
- 通过字符集
- 中文字符集
字符集的选择 不同厂商实现不同 修改导致不可读
- [ISO / IEC 10646]现在禁止使用除UTF-8的最小长度编码以外的任何内容。 UTF-8允许多种不同的编码,但是当用于按照ISO 10646-1和10646-2(带有扩展名)编码Unicode字符时,只有最小限度的编码才是合法的。
- DICOM默认字符库中字符的表示形式与默认字符库,UTF-8中的[ISO / IEC 10646],[GB 18030]和[GBK]的单字节值相同。它也是7位US-ASCII编码。
- [GBK]字符集是[GB 18030]字符集的子集,该字符集受其一字节和两字节代码点的限制。在此子集中,[GBK]字符集遵循与[GB 18030]完全相同的编码规则。
常用的编码
- unicode =》 ISO_IR 192
- ISO IR 192 是 ISO/IEC 2022 标准中的一个字符集,它定义了字符集“ISO 8859-1”(也称为 Latin-1)。ISO IR 192 是一个标识符,用于表示 ISO 8859-1 字符集在特定上下文中的编码规。
- 很多java 和 mysql 数据默认为 Latin-1
- GB18030 =》GB18030