java中的编解码
1.ISO-8859-1
- 单字节编码
- 收录的字符除ASCII收录的字符外,还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。
2.gb2312
- 变长1-2字节
- GB2312收录简化汉字及符号、字母、日文假名等共7445个图形字符。
3.gbk
- 变长1-2字节
- 完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字(有繁体中文)。
4.utf-8
- 变长1-4字节
- 基本全部语言。
标签:总结,编码,java,字节,字符,变长 From: https://www.cnblogs.com/blanset/p/16910184.html1.一个US-ASCIl字符只需1字节编码(Unicode范围由U+0000~U+007F)。
2.带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字母则需要2字节编码(Unicode范围由U+0080~U+07FF)。
3.其他语言的字符(包括中日韩文字、东南亚文字、中东文字等)包含了大部分常用字,使用3字节编码。
4.其他极少使用的语言字符使用4字节编码。