目前在中文世界里,计算机系统发展非常快速,传统的Windows已经逐渐跟不上国产化,如国产安卓系统,华为欧拉鸿蒙等系列,国产Linux系统等。
国产化普遍支持GB18030!
注: GB 18030标准符合性认证一度属于国家强制性标准,由中国电子技术标准化研究所(CESI)认证中心进行授权认证。
那么这些字符集标准哪些在中文世界里适用性范围更广呢?
从集合概念来讲:
GB18030 > Unicode > GBK > GB2312
从使用平台来讲
国产化系统 > 国外系统(Windows,MacOSX,Linux,Ubuntu等) > 旧系统(WinXP, WIN 98等)
有时候会发现,在国产化系统中保存的文档,会在Windows上出现无法识别的字符,原因就在于此:
如目前Windows仍然使用GBK,即使是自带的Unicode也只收录了GBK字符集,又如华为手机采用ISO标准的Unicode,其中收录的中文字符集是参考GB18030中的中文部分(不完全,PUA区域标准不同),范围已经是大于微软采用的GBK。
可以简单认为Windows的自带Unicode字符集是残缺的,因为长期以来都只收录了GBK字符集,已经不能适应当今快速发展的计算机时代。
为什么同样是Unicode字符集,会出现手机和电脑不兼容的情况呢?
Unicode最开始收录的中文是GBK,所谓的GBK转Unicode(如转UTF8)是使用了PUA的,而后来GB18030转Unicode时有些同样的字符是不使用PUA的,这样就导致了在手机上将GB18030的中文转成Unicode后再以UTF8保存文件,再拿到Windows使用UTF8解析成Unicode字符集,会找到不对应的GBK字符,最终只能出现乱码。
标签:中文,GB18030,浅谈,Windows,字符集,GBK,GB2312,Unicode From: https://www.cnblogs.com/caibirdy1985/p/17446201.html