• 2024-07-31Linux 使用unzip解压乱码
    unzip解压乱码问题 unzip软件包的unzip命令提供了-O参数(以及-I参数),可以指定编码。 -OCHARSET为DOS,Windows和OS/2归档文件指定字符编码-ICHARSET为UNIX和其他归档文件指定字符编码 可以使用下面的命令进行解压,即制定字符编码集unzip-Ogb18030***.zip 
  • 2024-06-19ios CCEncoding.m
    ////CCEncoding.h//CCFC////Createdbyxichenon11-12-18.//Copyright2011ccteam.Allrightsreserved.//#import<Foundation/Foundation.h>//"陈曦"的unicode编码为://0x480x960xE60x66//UTF8编码为://
  • 2024-04-16[转帖]MiSans字库GB18030标准验证情况
    https://zhuanlan.zhihu.com/p/663626158  提供的信息,手机厂商终于见到跨入GB18030-2022实现级别3的进步。 MiSans网站提供两个汉字库下载和使用,MiSansFAQ也告知只要升级去XiaomiHyperOS后,已可完整支持。MiSansL3字体有以下说明:MiSans新增60340字符符合GB180
  • 2024-02-03[转帖]彻底搞明白 GB2312、GBK 和 GB18030
    https://www.zhihu.com/people/lion-89 日常工作的过程中,关于字符编码的问题经常让人头疼不已,这篇文章就来捋一捋关于GB2312、GBK、GB18030相关的知识以及它们和Unicode的关系简介GB23121980年,中国发布了第一个汉字编码标准,也即GB2312,全称《信息交换用汉字
  • 2024-01-23[转帖]彻底搞明白 GB2312、GBK 和 GB18030
    https://zhuanlan.zhihu.com/p/453675608 日常工作的过程中,关于字符编码的问题经常让人头疼不已,这篇文章就来捋一捋关于GB2312、GBK、GB18030相关的知识以及它们和Unicode的关系简介GB23121980年,中国发布了第一个汉字编码标准,也即GB2312,全称《信息交换用汉
  • 2024-01-03字符集和编码格式的简单学习
    字符集和编码格式的简单学习背景因为遇到了一个数据库乱码的问题,所以想着能够学习和总结一下字符集和编码格式相关的内容内容可能比较宏大,我这边能够写的可能不是很多.希望是一个完善和提高自己的机会学习的资料https://deerchao.cn/blog/posts/unicode.html大佬的文档很牛
  • 2024-01-03GB18030-2022 标准学习
    GB18030-2022标准学习下载https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=A1931A578FE14957104988029B0833D3感觉挺大:240MB简单学习
  • 2023-11-30阿里巴巴普惠体 2.0; 阿里巴巴普惠体 3.0 Alibaba-PuHuiTi-B 下载地址
    阿里巴巴普惠体3.0阿里巴巴普惠体是一套全球永久免费正版商用的字体家族。阿里巴巴普惠体3.0为一套符合新国家标准GB18030-2022的简体中文字符集,包含GB18030-2022强制规范三个实现级别:实现级别1+实现级别2标准规格的7字重、实现级别3标准规格的Regular单一字重。7字重共194,460个全
  • 2023-10-12使用python来对字符编码序列进行互转
    排查字符集问题时,有的时候发生乱码不知道如何生成的字符,此时就需要通过字节序列来判断该字符是什么。已知utf8字节序列时,转换为unicode或者gb18030字节序列:>>>a=b'\xef\xbc\xa1'#此时a是一个bytes对象>>>b=a.decode("utf8")#此时b是一个str对象,内部是unicode的编码字
  • 2023-08-16数字化格局下的引领者:百望云通过强制性国家标准GB18030-2022最高级别认证
    8月1日,强制性国家标准GB18030-2022《信息技术中文编码字符集》实施。8月15日,百望云“绿页阅读器”正式通过中国电子技术标准化研究院强制性国家标准GB18030-2022《信息技术中文编码字符集》最高级(实现级别3)认证,彰显了百望云在数字化信息处理领域对标国家标准的卓越技术实
  • 2023-07-03文件的编码
    概述字符必须编码后才能被计算机处理计算机使用的缺省编码方式就是计算机的内码早期的计算机使用7位的ASCII编码为了处理汉字程序员设计了用于简体中文的GB2312和用于繁体中文的big5ANSIGB23121980年一共收录了7445个字符包括6763个汉字和682个其它符号汉字区的内码
  • 2023-06-13ubuntu解压ZIP文件名乱码问题
    背景一个windows压缩的zip文件,再ubuntu中解压后,文件名全是乱码,试过很多GBK、UTF-8的转换方法后找到该方法解决办法安装包sudoapt-getinstallunar使用假设需要解压的ZIP包是foo.zip列出所有文件lsarfoo.zip>如果列出的文件名已经正确解压所有文件unarfoo.z
  • 2023-05-31浅谈字符集GB18030, GBK, GB2312, Unicode的适应性范围
    目前在中文世界里,计算机系统发展非常快速,传统的Windows已经逐渐跟不上国产化,如国产安卓系统,华为欧拉鸿蒙等系列,国产Linux系统等。国产化普遍支持GB18030!注:GB18030标准符合性认证一度属于国家强制性标准,由中国电子技术标准化研究所(CESI)认证中心进行授权认证。那么这些字符集
  • 2023-04-21前端设计字体大全
    前端设计字体大全宋体SimSun黑体SimHei微软雅黑MicrosoftYaHei微软正黑体MicrosoftJhengHei新宋体NSimSun新细明体PMingLiU细明体MingLiU标楷体DFKai-SB仿宋FangSong楷体KaiTi仿宋GB2312FangSongGB2312楷体GB2312KaiTiGB2312宋体:SimSuncss中中文字体(f
  • 2022-11-11GB2312、GB18030、GBK、UNICODE、B…
    1, 常用字符集分类ASCII及其扩展字符集作用:表语英语及西欧语言。位数:ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。范围:ASCII从00到7F,扩展从00到FF。
  • 2022-09-21关于Linux字符集的查看及修改
    一·查看字符集字符集在系统中体现形式是一个环境变量,以CentOS6.5为例,其查看当前终端使用字符集的方式可以有以下几种方式:1、[root@david~]#echo$LANGzh_CN.GB180302