首页 > 其他分享 >[转帖]MiSans字库GB18030标准验证情况

[转帖]MiSans字库GB18030标准验证情况

时间:2024-04-16 13:35:54浏览次数:22  
标签:CJK GB18030 MiSans Unified 转帖 characters Ideographs out

https://zhuanlan.zhihu.com/p/663626158

 

 提供的信息,手机厂商终于见到跨入GB18030-2022实现级别3的进步。

 

MiSans网站提供两个汉字库下载和使用,MiSans FAQ也告知只要升级去Xiaomi HyperOS后,已可完整支持。

MiSans L3字体有以下说明:

MiSans 新增 60340 字符
符合 GB18030-2022 最新字符集国家标准
GB18030-2022 强制规范三个实现级别,于 2023 年 8 月 1 日起开始执行。实现级别1共 27,584个汉字;实现级别 2 包含实现级别 1,此外,实现级别 2 还支持《通用规范汉字表》中的没有包含在实现级别 1 之内的编码汉字,共计 27,780 个汉字;实现级别 3 包含实现级别 2,此外,实现级别 3 还支持新标准件规定的全部汉字及表 3 中的康熙部首,总计 87,887 个汉字,用于政务服务和公共服务的产品应满足实现级别 3 的要求。
MiSans 包含级别 1+ 级别 2,MiSans L3 为级别 3 字库(该字库不包含级别 1 和级别 2)。

实际下载字体后,汉字部分验证结果如下:

MiSans (Regular) :

CJK Unified Ideographs Extension A (6,582 out of 6,592 characters)
CJK Unified Ideographs (20,976 out of 20,992 characters)
CJK Compatibility Ideographs (21 out of 472 characters)
CJK Unified Ideographs Extension B (42 out of 42,720 characters)
CJK Unified Ideographs Extension C (44 out of 4,154 characters)
CJK Unified Ideographs Extension D (8 out of 222 characters)
CJK Unified Ideographs Extension E (108 out of 5,762 characters)

MiSans L3 (Regular) :

CJK Symbols and Punctuation (1 out of 64 characters)
CJK Unified Ideographs Extension B (42,675 out of 42,720 characters)
CJK Unified Ideographs Extension C (4,105 out of 4,154 characters)
CJK Unified Ideographs Extension D (214 out of 222 characters)
CJK Unified Ideographs Extension E (5,654 out of 5,762 characters)
CJK Unified Ideographs Extension F (7,473 out of 7,473 characters)
CJK Unified Ideographs Extension G (2 out of 4,939 characters)

值得宽慰的是,以前GBK-1995的PUA区字形,在这个版本中,已完全删除了,达到GB18030-2022的实际要求。

稍有遗憾的是:

  • 虽然扩展G有两个字,却与人名、地名无关,仅仅是两个biang字。
  • 基本区及扩展A末尾其实还有几个字,当前Unicode已填满,但目前字库只是按国标文本处理,并没有补齐。
  • 21个兼容区汉字,当前国标和国际标准,实际只承认使用12字,目前仍然是21个字,与国标不符

从行业来看,能跨出这一步,不失为一个正面的行动。但为了一个国家级公用服务字库,各个厂商各自造这么一个大型字库,除了浪费纳税人的银子外,其实并无可取之处。

如果你在用小米手机,不妨实际验证看看有什么帮助,或许输入法方面仍然是个障碍。
对于PUA字(很多生僻字人旧身份证在用),小米手机目前会不会像Linux一样显示内码,以便过渡,仍是一个疑问。

有关HyperOS,参见小米澎湃OS尝鲜计划,首批更新机型曝光_系列_Redmi_手机

延伸话题:GB18030-2022一号修改单(包含扩展GHI,尤其是扩展I的622人名、地名专用汉字),何时可以落地?

据相关人士信息,一号修改单已完成一征、二征,预计会进行三征,但从行业落地角度看,仍会面对三种类型的作为:

  1. 空谈无视型:GB/T 2312-1980就是标准,双字节扩展到GBK-1995已是恩赐,GBK外字用字人只是自讨苦吃而已。
  2. 循规蹈矩型:以“把书读死”为最高境界,GBK里有PUA就按照GBK做,GB18030是啥当不知道,即便知道也将52个双字节双码字让用字人自己去烦恼;或者做到GB18030-2022实现级别3的扩展F,完全不知急用加字区、扩展GHI的存在。
  3. 实干低调型:其实GB18030-2005开始,GB四字节编码与Unicode扩展16个平面的编码已经是线性算法映射关系,从字集来讲,自动跟随Unicode扩展集和急用加字只是举手之劳,做完并无任何烦恼,并为PUA转正打通最后1um的断头路,也是一件功德无量的事。先行者见 卓码之裕:GB18030-2022 第1号修改单达到落地实施条件

相关文章

WHATWG的GB18030-2022编码标准情况
Win11/Win10 22H2九月更新了什么?
放低陈见,将中文信息标准化落于实处
从“訛”字看中文信息化惡習之養成

标签:CJK,GB18030,MiSans,Unified,转帖,characters,Ideographs,out
From: https://www.cnblogs.com/jinanxiaolaohu/p/18137883

相关文章

  • [转帖]性能专题:一文搞懂性能测试常见指标
    https://developer.aliyun.com/article/725602 简介: 1.前言上周,对性能测试系列专题,在公号内发表了第一篇介绍:【性能系列连载一】开篇:性能测试不可不知的“干货”,但反响貌似并不太好,但既然此前已答应了部分读者要连载分享性能这块的知识,含着泪也得继续写。1.前言上周......
  • Misans global字体在vue中如何使用
    一、字体下载字体官网链接:https://hyperos.mi.com/font/zh/download/下载之后如下所示:解压之后如下所示:我们只需要提取其中一部分文件即可其中MiSans目录下只需要MiSansVF.tff文件_MACOSX目录下需要二、使用步骤1、将Misansglobal字体文件添加到项目中。可以将字体......
  • [转帖]SQL Server简洁查询正在运行的进程
    SQLServer简洁查询正在运行的进程通常我们可以使用sp_who2我们希望更加简洁的信息,下面这个查询使用系统表sys.sysprocesses,以及sys.dm_exec_sql_text做OUTERAPPLY.T-SQL是这样的:SELECTspid,blocked,DB_NAME(sp.dbid)ASDBName,program_name,waitresource,last......
  • [转帖]内存分析之GCViewer详细解读
    文章目录GCViewer详细解读一,Chart详解二,Eventdetail三,Summary四,Pause五,相关概念5.1GC5.1.1FullGC5.1.2MinorGC5.2垃圾收集器5.2.1串行收集器(Serial)5.2.2**ParNew收集器**5.2.3**ParallelScavenge**收集器**5.2.4CMS收集器(ConcurrentMarkSweep)****5.2.5G1......
  • [转帖][译] 使用 Linux tracepoint、perf 和 eBPF 跟踪数据包 (2017)
    http://arthurchiao.art/blog/trace-packet-with-tracepoint-perf-ebpf-zh/ 译者序本文翻译自2017年的一篇英文博客 Tracingapacket’sjourneyusingLinuxtracepoints,perfandeBPF ,并添加了章节号以方便阅读。由于译者水平有限,本文不免存在遗漏或错误之处。如......
  • [转帖]迈入 Cilium+BGP 的云原生网络时代
     http://arthurchiao.art/blog/trip-stepping-into-cloud-native-networking-era-zh/ Thispostalsoprovidesan Englishversion.本文是我们的前一篇博客 Trip.com:FirstSteptowardsCloudNativeNetworking 的后续,介绍自上一篇博客以来我们在基于Cilium的......
  • [转帖][数据库]000 - Sysbench 数据库压力测试工具
    https://zhuanlan.zhihu.com/p/340527565  sysbench 是一个开源的、模块化的、跨平台的多线程性能测试工具,可以用来进行CPU、内存、磁盘I/O、线程、数据库的性能测试。目前支持的数据库有MySQL、Oracle和PostgreSQL。以下操作都将以支持MySQL数据库为例进行。 1.......
  • [转帖]JVM 内存分析工具 MAT 的深度讲解与实践——进阶篇
    https://juejin.cn/post/6911624328472133646  注:本文原创,转发需标明作者及原文链接。欢迎关注 【0广告微信公众号:Q的博客】。本系列共三篇文章, 本文是系列第2篇——进阶篇,详细讲解MAT各种工具的核心功能、用法、适用场景,并在具体实战场景下讲解帮大家学习如何针......
  • [转帖]docker输入多行命令
    docker相关学习资料下载地址: docker相关资料合集Docker输入多行命令在使用Docker进行容器管理时,我们经常需要在容器内部执行多行命令。本文将介绍Docker中输入多行命令的几种方式,并提供相应的代码示例。1.使用Shell的行连字符在Docker中,我们可以使用Shell的行连字......
  • [转帖]Alien :RPM 和 DEB 互转
    https://www.cnblogs.com/awakenedy/articles/9707416.html 使用Alien将RPM转换成DEB以及将DEB转换成RPM在本文中,我们将为你介绍alien,一个用于在各种不同的Linux包格式相互转换的工具,其最常见的用法是将.rpm转换成.deb(或者反过来)。如果你需要某个特定类型的包,而你只能找......