首页 > 其他分享 >一个汉字占用几个字节?3~4个!

一个汉字占用几个字节?3~4个!

时间:2024-09-12 15:48:22浏览次数:13  
标签:编码 符号表 字节 占用 汉字 Unicode 10111101

先说答案,在UTF-8编码中,常用汉字通常占3个字节。具体情况取决于该汉字的Unicode编码值。

 

要理清这个概念,需要知道人类所认知的数据(或者说信息)和计算机所理解的数据是不同的。

比如一句话(一个数据)汉语表达是“你好,世界

英语中,“hello,world

法语中,“Bonjour, le monde

日语中,“こんにちは、世界

但在计算机中,数据都变成了0和1,我们可以类比汉语中的汉字和句子,比如你好这两个字,由字组成,那么转换成计算机能存储和传输的数据,就需要一张来映射成数字(毕达哥拉斯:万物皆数),再将数字转换成二进制就变成了

11100100 10111101 10100000
11100101 10100101 10111101

由于计算机是在美国发明的,因此当时只考虑了美国人所常用的字符,那张表被称为ASCII表,如今这张表被无数人扩充变成了Unicode 符号表,UTF-8编码就是按照Unicode 符号表将字符转换为字节序列

在线Unicode符号表查询  https://symbl.cc/

 

标签:编码,符号表,字节,占用,汉字,Unicode,10111101
From: https://www.cnblogs.com/ashet/p/18410330

相关文章

  • 苹果研究人员提出了一种新颖的AI算法来优化字节级表示以自动语音识别(ASR),并将其与UTF
    端到端(E2E)神经网络已成为多语言自动语音识别(ASR)的灵活且准确的模型。然而,随着支持的语言数量增加,尤其是像中文、日语、韩语(CJK)这样大字符集的语言,输出层的大小显著增长。这种扩展对计算资源、内存使用和资产大小产生了负面影响。在多语言系统中,这一挑战尤为严重,因为输出通常包......
  • 学弟去字节面试,一小时被问了 50 题。。
    大家好,我是程序员鱼皮。昨天直播面试了一位25届的学弟,暂且就叫他“阿强”吧。阿强非常优秀,不仅有半年的实习经历、有自己的项目,而且还参加过大厂(字节)的面试。面试开场前,我问学弟:你上次面试字节时,感受如何?结果阿强的回答差点闪了我的老腰,他说:强度挺大,1个小时的面试问了我5......
  • 【高级编程】Java IO流(下)字符流 Reader Writer 字节流读取二进制文件
    文章目录ReaderFileReaderBufferedReaderWriterFileWriterBufferedWriter读写二进制文件ReaderReader是一个抽象类,用于读取字符流。它是所有字符输入流的基类。Reader提供了一些基本的方法来读取字符数据intread()//读取单个字符,并返回一个整数。如果到达流......
  • 【秋招笔试】9.08字节跳动秋招(已改编)-三语言题解
    ......
  • TFS2015版以上强制删除被占用文件及强制删除工作区
    TFS2015版以上强制删除被占用文件及强制删除工作区,包括强制撤销其他人的签出。TFS文件被占用,强制取消占用。由于各种原因(签出后工作区更改、人员离职调动等)需要删除其他成员占用的文件TeamFoundation2015强制解除签入签出锁定TFS(TeamFoundationserver)源代码管理器,如何......
  • 2024.08.25字节
    1.周期字符串小红有一个长度为n的字符串s,由0、1和*组成,可以把*替换成0或者1,小红想知道替换后的字符串的最短周期是多少,如果一个字符串每一个位置的字母都与后k位的字母相同,那么k即为该字符串的一个周期。形式化的说,如果存在一个正整数k使得对于所有的i属于[1,n-k]都有s......
  • linux删除0字节文件
    实现方式:find-typef-size0-execrm-rf{}\;[root@logstash~]#find-typef-size0-execls-l{}\;-rw-r--r--1rootroot0Jul1914:39./a.txt-rw-r--r--1rootroot0Jul1914:39./b.txt-rw-r--r--1rootroot0Jul1914:39./c.txt-rw-r--r--1......
  • C++判断文件是否被占用
    1.代码#include<windows.h>#include<iostream>boolIsFileInUse(conststd::wstring&filePath){HANDLEhFile=CreateFileW(filePath.c_str(),GENERIC_READ,0,//不允许其他进程共享NULL,OPEN_EXISTING,......
  • 用Python实现阿拉伯数字转换成中国汉字
    要将阿拉伯数字转换成中国汉字表示的数字,我们需要一个映射表来转换每个数字,并且处理不同位数的数字(如十、百、千、万等)。1.Python实现阿拉伯数字转换成中国汉字下面是一个完整的Python代码示例,用于实现这一功能。该代码首先定义了一个数字到汉字的映射表,然后定义了转换函数,该函......
  • 用Python实现阿拉伯数字转换成中国汉字
    要将阿拉伯数字转换成中国汉字表示的数字,我们需要一个映射表来转换每个数字,并且处理不同位数的数字(如十、百、千、万等)。1.Python实现阿拉伯数字转换成中国汉字下面是一个完整的Python代码示例,用于实现这一功能。该代码首先定义了一个数字到汉字的映射表,然后定义了转换函数,该函......