一个汉字占用几个字节？3~4个！

时间：2024-09-12 15:48:22浏览次数：16

标签：编码符号表字节占用汉字 Unicode 10111101

先说答案，在UTF-8编码中，常用汉字通常占3个字节。具体情况取决于该汉字的Unicode编码值。

要理清这个概念，需要知道人类所认知的数据（或者说信息）和计算机所理解的数据是不同的。

比如一句话（一个数据）汉语表达是“你好，世界”

英语中，“hello，world”

法语中，“Bonjour, le monde”

日语中，“こんにちは、世界”

但在计算机中，数据都变成了0和1，我们可以类比汉语中的汉字和句子，比如你好这两个字，由字你和好组成，那么转换成计算机能存储和传输的数据，就需要一张表来映射成数字（毕达哥拉斯：万物皆数），再将数字转换成二进制就变成了

11100100 10111101 10100000
11100101 10100101 10111101

由于计算机是在美国发明的，因此当时只考虑了美国人所常用的字符，那张表被称为ASCII表，如今这张表被无数人扩充变成了Unicode 符号表，UTF-8编码就是按照Unicode 符号表将字符转换为字节序列。

在线Unicode符号表查询 https://symbl.cc/

标签：编码,符号表,字节,占用,汉字,Unicode,10111101
From： https://www.cnblogs.com/ashet/p/18410330

苹果研究人员提出了一种新颖的AI算法来优化字节级表示以自动语音识别(ASR)，并将其与UTF
端到端（E2E）神经网络已成为多语言自动语音识别（ASR）的灵活且准确的模型。然而，随着支持的语言数量增加，尤其是像中文、日语、韩语（CJK）这样大字符集的语言，输出层的大小显著增长。这种扩展对计算资源、内存使用和资产大小产生了负面影响。在多语言系统中，这一挑战尤为严重，因为输出通常包......
【高级编程】Java IO流（下）字符流 Reader Writer 字节流读取二进制文件
文章目录ReaderFileReaderBufferedReaderWriterFileWriterBufferedWriter读写二进制文件ReaderReader是一个抽象类，用于读取字符流。它是所有字符输入流的基类。Reader提供了一些基本的方法来读取字符数据intread()//读取单个字符，并返回一个整数。如果到达流......
【秋招笔试】9.08字节跳动秋招(已改编)-三语言题解
......
TFS2015版以上强制删除被占用文件及强制删除工作区
TFS2015版以上强制删除被占用文件及强制删除工作区，包括强制撤销其他人的签出。TFS文件被占用，强制取消占用。由于各种原因（签出后工作区更改、人员离职调动等）需要删除其他成员占用的文件TeamFoundation2015强制解除签入签出锁定TFS(TeamFoundationserver)源代码管理器，如何......
2024.08.25字节
1.周期字符串小红有一个长度为n的字符串s，由0、1和*组成，可以把*替换成0或者1，小红想知道替换后的字符串的最短周期是多少，如果一个字符串每一个位置的字母都与后k位的字母相同，那么k即为该字符串的一个周期。形式化的说，如果存在一个正整数k使得对于所有的i属于[1,n-k]都有s......
linux删除0字节文件
实现方式：find-typef-size0-execrm-rf{}\;[root@logstash~]#find-typef-size0-execls-l{}\;-rw-r--r--1rootroot0Jul1914:39./a.txt-rw-r--r--1rootroot0Jul1914:39./b.txt-rw-r--r--1rootroot0Jul1914:39./c.txt-rw-r--r--1......
C++判断文件是否被占用
1.代码#include<windows.h>#include<iostream>boolIsFileInUse(conststd::wstring&filePath){HANDLEhFile=CreateFileW(filePath.c_str(),GENERIC_READ,0,//不允许其他进程共享NULL,OPEN_EXISTING,......
用Python实现阿拉伯数字转换成中国汉字
要将阿拉伯数字转换成中国汉字表示的数字，我们需要一个映射表来转换每个数字，并且处理不同位数的数字（如十、百、千、万等）。1.Python实现阿拉伯数字转换成中国汉字下面是一个完整的Python代码示例，用于实现这一功能。该代码首先定义了一个数字到汉字的映射表，然后定义了转换函数，该函......
用Python实现阿拉伯数字转换成中国汉字
要将阿拉伯数字转换成中国汉字表示的数字，我们需要一个映射表来转换每个数字，并且处理不同位数的数字（如十、百、千、万等）。1.Python实现阿拉伯数字转换成中国汉字下面是一个完整的Python代码示例，用于实现这一功能。该代码首先定义了一个数字到汉字的映射表，然后定义了转换函数，该函......

一个汉字占用几个字节？3~4个！

相关文章

赞助商

阅读排行