首页 > 其他分享 >文件的编码

文件的编码

时间:2023-07-03 18:35:34浏览次数:42  
标签:编码 GB18030 文件 GBK 汉字 GB2312

概述

字符必须编码后才能被计算机处理 计算机使用的缺省编码方式就是计算机的内码
早期的计算机使用7位的ASCII编码 为了处理汉字 程序员设计了用于简体中文的 GB2312 和用于繁体中文的 big5

ANSI

GB2312

1980年一共收录了7445个字符 包括6763个汉字和682个其它符号
汉字区的内码范围高字节从B0-F7 低字节从A1-FE 占用的码位是72*94=6768 其中有5个空位是D7FA-D7FE
GB2312 支持的汉字太少 1995年的汉字扩展规范GBK1.0收录了21886个符号 它分为汉字区和图形符号区
汉字区包括21003个字符 2000年的 GB18030是取代GBK1.0的正式国家标准 该标准收录了27484个汉字
同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字 现在的PC平台必须支持GB18030
对嵌入式产品暂不作要求 所以手机 MP3一般只支持GB2312
从ASCII GB2312 GBK到GB18030 这些编码方法是向下兼容的 即同一个字符在这些方案中总是有相同的编码
后面的标准支持更多的字符 在这些编码中 英文和中文可以统一地处理 区分中文编码的方法是高字节的最高位不为0
按照程序员的称呼 GB2312、GBK到GB18030都属于双字节字符集 (DBCS)
有的中文Windows的缺省内码还是GBK 可以通过GB18030升级包升级到GB18030 不过GB18030相对GBK增加的字符
普通人是很难用到的 通常我们还是用GBK指代中文Windows内码

文件编码的种类

ASCII码文件

此类文件为人类可识别的文件 比如 电子书 文本文档

二进制码文件

此类文件为人类不可识别的文件 比如 歌曲文件 视屏文件
通常用于文件流 编程里经常把文件存储为这种文件

标签:编码,GB18030,文件,GBK,汉字,GB2312
From: https://www.cnblogs.com/ass-code/p/17523681.html

相关文章

  • yaml文件类型解析
    yaml文件类型mysql:host:127.0.0.1user:testport:35039db:testpassword:1234567dp_ip:-192.168.0.1-192.168.0.2-192.168.0.3读取后结果为{'mysql':{'host':'127.0.0.1','user':'test',......
  • Linux设置字符编码
    一、Linux设置字符编码1、什么是字符编码字符编码可以实现对非英文字符的支持,防止非英文字符的乱码。2、国内常用的字符编码UTF-8 GBK3、设置字符编码我们可以对Linux系统的字符编码进行查看,临时修改,永欠修改。3.1、临时修改#查看当前使用字符编码,一般默认都为en_US.UTF......
  • IDEA:idea中新建文件一段时间后找不到
    观看一会视频后,返回发现界面只有外部库了 打开之前的创建的文件发现已经没有查看路径已不存在  可以看到这创建在了动态页面,之后创建时看好创建在哪就好,文件如果是第一张图的样子,可通过 右键左侧栏目空白处,尝试寻找。 ......
  • centos 关于日志文件切割logrotate的使用及示例
    (文章目录)本文简单的介绍了logrotate使用和示例。本文分为2个部分,即logrotate介绍以及以tomcat的日志为示例进行介绍。一、Logrotate介绍Logrotate程序是一个日志文件管理工具。用于分割日志文件,压缩转存、删除旧的日志文件,并创建新的日志文件logrotate一般系统会自带,不需......
  • python 文件操作
    文件介绍文本文件可以使用记事本软件打开txt,py,md,json二进制文件不能使用记事本软件打开音频文件mp3视频文件mp4....图片png,jpg,gif,exe文件操作打开文件open()rwa是⽂本⽅式打开,适⽤于⽂本⽂件,会对⼆进制进⾏编码转换rbwbab是⼆进制......
  • File - 删除文件
    try{//删除临时上传的Excel文件if(System.IO.File.Exists(path)){FileInfofi=newFileInfo(path);if(fi.Attributes.ToString().IndexOf("ReadOnly")!=-1)......
  • linux源码解读(三):文件系统——inode【转】
    转自:https://www.cnblogs.com/theseventhson/p/15622853.html众所周知,计算机系统在掉电后也能存储数据的就是磁盘了,所以大量数据大部分时间是存放在磁盘的;现在新买的PC,磁盘从数百G到1TB不等;服务器的磁盘从数十TB到上百TB,这么大的存储空间,该怎么高效地管理和使用了?站在硬件角度,cpu......
  • 在Java中使用Apache POI导入Excel文件并保留内容的换行符
    importorg.apache.poi.ss.usermodel.*;importorg.apache.poi.xssf.usermodel.XSSFWorkbook;importjava.io.FileInputStream;importjava.io.IOException;publicclassReadExcelWithNewlines{publicstaticvoidmain(String[]args){StringfilePat......
  • python pytest框架文件结构
    pytest框架的文件结构相对灵活,没有强制要求特定的文件结构。然而,以下是一种常见的pytest框架文件结构示例:测试文件:测试文件是编写测试用例的主要部分,通常以test_开头,并以.py为扩展名。例如,test_example.py。测试函数:在测试文件中,测试用例通常以函数的形式存在。测试函数的命......
  • C# - 后台通过url下载文件到指定目录
     后台通过url下载文件到指定目录stringurl="https://file/Get/c76918bd-b4af-41b3-b767-32b5582d77de"; //下载地址using(WebClientclient=newWebClient()){client.DownloadFile(url,@"C:\JXW\TMP.xlsx");......