首页 > 编程语言 >编程语言中的编码知识

编程语言中的编码知识

时间:2023-06-01 21:35:35浏览次数:48  
标签:编码 UTF 字节 编程语言 符号 知识 Unicode 编码方式

序论

在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从00000000到11111111。

ASCII 编码

上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码,一直沿用至今。
ASCII码一共规定了128个字符的编码,比如空格"SPACE"是32(二进制00100000),大写的字母A是65(二进制01000001)。这128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0。

Unicode 编码

世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读,就会出现乱码。为什么电子邮件常常出现乱码?就是因为发信人和收信人使用的编码方式不一样。
可以想象,如果有一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一无二的编码,那么乱码问题就会消失。这就是Unicode,就像它的名字都表示的,这是一种所有符号的编码。
Unicode当然是一个很大的集合,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示阿拉伯字母Ain,U+0041表示英语的大写字母A,U+4E25表示汉字"严"。

UTF-8 编码

互联网的普及,强烈要求出现一种统一的编码方式。UTF-8就是在互联网上使用最广的一种Unicode的实现方式。其他实现方式还包括UTF-16(字符用两个字节或四个字节表示)和UTF-32(字符用四个字节表示),不过在互联网上基本不用。重复一遍,这里的关系是,UTF-8是Unicode的实现方式之一。

标签:编码,UTF,字节,编程语言,符号,知识,Unicode,编码方式
From: https://www.cnblogs.com/ChristmasIn2015/p/17433067.html

相关文章

  • 递归函数以及其他了解知识
    递归函数什么是递归函数?'''递归就是直接或者间接使用自己的函数就是递归函数,执行递归函数将反复调用其自身,每调用一次就进入新的一层,当最内层的函数执行完毕后,再一层一层地由里到外退出。'''递归函数分为两个阶段:1、递推:由外向内的一个过程2、回溯:从内向外的一个过程#练......
  • Java 基本知识——first day
    注释注释不会被执行,是写给看代码的人看的。三种注释单行注释多行注释文档注释标识符关键字Java常见的关键字考点总结四个点:首字母应该以字母、$、_开始;开始后可以任意字符;不可用关键字大小写敏感 数据类型Java是一门强类型语言强类型语言比如......
  • MYSQL知识点汇聚
    MySQL社区版下载地址:http://dev.mysql.com/downloads/第二版MYSQL视频教程:http://php.itcast.cn/news/20130617/17423736508.shtmlMYSQL优化视频教程:http://php.itcast.cn/news/61ee8515/a34e/477d/9d5d/662dbff5e161.shtml 1、MYSQL如何设置大小写敏感写道1、linu......
  • OD统一考试 B卷 本篇题目:整数编码
    华为OD机试【4大宝典】再次上新题!①Python解华为机试题:https://dream.blog.csdn.net/article/details/129221789②C++解华为机试题:https://dream.blog.csdn.net/article/details/129472919③Java解华为机试题:https://dream.blog.csdn.net/article/details/129652513④......
  • 上万条美容知识大全ACCESS\EXCEL数据库
    今天采集了一个美容知识大全的网站,网站里的内容主要是美容化妆类的文章,分类有近百个,是个可以受女生喜欢的内容。截图包含所有字段。分类统计情况为:瘦腿方法(793)、美白(615)、瘦腰(583)、上班族(472)、抗衰老(453)、男士美容(421)、瘦脸(355)、翘臀(345)、防晒(256)、瘦臂(244)、补水(241)、保湿(229)、......
  • 直播app源码技术开发知识:横竖屏功能的实现
    在快节奏时代的今天,直播短视频日益火爆,许多人选择去进入直播短视频源码搭建平台的行业,去开发制作自己的直播短视频app平台。当然,要开发制作自己的直播短视频app平台就要去顺应市场的需要,将用户们所需要的和市场各大app好的功能都要添加到自己的app中,不知道大家有没有发现这么一个功......
  • 基于FFmpeg的音频编码(PCM数据编码成AAC android)
    概述在Android上实现录音,并利用FFmpeg将PCM数据编码成AAC。详细之前做的一个demo,Android录音获取pcm数据(音频原始数据),然后利用FFmpeg将PCM数据编码成AAC。一、准备工作开发环境jdk1.8 EclipseLunaServiceRelease1(4.4.1)运行环境:华为荣耀6(Android4.4)、华为......
  • 唯一客服 -基于ChatGPT和私有数据构建智能知识库和个性化AI
    基于ChatGPT和私有数据构建智能知识库和个性化AI1.注册开通2.上传文档3.智能助理更智能,基于ChatGPT大模型算法,回答准确,逻辑清晰更安全,支持私有化部署,文档数据本地化,安全可控更全面,可用于企业AI客服,企业内部知识查询&经验分享,员工自助服务,赋能企业外部合作伙伴、个人知识库等......
  • 背景 | 基于 Transformers 的编码器-解码器模型
    !pipinstalltransformers==4.2.1!pipinstallsentencepiece==0.1.95Vaswani等人在其名作Attentionisallyouneed中首创了基于transformer的编码器-解码器模型,如今已成为自然语言处理(naturallanguageprocessing,NLP)领域编码器-解码器架构的事实标准。最近基......
  • 【博学谷学习记录】超强总结,用心分享 | spark知识点总结2
    【博学谷IT技术支持】Action动作算子reduce:通过func函数聚集RDD中的所有元素,这个功能必须是可交换且可并联的collect:在驱动程序中,以数组的形式返回数据集的所有元素count:返回RDD的元素个数first:返回RDD的第一个元素(类似于take(1))take:返回一个由数据集的前n个元......