首页 > 其他分享 >基础数据类型详解——

基础数据类型详解——

时间:2023-11-06 11:58:43浏览次数:33  
标签:utf 字节 数据类型 基础 gbk 2byte 详解 8bit 16bit

1. 字符集和编码

字符集(Character Set)是一种定义了一组字符、符号和控制符号的集合,这些字符通常用于书写和表示文本信息。字符集可以包括字母、数字、标点符号、特殊符号、控制字符等。

电脑如何进行存储文字信息
0 1  <=> 1010101010 <=> 二进制转化成十进制 <=> 88
电脑如何进行存储文字信息
1000000  <=> a

ascii => 编排了128个文字符号. 只需要7个0和1就可以表示了. 01111111  => 1 byte => 8bit

ANSI => 一套标准, 每个字符 16bit, 2byte  => 65536
00000000 01111111

到了中国, gb2312编码, gbk编码(windows 默认的就是这个)
01000000 01010101  =>  中
到了日本, JIS编码
01000000 01010101  =>  え

Unicode: 万国码.  中文
早期Unicode没有意识到这个问题. UCS-2 2个字节.
进行了扩充, UCS-4 4个字节
00000000 00000000 00000000 01111111

utf: 是可变长度的unicode. 可以进行数据的传输和存储 -> 行书, 草书, 隶书
utf-8:   最短的字节长度8
    英文: 8bit, 1byte
    欧洲文字: 16bit, 2byte
    中文: 24bit, 3byte

utf-16:  最短的字节长度16

总结:
    1. ascii: 8bit, 1byte
    2. gbk: 16bit,  2byte  windows默认
    3. unicode: 32bit, 4byte(没法用, 只是一个标准)
    4. utf-8:       mac默认
        英文: 8bit, 1byte
        欧洲: 16bit, 2byte
        中文: 24bit, 3byte

    gbk和utf-8不能直接就进行转化.
    我军密码本  -> 文字 -> 敌军密码本
2. bytes
    程序员平时遇见的所有的数据最终单位都是字节byte

标签:utf,字节,数据类型,基础,gbk,2byte,详解,8bit,16bit
From: https://www.cnblogs.com/Magiclala/p/17812328.html

相关文章

  • (七)C#编程基础复习——Switch语句
    switch语句有点类似ifelseif语句,都可以根据表达式执行某个语句块,使用之前要遵循以下几个条件:switch语句中表达式的值必须是一个整型或者枚举类型;在一个switch语句中可以有任意数量的case雨具,每个case关键字后面要跟一个表达式比较的值和一个冒号;case关键字后面的值必须与swi......
  • (六)C#编程基础复习——条件判断语句
    在C#中,if语句主要用于条件判断,C#中支持多种类型的if语句:if语句;ifelse语句;ifelseif语句;一、if语句if语句用于条件判断,其中包含一个布尔表达式,后面跟随着若干要执行的代码,当布尔表达式为真时,后面跟随的代码就会执行,如代码所示:intnum=12;if(num%2==0){C......
  • 吃透BGP,永远绕不开这些基础概述,看完再也不怕BGP了!
    你们好,我的网工朋友。总有人在私信里抱怨,BGP实在是太难了!一是这玩意儿本来就很复杂,需要处理大量的路由信息和复杂的算法;再一个是需要你有一定的实战经验才能深入理解运作。虽然BGP确实有一定难度,但你总得先从技术理论开始吃透它吧?学习掌握了BGP,对工作中提高网络性能、增强网络稳定......
  • (五)C#编程基础复习——常量
    常量和我们前面介绍的变量相似,唯一不同的就是常量是值在程序的编译阶段就已经确定了,而且程序的运行期间不允许修改。常量可以是任何数据类型,例如整数常量、浮点常量、字符串常量等。一、定义常量常量用关键字——const定义,如代码所示:constdoublea=3.14;//声明常量double......
  • Linux基础命令(一)
    ls就是list的缩写,通过ls命令不仅可以查看linux文件夹包含的文件,而且可以查看文件权限(包括目录、文件夹、文件权限)查看目录信息等常用参数://列出目录所有文件,包含以.开始的隐藏文件ls-a//列出除.及..的其它文件ls-A//反序排列ls-r//以文件修改时间排序ls......
  • 半导体基础SECS协议(SECS-I)
    阅读导言可知,在SECS协议的基础结构中,SECS-I是一项物理链路协议,采用了R232串口的物理连接方式,定义设备在链路上使用的消息格式以及一些消息交互行为。以下介绍将大致以消息传输与消息格式两部分进行。1.消息传输-物理传输*:STARTBitLSB1 2 3 4......
  • 二叉树理论基础
    二叉树理论基础二叉树的种类满二叉树、完全二叉树、二叉搜索树、平衡二叉搜索树二叉树的存储方式顺序存储、链式存储二叉树的遍历方式二叉树主要有两种遍历方式:深度优先遍历:先往深走,遇到叶子节点再往回走。广度优先遍历:一层一层的去遍历。那么从深度优先遍历和广度优先......
  • Linux基础操作
    1)将原来的虚拟机映像文件复制到一个新的目录,并启动新复制好的虚拟机。 2)练习使用date、shutdown、exit、halt、reboot等命令a.使用date命令修正系统时间,改为当前日期时间 b.使用shutdown命令发出警告信息,查看其他控制台上的用户是否收到信息。  c.通过Internet查找......
  • Redis分布式缓存、AOF与RDB详解
    分布式缓存单点Redis的问题1.数据丢失问题Redis是内存存储,服务重启可能会丢失数据2.并发能力问题单节点Redis并发能力虽然不错,但也无法满足如618这样的高并发场景3.故障恢复问题如果Redis宕机,则服务不可用,需要一种自动的故障恢复手段4.存储能力问题Redis基于内存,单节点能存储的数据......
  • ISP 基础知识储备
    ISP(imagesignalprocessing),图像信号处理芯片,在手机摄像头和车载摄像头等领域有着广泛应用,是图像信号处理的核心芯片。ISPpipeline流程图如下:光线经过lens镜头,投射到sensor上,经过光电转换成模拟电信号,再由A/D转换成数字信号,交给ISP芯片进行一系列的处理,在LENS部分也需要进行......