首页 > 编程语言 >C语言程序设计 ASCII美国标准信息交换标准码 简介

C语言程序设计 ASCII美国标准信息交换标准码 简介

时间:2023-11-08 11:02:40浏览次数:48  
标签:0110 0111 0000 0101 0100 C语言 标准 ASCII

美国标准信息交换标准码
( American Standard Code for Information Interchange, ASCII )

       在计算机中,所有的数据在存储和运算时都要使用二进制数表示(因为计算机比较傻,只有0和1两位数的二进制比较适合于它使用),同样的,象a、b、c、d 这样的52个字母(包括大写)、以及0、1、2等数字还有一些常用的符号(例如*、#、@等)在计算机中存储时也要使用二进制数来表示,而具体用哪个数字表示哪个符号,当然每个人都可以约定自己的一套(这就叫编码),而大家如果要想互相通讯而不造成混乱,那么大家就必须使用相同的编码规则,于是美国有关的标准化组织就出台了所谓的ASCII编码,统一规定了上述常用符号用哪个二进制数来表示。
       美国标准信息交换代码是由美国国家标准学会(American National Standard Institute , ANSI )制定的,标准的单字节字符编码方案,用于基于文本的数据。起始于50年代后期,在1967年定案。它最初是美国国家标准,供不同计算机在相互通信时用作共同遵守的西文字符编码标准,它已被国际标准化组织(International Organization for Standardization, ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母。
ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:
        0~32及127(共34个)是控制字符或通讯专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、 FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为 8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
        33~126(共94个)是字符,其中48~57为0到9十个阿拉伯数字;
65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。 
同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
       后128个称为扩展ASCII码,目前许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。以下为标准ASCII表:

Bin               Dec     Hex         缩写/字符                                      解释
0000 0000    0          00            NUL (null)                                      空字符  
0000 0001    1          01            SOH (start of handing)                  标题开始 
0000 0010    2          02            STX (start of text)                          正文开始 
0000 0011    3          03            ETX (end of text)                           正文结束
0000 0100    4          04            EOT (end of transmission)            传输结束 
0000 0101    5          05            ENQ (enquiry)                               请求 
0000 0110    6          06            ACK (acknowledge)                       收到通知 
0000 0111    7          07            BEL (bell)                                      响铃
0000 1000    8          08            BS (backspace)                             退格 
0000 1001    9          09            HT (horizontal tab)                         水平制表符 
0000 1010    10        0A            LF (NL line feed, new line)             换行键 
0000 1011    11        0B            VT (vertical tab)                             垂直制表符 
0000 1100    12        0C            FF (NP form feed, new page)        换页键 
0000 1101    13        0D            CR (carriage return)                      回车键
0000 1110    14        0E            SO (shift out)                                 不用切换 
0000 1111    15        0F            SI (shift in)                                     启用切换 
0001 0000    16        10            DLE (data link escape)                  数据链路转义 
0001 0001    17        11            DC1 (device control 1)                  设备控制1 
0001 0010    18        12            DC2 (device control 2)                  设备控制2 
0001 0011    19        13            DC3 (device control 3)                  设备控制3 
0001 0100    20        14            DC4 (device control 4)                  设备控制4 
0001 0101    21        15            NAK (negative acknowledge)        拒绝接收 
0001 0110    22        16            SYN (synchronous idle)                 同步空闲 
0001 0111    23        17            ETB (end of trans. block)              传输块结束 
0001 1000    24        18            CAN (cancel)                                 取消
0001 1001    25        19            EM (end of medium)                      介质中断 
0001 1010    26        1A            SUB (substitute)                            替补 
0001 1011    27        1B            ESC (escape)                                溢出 
0001 1100    28        1C            FS (file separator)                         文件分割符 
0001 1101    29        1D            GS (group separator)                    分组符 
0001 1110    30        1E            RS (record separator)                   记录分离符 
0001 1111    31        1F            US (unit separator)                        单元分隔符 

0010 0000    32        20            空格
0010 0001    33        21            !
0010 0010    34        22            "
0010 0011    35        23            #
0010 0100    36        24            $
0010 0101    37        25            %
0010 0110    38        26            &
0010 0111    39        27            '
0010 1000    40        28            (
0010 1001    41        29            )
0010 1010    42        2A            *
0010 1011    43        2B            +
0010 1100    44        2C            ,
0010 1101    45        2D            -
0010 1110    46        2E            .
0010 1111    47        2F            /
0011 0000    48        30            0
0011 0001    49        31            1
0011 0010    50        32            2
0011 0011    51        33            3
0011 0100    52        34            4
0011 0101    53        35            5
0011 0110    54        36            6
0011 0111    55        37            7
0011 1000    56        38            8
0011 1001    57        39            9
0011 1010    58        3A            :
0011 1011    59        3B            ;
0011 1100    60        3C            <
0011 1101    61        3D            =
0011 1110    62        3E            >
0011 1111    63        3F            ?
0100 0000    64        40            @

0100 0001    65        41            A
0100 0010    66        42            B
0100 0011    67        43            C
0100 0100    68        44            D
0100 0101    69        45            E
0100 0110    70        46            F
0100 0111    71        47            G
0100 1000    72        48            H
0100 1001    73        49            I
0100 1010    74        4A            J
0100 1011    75        4B            K
0100 1100    76        4C            L
0100 1101    77        4D            M
0100 1110    78        4E            N
0100 1111    79        4F            O
0101 0000    80        50            P
0101 0001    81        51            Q
0101 0010    82        52            R
0101 0011    83        53            S
0101 0100    84        54            T
0101 0101    85        55            U
0101 0110    86        56            V
0101 0111    87        57            W
0101 1000    88        58            X
0101 1001    89        59            Y
0101 1010    90        5A            Z
0101 1011    91        5B            [
0101 1100    92        5C            \
0101 1101    93        5D            ]
0101 1110    94        5E            ^
0101 1111    95        5F            _
0110 0000    96        60            `

0110 0001    97        61            a
0110 0010    98        62            b
0110 0011    99        63            c
0110 0100    100      64            d
0110 0101    101      65            e
0110 0110    102      66            f
0110 0111    103      67            g
0110 1000    104      68            h
0110 1001    105      69            i
0110 1010    106      6A            j
0110 1011    107      6B            k
0110 1100    108      6C            l
0110 1101    109      6D            m
0110 1110    110      6E            n
0110 1111    111      6F            o
0111 0000    112      70            p
0111 0001    113      71            q
0111 0010    114      72            r
0111 0011    115      73            s
0111 0100    116      74            t
0111 0101    117      75            u
0111 0110    118      76            v
0111 0111    119      77            w
0111 1000    120      78            x
0111 1001    121      79            y
0111 1010    122      7A            z
0111 1011    123      7B            {
0111 1100    124      7C            |
0111 1101    125      7D            }
0111 1110    126      7E            ~ 

0111 1111    127      7F            DEL (delete)                                删除  
另外还有128-255的ASCII字符
字符集简史
    6000年前 象形文字
    3000年前 字母表
    1838年到1854年 Samuel F. B. Morse发明了电报,字母表中的每个字符对应于一系列短的和长的脉冲
    1821年到1824年 Louis Braille发明盲文,6位代码,它把字符、常用字母组合、常用单字和标点进行编码。
        一个特殊的escape代码表示后续的字符代码应解释为大写。一个特殊的shift代码允许后续代码被解释为数字。
    1931年 CCITT标准化Telex代码,包括Baudot #2的代码,都是包括字符和数字的5位代码。
    1890年 早期计算机的字符码是从Hollerith卡片,6位字符码系统BCDIC(Binary-Coded Decimal Interchange Code:二进制编码十进制交换编码)
    60年代 扩展为8位EBCDIC,IBM大型主机的标准
    1967年 美国信息交换标准码(ASCII:American Standard Code for Information Interchange)
            在字符长度是6位、7位还是8位的问题上产生了很大的争议。从可靠性的观点来看不应使用替换字符,
            因此ASCII不能是6位编码,但由于费用的原因也排除了8位版本的方案(当时每位的储存空间成本仍很昂贵)。
            这样,最终的字符码就有26个小写字母、26个大写字母、10个数字、32个符号、33个句柄和一个空格,总共128个字符码。
            ASCII现在记录在ANSI X3.4-1986字符集-用于信息交换的7位美国国家标准码(7-Bit ASCII:7-Bit American National
            Standard Code for Information Interchange),由美国国家标准协会(American National Standards Institute)发布。
            图2-1中所示的ASCII字符码与ANSI文件中的格式相似。

  
  
ASCII国际问题
    ASCII是美国标准,所以它不能良好满足其它讲英语国家的需要。例如英国的英镑符号(£)在哪里?
    拉丁语字母表重音符号
    使用斯拉夫字母表的希腊语、希伯来语、阿拉伯语和俄语。
    汉字系统的中国象形汉字,日本和朝鲜。
  
    1967年,国际标准化组织(ISO:International Standards Organization)推荐一个ASCII的变种,
    代码0x40、0x5B、0x5C、0x5D、0x7B、0x7C和0x7D“为国家使用保留”,而代码0x5E、0x60和0x7E标为
    “当国内要求的特殊字符需要8、9或10个空间位置时,可用于其它图形符号”。这显然不是一个最佳的国际解决方案,
    因为这并不能保证一致性。但这却显示了人们如何想尽办法为不同的语言来编码的。
  
扩展ASCII
    1981年 IBM PC ROM256个字符的字符集,即IBM扩展字符集
    1985年11 Windows字符集被称作“ANSI字符集”,遵循了ANSI草案和ISO标准(ANSI/ISO 8859-1-1987,简“Latin 1”。
    ANSI字符集的最初版本:
    1987年4月代码页437,字符的映像代码,出现在MS-DOS 3.3


双字节字符集
    双字节字符集(DBCS:double-byte character set),解决中国、日本和韩国的象形文字符和ASCII的某种兼容性。
    DBCS从256代码开始,就像ASCII一样。与任何行为良好的代码页一样,最初的128个代码是ASCII。
    然而,较高的128个代码中的某些总是跟随着第二个字节。
    这两个字节一起(称作首字节和跟随字节)定义一个字符,通常是一个复杂的象形文字。

ref: http://baike.baidu.com/view/15482.htm



标签:0110,0111,0000,0101,0100,C语言,标准,ASCII
From: https://blog.51cto.com/emanlee/8246669

相关文章

  • C语言程序设计 运算符的优先级与结合性
     C运算符的优先级与结合优先级运算符含义参与运算对象的数目结合方向 1()[]->.圆括号运算符下标运算符指向结构体成员运算符结构体成员运算符双目运算符双目运算符双目运算符自左至右2!~+......
  • C语言程序设计 文件操作函数
    文件操作函数C语言(FILEfputcfgetcfputsfgetsfscanffprintf)在ANSIC中,对文件的操作分为两种方式,即流式文件操作和I/O文件操作,下面就分别介绍之。一、流式文件操作这种方式的文件操作有一个重要的结构FILE,FILE在stdio.h中定义如下:typedefstruct{intlevel;/*fill/empt......
  • C语言程序设计 练习题参考答案 第八章 文件(1)
    /*8.5从键盘输入一行字符,将其中小写字母转换为大写字母*/#include"stdio.h"voidmain(){FILE*fp;charch;if((fp=fopen("c:\\ex85.txt","w"))==NULL){printf("不能创建文件c:\\ex85.txt");exit(1);......
  • C语言程序设计 练习题参考答案 第八章 文件(2)
    /*8.8从文件ex88_1.txt中取出成绩,排序后,按降序存放EX88_2.TXT中*/#include"stdio.h"#defineN10structstudent{intnum;charname[20];intscore[3];/*不能使用float*/floataverage;};voidsort(structstudentstu[]);voidprint(FILE*fp,......
  • C语言程序设计 笔试考试,试题样卷
    2008C语言笔试考试,试题样卷http://202.200.112.204/jingpin_c/XiTiKu/BiShiYangJuan.htm注:(1)其中参考答案不一定正确(部分从网上或习题书上搜集的)。(2)出题教师可能会参考此题库,但不限于此题库。......
  • C语言程序设计 回答同学提出的几个疑问 2008
    1,例4.11中的K=1时什麽意思?K用来表示是否是空格字符(注:不是空字符,而是空格字符)0表示空格字符1表示非空格字符  2,例3.17看不懂呀?这一题不难。如果看不懂需要加把劲了。=12时就是按第三个式子算得呀。是有逻辑错误的。1<=x<10就有明显的错误,因为这是数学中的写法,不是C语言中的写法。......
  • C语言变量分类
    按照变量的定义位置分类,在函数外部定义的变量为全局变量或者外部变量;在函数内部定义的变量为局部变量。在不加修饰\(^*\)的情况下,全局变量的作用域是定义以下的整个文件,局部变量的定义域是定义以下的所在函数体。在函数内访问变量时,优先查找局部变量,所以如果局部变量与全局变......
  • 字符串复健(c语言)
    目录目录目录字符串的声明和初始化字符串的内存表示字符串的输入输出输入输出字符串相关函数总结字符串的声明和初始化在C语言中,字符串实际上是使用空字符\0结尾的一维字符数组。声明和初始化一个abc字符串:charsite[4]={'a','b','c','\0'};简化:charsite[]="a......
  • 学习c语言的一天(1)
     打印地址使用%p输出int(整型)二维数组时,发现地址每次+4,是因为一个整型占4个字节,同理输出char(字符型)二维数组占1个字节,所以存储地址每次+1 #define_CRY_SECURE_NO_WARNINGS#include<stdio.h>intmain(){ intarr[3][4]={{1,2,3,4},{5,6}};charcarr[3][4]={{'a......
  • 用c语言写“扫雷游戏”
    扫雷游戏是一款简单却富有挑战性的益智游戏,适合所有年龄段的玩家。游戏的操作简单,但是需要玩家具备较高的逻辑推理能力和观察力,让人在游戏的过程中不断思考、分析、判断。游戏同时也可以锻炼玩家的注意力和耐心,让人享受到难度和成功带来的成就感。总体来说,扫雷游戏是一款有趣又有益......