首页 > 其他分享 >ASCII字符和中文字符的显示

ASCII字符和中文字符的显示

时间:2024-09-16 19:52:10浏览次数:11  
标签:字符 中文 16 ASCII 像素 var 点阵

目录

前言

ASCII字符的点阵显示

获取点阵

描点

main

中文字符的点阵显示

指定编码格式

汉字区位码

汉字点阵显示实验

打开汉字库文件

编写显示汉字的函数

使用 lcd_put_chinese 函数


前言

        板子为韦东山老师的imx6ull板,要在LCD上实现字符的显示,要先实现我之前的博客Framebuffer应用编程里的描点函数 lcd_put_pixel ,描点函数是屏幕显示的基础,实现了该函数才能进行本篇博客的操作,本文重点讲解字符的显示原理,实际场景中会调用函数就行了


ASCII字符的点阵显示

        要在 LCD 中显示一个 ASCII 字符,即英文字母这些字符,首先是要找到字符对应的点阵。在 Linux 内核源码中有这个文件:lib\fonts\font_8x16.c,里面以数组形式保存各个字符的点阵,比如:

数组里的数字是如何表示点阵的?以字符 A 为例:

 

        上图左侧有 16 行数值,每行 1 个字节。每一个节对应右侧一行中 8 个像素:像素从右边数起,bit0 对应第 0 个像素,bit1 对应第 1 个像素,……,bit7 对应第 7 个像素。某位的值为 1 时,表示对应的像素要被点亮;值为 0 时表示对应的像素要熄灭。

        所以要显示某个字符时,根据它的 ASCII 码在 fontdata_8x16 数组中找到它的点阵,然后取出这 16 个字节(这里要强调一下16个字节,在后面从数组里取字符的时候就能理解)去描画 16 行像素。
        比如字符 A 的 ASCII 值是 0x41,那么从 fontdata_8x16[0x41*16] 开始取其点阵数据。
        问:为什么要x16?
        答:每一个字符在数组里占的位置都是16个字节,数组的第一个16字节对应ASCII码为0x00的字符,那么我们要找0x41,就要用编码值乘每个字符占的字节数,这样得到的就是字符'A'在数组中的位置。

        核心函数是 void lcd_put_ascii(int x, int y, unsigned char c),它在 LCD 的(x,y)位置处显示字符 c,代码如下图所示:

获取点阵

 对于字符 c,char c,它的点阵获取方法如下:

unsigned char *dots = (unsigned char *)&fontdata_8x16[c*16];

描点

        根据“字符 A 的点阵图”,我们分析核心代码 void lcd_put_ascii(int x, int y, unsigned char c) 是如何利用点阵在 LCD 上显示一 个英文字母。

        因为有十六行,所以首先要有一个循环 16 次的大循环,然后每一行里有 8位,那么在每一个大循环里也需要一个循环 8 次的小循环。小循环里的判断单行的描点情况,如果是 1,就填充白色,如果是 0 就填充黑色,如此一来,就可以显示出黑色底,白色轮廓的英文字母。

for (i = 0; i < 16; i++)
{
    byte = dots[i];
    for (b = 7; b >= 0; b--)
    {
        if (byte & (1<<b))
        {
            /* show */
            /* 之前实现的描点函数 */
            lcd_put_pixel(x+7-b, y+i, 0xffffff); /* 白 */
        }
        else
        {
            /* hide */
            lcd_put_pixel(x+7-b, y+i, 0); /* 黑 */
        }
    }
}

main

        main 函数中首先要打开 LCD 设备,获取 Framebuffer 参数,实现 lcd_put_pixel(描点函数) ;然后调用 lcd_put_ascii(绘制ASCII字符函数) 即可绘制字符,代码如下:

int main(int argc, char **argv)
{
	fd_fb = open("/dev/fb0", O_RDWR);
	if (fd_fb < 0)
	{
		printf("can't open /dev/fb0\n");
		return -1;
	}
	if (ioctl(fd_fb, FBIOGET_VSCREENINFO, &var))
	{
		printf("can't get var\n");
		return -1;
	}

	line_width  = var.xres * var.bits_per_pixel / 8;
	pixel_width = var.bits_per_pixel / 8;
	screen_size = var.xres * var.yres * var.bits_per_pixel / 8;
	fbmem = (unsigned char *)mmap(NULL , screen_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd_fb, 0);
	if (fbmem == (unsigned char *)-1)
	{
		printf("can't mmap\n");
		return -1;
	}

	/* 清屏: 全部设为黑色 */
	memset(fbmem, 0, screen_size);

	lcd_put_ascii(var.xres/2, var.yres/2, 'A'); /*在屏幕中间显示 8*16 的字母 A*/
	
	munmap(fbmem , screen_size);
	close(fd_fb);
	
	return 0;	
}

        源码就是将描点函数和显示字符函数结合起来,但是字符点阵数组需要自己定义,在lib\fonts\font_8x16.c这个文件中找到数组,由于该数组被定义成静态变量,所以自己粘贴过来就好了。

交叉编译后在板子上运行该程序,如果实验成功就能在屏幕中心显示字符 'A' 。


中文字符的点阵显示

指定编码格式

        使用点阵字库时,中文字符的显示原理跟 ASCII 字符是一样的。要注意的地方在于中文的编码:在 C 源文件中它的编码方式是 GB2312(ANSI) 还是 UTF-8(UNICODE)?关于字符编码的知识看这篇博客字符的编码方式,编译出的可执行程序,其中的汉字编码方式是 GB2312 还是 UTF-8?

问:为什么要关心C源文件的编码方式还要关心可执行程序的编码方式?

        我们编写 C 程序时,可以使用 ANSI 编码,或是 UTF-8 编码;在编译程序时,可以使用以下的选项告诉编译器:

        如果不指定“-finput-charset”,GCC 就会默认 C 程序的编码方式为 UTF-8,即使你是以 ANSI 格式保存,也会被当作 UTF-8 来对待。 

        对于编译出来的可执行程序,可以指定它里面的字符是以什么方式编码,可以使用以下的选项编译器:

        如果不指定“-fexec-charset”,GCC 就会默认编译出的可执行程序中字符的编码方式为 UTF-8。 

        如果“-finput-charset”与“-fexec-charset”不一样,编译器会进行格式转换。

汉字区位码

        我们从网上搜到 HZK16 这个文件,它是常用汉字的 16*16 点阵字库。HZK16里每个汉字使用 32 字节来描述(可以类比ASCII字符的点阵数组

        跟 ASCII 字库一样,每个字节中每一位用来表示一个像素,位值等于 1 时表示对应像素被点亮,位值等于 0 时表示对应像素被熄灭。 
        HZK16 中是以 GB2312 编码值来查找点阵的,以“中”字为例,它的编码值是“0xd6 0xd0”,其中的 0xd6 表示“区码”,表示在哪一个区:第“0xd6-0xa1”区(减去0xa1);其中的 0xd0 表示“位码”,表示它是这个区里的哪一个字符:第“0xd0 -0xa1”个。每一个区有 94 个汉字。区位码从 0xa1 而不是从 0 开始,是为了兼容 ASCII 码。
        所以,我们要显示的“中”字,它的 GB2312 编码是 d6d0,它是 HZK16 里第“(0xd6-0xa1)*94+(0xd0-0xa1)”个字符。(看懂这句话就知道后面的代码是怎么查找想要的中文)


汉字点阵显示实验

打开汉字库文件

fd_hzk16 = open("HZK16", O_RDONLY);
if (fd_hzk16 < 0)
{
    printf("can't open HZK16\n");
    return -1;
}
if(fstat(fd_hzk16, &hzk_stat))
{
    printf("can't get fstat\n");
    return -1;
}
hzkmem = (unsigned char *)mmap(NULL , hzk_stat.st_size, PROT_READ, MAP_SHARE
                               D, fd_hzk16, 0);
if (hzkmem == (unsigned char *)-1)
{
    printf("can't mmap for hzk16\n");
    return -1;
}

\bullet open函数打开当前目录的字库文件:HZK16。
\bullet fstat获得文件的状态信息,里面含有文件长度,这在后面的 mmap 中用到。
        fstat 用于获取与文件描述符 fd 关联的文件的状态信息,并将这些信息存储在 buf 指向的struct stat 结构体中。这个结构体包括文件类型、权限、文件大小、设备ID、inode号、硬链接数量等信息。
\bullet 使用 mmap 映射文件,以后就可以像访问内存一样读取文件内容;mmap 的返回结果保存在 hzkmem 中,它将作为字库的基地址

编写显示汉字的函数

        核心函数是 void lcd_put_chinese(int x, int y, unsigned char*str),它在 LCD 的(x,y)位置处显示汉字字符 str,str[0]中保存区码、str[1]中保存位码。代码如下图所示:

代码分解如下:
\bullet 第 4734 行确定该汉字属于哪个区;第 4735 行确实它是该区中哪一个汉字。
\bullet 第 4736 行确实它的字库地址:每个区中有 94 个汉字,每个汉字在字库中占据 32 字节。
\bullet 看之前的汉字点阵排布的示意图,总共有十六行,因此需要一个循环 16 次的大循环(第 4740         行)。
\bullet 考虑到一行有两个字节,在大循环中加入一个 2 次的循环用于区分是哪个字节(第 4741 行)。
\bullet 最后使用第 3 个循环来处理一个字节中的 8 位(第 4744 行)。对于每一位,它等于 1 时对应的像     素被设置为白色,它等于 0 时对应的像素被设置为黑色。需要注意的是根据 x、y、i、j、b 来计     算像素坐标。

使用 lcd_put_chinese 函数

unsigned char str[] = "中";
……
printf("chinese code: %02x %02x\n", str[0], str[1]);
lcd_put_chinese(var.xres/2 + 8, var.yres/2, str);

注意使用上述命令时 show_chinese.c 的编码格式必须是 ANSI(GB2312),否则编译时需要指定“-fexec-charset=GB2312”。

实验成功可以在屏幕看见白色的“中”字。

标签:字符,中文,16,ASCII,像素,var,点阵
From: https://blog.csdn.net/sakabu/article/details/142304655

相关文章

  • 05. 字符串
    一、什么是字符串  字符串用来表示一段文本信息。在Python中,字符串需要使用引号引起来,引号可以是单引号,也可以是双引号,但是不要混的用。相同的引号间不能嵌套使用。s='hello'print(s)print(type(s))s="hello"print(s)print(type(s))  如果双引号和单引号混合......
  • 对中文进行文本分类的常用方法
    一:关键词分类和基于规则的分类关键词分类和基于规则的分类是两种常见的文本分类方法,它们可以应用于中文文本的分类。下面我将详细介绍这两种方法:关键词分类原理:这种方法通过识别文本中出现的特定关键词或短语来确定文本的分类。关键词可以是单个词汇,也可以是短语。应用:在中......
  • [Python学习日记-23] Python v2 和 v3 中的字符编码
    简介    在Python中的字符编码(上)和Python中的字符编码(下)中学习了字符编码的理论知识那么就,我们把目光回到Python当中,下面我们来讲述一下Python2和Python3之间的一些关于编码的差别。Python2vsPython3的编码一、Python2    Python出来时还没有......
  • MySQL篇(高级字符串函数/正则表达式)(持续更新迭代)
    目录讲点一:高级字符串函数一、简介二、常见字符串函数1.CONCAT()2.SUBSTRING()3.LENGTH()4.REPLACE()5.TRIM()6.UPPER()7.LOWER()8.LEFT()9.RIGHT()10.INSTR()11.LENTH(str)讲点二:正则表达式一、简介二、语法1.字符类2.重复次数3.通配符4.......
  • Verilog - ASCII码与16进制相互转换(Task语句,多个ASCII码转换)
    编程思想:1.使用case语句,将Ascii码与Hex对应关系连接;2.使用Task语句将Ascii码转Hex作为一个任务3.调用Task语句,将8bit Ascii码转换为4bitHex数据4.将n个8bitASCII转为n个4bitHex数据进行数据拼接,输出n*4bitHEX数据moduleascii_to_hex(input......
  • 统信服务器操作系统【d版字符系统升级到dde图形化】配置方法
    统信服务器操作系统d版本上由字符系统升级到dde桌面系统的过程文章目录一、准备环境二、功能描述安装步骤1.lightdm安装2.dde安装一、准备环境适用版本:■UOS服务器操作系统d版适用架构:■ARM64、AMD64、MIPS64网络:连接互联网情况下进行二、功能描述......
  • leetcode438.找到字符串中所有字母异位词、leetcode3.无重复字符的最长子串、leetcode
    leetcode438、找到字符串中所有字母异位词给定两个字符串s和p,找到s中所有p的异位词的子串,返回这些子串的起始索引。不考虑答案输出的顺序。异位词指由相同字母重排列形成的字符串(包括相同的字符串)。示例1:输入:s=“cbaebabacd”,p=“abc”输出:[0,6]......
  • Artcam中文版安装包+教程网盘资源下载
    如大家所掌握的,AutodeskArtcam是一款非常专业的立体浮雕设计工具。目前比较常用的有Artcam2008和Artcam2018版本。Artcam独一无二的三维浮雕分层设计工具,拥有不一样的装扮灯光特效工具,让你的浮雕模型制作更加轻松简单,提供用户的工作效率。此外,Artcam强大的三维浮雕设计功能......
  • C++ Primer Plus 第六版中文版(上)
    参考资料:《C++PrimerPlus第六版中文版》笔记作者:Mr.Crocodile欢迎转载文章目录开始学习C++头文件命名规定名称空间`cout`、`cin`函数处理数据简单变量变量命名规则整型运算符`sizeof`和头文件climitsclimits中的符号常量变量初始化整型字面量整型字面量后缀char......
  • [C高手编程] 字符串处理:长度、危险操作、格式化与字符串化
    ......