首页 > 其他分享 >Win32学习

Win32学习

时间:2023-07-15 21:33:28浏览次数:35  
标签:学习 UTF 字节 编码 16 Win32 Unicode

1、导入

关于Win32的错误认知:

(1)已经有malloc()函数了,为什么还要学Win32 API?

(2)学MFC就可以了,为什么要学Win32?

Win32课程包含的内容:

01、字符 09、文件系统

02、多线程 10、内存映射

03、线程同步 11、DLL

04、窗口的本质 12、远程注入

05、Windows消息机制 13、模块隐藏

06、子窗口的使用 14、进程通信

2、字符编码

在我们的Win32 编程中有许多的字符串,有些是ASCII码,有些是Unicode编码,Unicode编码又分为 UTF-8和UTF-16

①原始的ASCII编码:

ASCII ----- Ameriacan Standard Code for Information Interchange

 

②ASCII编码的扩展:GB2312或GB2312-80

image-20230120180543857

将两个 ASCII码拼成一个 GBK(汉字编码)

很大的弊端:难以避免出现乱码(因为各个国家标准不尽相同)

 

③UNICODE编码 <1>什么是UNICODE? 这是一个编码方案,说白了就是一张包含全世界所有文字的一个编码表,只要这个世界上存在的文字符号,统统给你一个唯一的编码: Unicode编码范围是:0-0x10FFFF,可以容纳100多万个符号! <2> UNICODE的问题: Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。(因为Unicode可能是一个字节或者多个字节)

 

④如何存储UNICODE: UTF-16 / UTF-8 是Unicode的实现方式 <1> UTF-16(默认): UTF-16编码以16位无符号整数为单位,注意是16位为一个单位,不表示一个字符就只有16位。(即为一个存储单位是两个字节的大小)这个要看字符的unicode编码处于什么范围而定,有可能是2个字节,也可能是4个字节(当两个字节储存不下,就需要用两个单位的Unicode,而就是因为这种原因导致之后的网络传输,增大了传输的的大小,但是更加直观)现在机器上的unicode编码一般指的就是UTF-16。 <2> UTF-8: Unicode编码(16进制) || UTF-8 字节流(二进制) 000000 - 00007F || 0xxxxxxx 000080 - 0007FF || 110xxxxx 10xxxxxx 000800 - 00FFFF || 1110xxxx 10xxxxxx 10xxxxxx 010000 - 10FFFF || 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

UTF-8字节流中的xxxxx取出来转为16进制即为Unicode编码

UTF-16 的优点是:拆分解析的时候很简单,很直观

UTF-8 的优点是:节约空间,变长字符

在网络传输中,如果英文字母比较多的话,推荐使用UTF-8编码;如果中文汉字比较多的话,推荐使用UTF-16编码。

(以此推出 UTF-32即为所有编码都是四个字节,更加简洁明了,能够直接解析)

<3>BOM(Byte Order Mark 字节顺序标识):

UTF - 8 || EF BB BF

UTF - 16LE(小端存储) || FF FE

UTF - 16BE(大端存储) || FE FF

在文本文件的起始位置存储顺序标识,来表明自己是以什么方式存储的

3、C语言中的宽字符

①字符和字符串在内存中的值 我们观察以下在内存中的值: char szStr[] =“中国”; (vc6会默认以ASCII码的形式进行编码) wchar_t swzStr[]=L“中国”; (vc6这样表示字符串以Unicode格式进行编码)

且字符串结尾会有一个 "/0" 在 ASCII码中占一个字节,而在Unicode中最小的单位是两个字节,所以在Unicode编码中,结尾的 “/0” 占两个字节。

②打印宽字符

#include <locale.h>

setlocale(LC_ALL,"");//使用控制台默认的编码
wchar_t swzStr[] = L"中国";
wprintf(L"%sln",swzStr);

③字符串长度

char szStr]] = "中国";
wchar_t swzStr[] = L"中国";
strlen(szStr); //取得多字节字符串中字符长度,不包含00
wcslen(swzStr); //取得多字节字符串中字符长度,不包含00 00

④常用函数

char wchar_t //多字节字符类型 宽字符类型 printf wprintf //打印到控制台函数 strlen wcslen //获取长度 strcpy wcscpy //字符串复制 strcat wcscat //字符串拼接 strcmp wcscmp //字符串比较 strstr wcsstr //字符串查找

4、Win32 API 中的宽字符

①什么是Win32 API?有哪些?在哪里?

API (application process interface) 应用程序接口

主要是存放在 C:\WINDOWS\system32 下面所有的dll(实际上system32中存储的是 64位的dll,而sysWOW64中存储的是 32位的dll)

几个重要的DLL: <1> Kernel32.dll:最核心的功能模块,比如管理内存、进程和线程相关的函数等。 <2> User32.dll:是Windows用户界面相关应用程序接口,如创建窗口和发送消息等。 <3> GDI32.dll:全称是Graphical Device Interface(图形设备接口),包含用于画图和显示文本的函数。

 

②关于Win32的数据类型:

int MessageBox
{
HWND hWnd, //handle to owner window
LPCTSTR IpText, //text in message box
LPCTSTR IpCaption,  //message box title
UINT uType // message box style
};

如果想要使用Win32 API 只需要包含 windows.h 这个头文件,初学者看到许多不认识的数据类型,可以通过编译器查询发现实际上的不同的数据类型,本质上都是我们所熟知的。

汇编: byte BYTE PBYTE word WORD PWORD dword DWORD PDWORD C语言: char CHAR PCHAR unsigned char UCHAR PUCHAR short SHORT PSHORT unsigned short USHORT PUSHORT int INT PINT unsigned int UINT PUINT

C++语言:

bool BOOL

而给类型起别名,是为了适应不同的平台以及版本的更新,如果出现需要修改,可以直接在宏定义中修改,程序可以不做任何的变动。

④在Win32中使用字符串:

字符类型: CHAR szStr[] = "中国”; //ASCII WCHAR swzStr[] = L"中国”; //Unicode TCHAR stzSr[] = TEXT(“中国”); //能够自动的选择默认的编码格式,更适应跨平台操作 字符串指针: PSTR pszStr = “中国”; PWSTR pwszStr =L“中国”; PTSTR ptszStr = TEXT("中国”);

因为编码格式的不同,Win32 API中的函数都是提供的两份函数,一个是 ASCII 码,一个是Unicode编码的。

在理论上来讲,在Windows 内核当中所有的字符串都是宽字符的,使用Unicode编码格式更好,不需要重复转化,性能更加的好。

⑤第一个Win32 API的使用:

CHAR szTitle[]= "标题";
CHAR szContent]= "欢迎大家来的Win32 API世界!";
MessageBoxA(O,szContent,szTitle,MB_OK);

WCHAR swzTitle[]=L"标题";
WCHAR swzContent[]= L"欢迎大家来的Win32 API世界!";
MessageBoxW(O,swzContent,swzTitle,MB_OK);

TCHAR stzTitle[] = TEXT("标题"); //第三个是自动适配的
TCHAR stzConten[]=TEXT("欢迎大家来的Win32 API世界!");
MessageBox(0,stzContent,stzTitle,MB_OK);

标签:学习,UTF,字节,编码,16,Win32,Unicode
From: https://www.cnblogs.com/cyxyrq-code-loading/p/17556993.html

相关文章

  • Win32 2
    5、进程进程是指运行中的一个程序。(X)①什么是进程?进程提供程序所需的资源,如:数据、代码等等。程序运行起的状态与进程没有关系,举个例子,程序就相当于一个房子,进程就是其中的东西,而使用这些房子中的东西的人称为线程。②进程内存空间的地址划分分区x8632位Windows空指针......
  • Java学习day04: 方法和数组
    我在B站上大学......
  • 太爆了!阿里最新出品2023版JDK源码学习指南,Github三天已万赞
    近后台收到很多粉丝私信,说的是程序员究竟要不要去读源码?当下行情,面试什么样的薪资/岗位才会被问到源码?对此,我的回答是:一定要去读,并且要提到日程上来!据不完全统计,现在市面上不管是初级,中级,还是高级岗,面试的时候都有可能会问到源码中的问题,它已经成为程序员常规必备的一个技术点。如......
  • Ubuntu学习:获取ip地址
    参考:https://www.howtouseubuntu.com/network/ubuntu-command-terminal-find-ip-address-in-ubuntu/当使用命令行在Ubuntu系统上获取IP地址时,以下是几个示例:使用ip命令获取IP地址:$ipaddrshow示例输出:1:lo:<LOOPBACK,UP,LOWER_UP>mtu65536qdiscnoqueuestateUNKN......
  • 学习java第3天
    计算机语言发展史第一代语言机器语言:二进制第二代语言汇编语言应有:逆向工程机器人病毒第三代语言摩尔定律高级语言:c语言c++语言Java语言c#语言·······Java的诞生1972年c诞生贴近硬件,运行快,效率高操作系统,编辑器,数据库1982年c++诞生面向对象,......
  • Django框架学习
    Django框架开发项目的创建1、在终端创建项目打开终端进入某个目录(项目位置)"C:\ProgramFiles\Python37\Scripts\django-admin.exe"startproject项目名称2、在pycharm创建项目3、默认项目的文件介绍app终端创建apppythonmanage.pystartappapp01默认......
  • Perl学习笔记6_进制转换
    目录1.使用sprintf,printf1.1:10进制->非10进制1.2:非10进制->10进制2.使用函数oct,hex2.1非10进制->10进制1.使用sprintf,printf1.1:10进制->非10进制my$num=10;my$s_hex_low=sprintf"%04x",$num;#000a,10进制->16进制小写my$s_hex_high=sprin......
  • Perl学习笔记5_命令行选项
    目录1.Getopt::Long2.Getopt::Std1.Getopt::Long#使用模块useGetopt::Long;#选项初始值my$length=24;my$file="file.dat";my@run=();my$verbose=0;#处理选项#如果参数解析成功,$result=1,#如果参数解析失败(有未知选项或不符合要求),$result=0......
  • 后缀数组学习笔记
    后缀数组是什么后缀数组就是主要处理字符串后缀问题的,它的实现算法主要有两种:倍增法和DC3,复杂度分别是\(O(n\logn)\)和\(O(n)\)。这里由于DC3代码答辩且难以理解,我就只写了倍增法的实现。例题引入P3809【模板】后缀排序题目大意读入一个长度为\(n\)的由大小写英文......
  • 零一PPT学习_P9/P31
    让文字高大上的五种方法一、外边框修饰1、给文字添加边框:插入-插图选项卡-形状(选择形状)2、对形状进行填充:开始-绘图选项卡-形状填充(进行填充色选择)-选择无填充3、对形状轮廓进行选择:开始-绘图选项卡-形状轮廓-选择轮廓颜色、边框粗细步骤图片:(1)选择合适的字体(2)添加边......