首页 > 编程语言 >C++字符转码(GBK和UTF8)

C++字符转码(GBK和UTF8)

时间:2023-06-01 19:12:54浏览次数:47  
标签:CP UTF8 GBK len nLen C++ pSrc NULL

std::string GB2312ToUtf8(const char* pSrc, int nLen)
{
    string strOut;
    if (pSrc && nLen > 0)
    {
        // ANSI -> UNICODE
        int len = MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)pSrc, nLen, NULL, 0);
        WCHAR* wszUtf8 = new WCHAR[len + 1];
        MultiByteToWideChar(CP_ACP, 0, (LPCTSTR)pSrc, nLen, wszUtf8, len);

        // UNICODE -> UTF-8
        len = WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, NULL, 0, NULL, NULL);
        char* szUtf8 = new char[len + 1];
        WideCharToMultiByte(CP_UTF8, 0, wszUtf8, -1, szUtf8, len, NULL, NULL);

        strOut = szUtf8;
        delete[] szUtf8;
        delete[] wszUtf8;
    }
    return strOut;
}

std::string Utf8ToGB2312(const char* pSrc, int nLen)
{
    string strOut;
    if (pSrc && nLen > 0)
    {
        // UTF8 -> UNICODE
        int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)pSrc, nLen, NULL, 0);
        unsigned short* wszGBK = new unsigned short[len + 1];
        memset(wszGBK, 0, len * 2 + 2);
        MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)pSrc, nLen, (LPWSTR)wszGBK, len);

        // UNICODE -> GBK
        len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
        char* szGBK = new char[len + 1];
        memset(szGBK, 0, len + 1);
        WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);
        strOut = szGBK;

        delete[]szGBK;
        delete[]wszGBK;
    }
    return strOut;
}

标签:CP,UTF8,GBK,len,nLen,C++,pSrc,NULL
From: https://www.cnblogs.com/arbboter/p/17449950.html

相关文章

  • C++面试八股文:C++中指针、引用、解引用和取地址有什么不同?
    某日小二参加XXX科技公司的C++工程师开发岗位2面:面试官:指针、引用、解引用和取地址是C++中的重要概念,请问它们在语法和语义上有所不同?小二:指针是一个变量,它存储了一个内存地址。小二:引用是一个别名,它允许使用一个变量的多个名称来访问同一个内存位置。小二:解引用是指使用*运......
  • 深入探索C++对象模型(十一)执行期语义学(临时对象)
    关于临时对象的几条准则。1. 在某些情况下,编译器可以产生必要的,或者可以带来方便的临时对象,具体行为由编译器来定义。例如,对于如下操作:1.Ta,b;2.Tc=a+b;//Toperator+(constT&,constT&)a.编译器会产生一个临时对象,放置a+b的结果,然后使用T的拷贝构造函数,把临时......
  • C++温故补缺(二十):杂项补充1
    杂记1布尔型c语言中表示布尔型一般用0/1,或者flag,c++把布尔型内置了,布尔型的变量只有true和false两个值和0/1的关系:true和false不是0/1,c++编译器会把非0处理成true,把0处理成false宽字符型char型只有一个字节的长度,如果要在c中表示汉字,则需要使用字符串数组c++添加......
  • C++中 字符串的常见操作
    字符串分割在一些比较流行的语言中,字符串分割是一个比较重要的方法,不论是在python,java这样的系统级语言还是js这样的前端脚本都会在用到字符串的分割,然而在c++中却没有这样的方法用来调用。但是在boost中却提供分割方法。使用vector实现下面是用vector实现的一个简单的split......
  • C++ 中的运算符优先级
     运算符的优先级确定表达式中项的组合。这会影响到一个表达式如何计算。某些运算符比其他运算符有更高的优先级,例如,乘除运算符具有比加减运算符更高的优先级。例如x=7+3*2,在这里,x被赋值为13,而不是20,因为运算符*具有比+更高的优先级,所以首先计算乘法3*2,然后再加......
  • C++ 循环
     有的时候,可能需要多次执行同一块代码。一般情况下,语句是顺序执行的:函数中的第一个语句先执行,接着是第二个语句,依此类推。编程语言提供了允许更为复杂的执行路径的多种控制结构。循环语句允许我们多次执行一个语句或语句组,下面是大多数编程语言中循环语句的一般形式:https:/......
  • C++中的map用法学习
    map是STL的一个关联容器,它提供一对一的hash。第一个可以称为关键字(key),每个关键字只能在map中出现一次;第二个可能称为该关键字的值(value);map以模板(泛型)方式实现,可以存储任意类型的数据,包括使用者自定义的数据类型。Map主要用于资料一对一映射(one-to-one)的情況,map內部的......
  • CLion 2023 mac(C/C++集成开发环境)功能介绍
    CLion2023mac是一个C++集成开发环境,有一些C++常用的库和方法,例如:ClintListMotorolaMSM755的一个简单的应用程序。可以使用ClintSets将MotorolaMSM755转换为C+,从而降低复杂性。有一个可用于CLinux和所有主流操作系统的命令行界面。可用于任何C++编程语言和函数(包括Ruby),包括......
  • Dlib——C++机器学习库,有传统机器学习的,也有深度学习的
    Dlib的目标用户并没有Hyperopt-sklearn细分,它是一个基于C++语言的通用的机器学习和数据分析库。值得一提的是,虽然Dlib的确是由C++实现的,但它却提供了针对Python语言的API。Dlib的官网称:Dlib是一个现代的C++工具包,实现了大量机器学习的相关算法和工具,可用于在C++环境下创建复杂的软......
  • C++ STL string初探:string类剖析
    一、string的基本概念1.1string是管理字符数组的类常见的初始化使用场景:无参构造和拷贝构造strings1;//无参构造strings2("helloworld");//有参构造对string类的总结:string是表示字符串的字符串类该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操......