C++使用WideCharToMultiByte函数生成UTF-8编码文件的方法
WideCharToMultiByte函数映射一个unicode字符串到一个多字节字符串。
函数原型:
int WideCharToMultiByte
- UINT CodePage, //指定执行转换的代码页
- DWORD dwFlags, //允许你进行额外的控制,它会影响使用了读音符号(比如重音)的字符
- LPCWSTR lpWideCharStr, //指定要转换为宽字节字符串的缓冲区
- int cchWideChar, //指定由参数lpWideCharStr指向的缓冲区的字符个数
- LPSTR lpMultiByteStr, //指向接收被转换字符串的缓冲区
- int cchMultiByte, //指定由参数lpMultiByteStr指向的缓冲区最大值
- LPCSTR lpDefaultChar, //遇到一个不能转换的宽字符,函数便会使用pDefaultChar参数指向的字符
- LPBOOL pfUsedDefaultChar //至少有一个字符不能转换为其多字节形式,函数就会把这个变量设为TRUE
参数:
CodePage:指定执行转换的代码页,这个参数可以为系统已安装或有效的任何代码页所给定的值。你也可以指定其为下面的任意一值:
- CP_ACP:ANSI代码页;CP_MACCP:Macintosh代码页;CP_OEMCP:OEM代码页;
- CP_SYMBOL:符号代码页(42);CP_THREAD_ACP:当前线程ANSI代码页;
- CP_UTF7:使用UTF-7转换;CP_UTF8:使用UTF-8转换。
相关变量
- lpWideCharStr:指向将被转换的unicode字符串。
- cchWideChar:指定由参数lpWideCharStr指向的缓冲区的字符个数。如果这个值为-1,字符串将被设定为以NULL为结束符的字符串,并且自动计算长度。
- lpMultiByteStr:指向接收被转换字符串的缓冲区。
- cchMultiByte:指定由参数lpMultiByteStr指向的缓冲区最大值(用字节来计量)。若此值为零,函数返回lpMultiByteStr指向的目标缓冲区所必需的字节数,在这种情况下,lpMultiByteStr参数通常为NULL。
- lpDefaultChar和pfUsedDefaultChar:只有当WideCharToMultiByte函数遇到一个宽字节字符,而该字符在uCodePage参数标识的代码页中并没有它的表示法时,WideCharToMultiByte函数才使用这两个参数。如果宽字节字符不能被转换,该函数便使用lpDefaultChar参数指向的字符。如果该参数是NULL(这是大多数情况下的参数值),那么该函数使用系统的默认字符。该默认字符通常是个问号。这对于文件名来说是危险的,因为问号是个通配符。pfUsedDefaultChar参数指向一个布尔变量,如果Unicode字符串中至少有一个字符不能转换成等价多字节字符,那么函数就将该变量置为TRUE。如果所有字符均被成功地转换,那么该函数就将该变量置为FALSE。当函数返回以便检查宽字节字符串是否被成功地转换后,可以测试该变量。
- 返回值:如果函数运行成功,并且cchMultiByte不为零,返回值是由 lpMultiByteStr指向的缓冲区中写入的字节数;如果函数运行成功,并且cchMultiByte为零,返回值是接收到待转换字符串的缓冲区所必需的字节数。如果函数运行失败,返回值为零。若想获得更多错误信息,请调用GetLastError函数。它可以返回下面所列错误代码:
- ERROR_INSUFFICIENT_BJFFER;ERROR_INVALID_FLAGS;
- ERROR_INVALID_PARAMETER;ERROR_NO_UNICODE_TRANSLATION。
- 注意:指针lpMultiByteStr和lpWideCharStr必须不一样。如果一样,函数将失败,GetLastError将返回ERROR_INVALID_PARAMETER的值。
- Windows CE:不支持参数CodePage中的CP_UTF7和CP_UTF8的值,以及参数dwFlags中的WC_NO_BEST_FIT_CHARS值。
生成utf-8编码的文件
步骤如下:
1. 首先要写一个BOM头。UTF-8文件一般是要这个头的,当然也可以没有。
2. 将要生成的字符先使用宽字符格式生成,然后调用WideCharToMultiByte转为utf-8编码,写入文件。
例子如下:
FILE * pFile = fopen("d://a.txt", "w"); char szBOM[4] = {(char)0xEF, (char)0xBB, (char)0xBF, 0}; fprintf(pFile, "%s", szBOM); wchar_t chNum[11] = L"零壹贰叁肆伍陆柒捌玖"; wchar_t chNum2[10] = L"亿千百拾万千百拾个"; char sz[10] = "112304823"; wchar_t result[32] = L""; int offset = 0; for(int i = 0; i < strlen(sz); ++ i) { char c = sz[i]; wchar_t w1 = chNum[ c - '0']; wchar_t w2 = chNum2[i]; swprintf(result + offset, L"%c%c", w1, w2); offset += 2; } char szChar[64] = ""; ::WideCharToMultiByte(CP_UTF8, 0, result, wcslen(result), szChar, 64, 0, 0); fprintf(pFile, "%s", szChar); fclose(pFile);
注意的是,当使用wchar_t而不再是char时,所有的字符串操作函数都需要时w系列的,例如wcslen、swprintf
上一篇:使用C语言的fork()函数在Linux中创建进程的实例讲解
栏 目:C语言
下一篇:浅谈c和c++的某些小区别
本文标题:C++使用WideCharToMultiByte函数生成UTF-8编码文件的方法
本文地址:https://www.xiuzhanwang.com/a1/Cyuyan/2210.html
您可能感兴趣的文章
- 04-02func函数+在C语言 func函数在c语言中
- 04-02c语言没有round函数 round c语言
- 01-10使用OpenGL实现3D立体显示的程序代码
- 01-10深入理解C++中常见的关键字含义
- 01-10使用C++实现全排列算法的方法详解
- 01-10深入Main函数中的参数argc,argv的使用详解
- 01-10c++中inline的用法分析
- 01-10用C++实现DBSCAN聚类算法
- 01-10全排列算法的非递归实现与递归实现的方法(C++)
- 01-10C++大数模板(推荐)
阅读排行
本栏相关
- 04-02c语言函数调用后清空内存 c语言调用
- 04-02func函数+在C语言 func函数在c语言中
- 04-02c语言的正则匹配函数 c语言正则表达
- 04-02c语言用函数写分段 用c语言表示分段
- 04-02c语言中对数函数的表达式 c语言中对
- 04-02c语言编写函数冒泡排序 c语言冒泡排
- 04-02c语言没有round函数 round c语言
- 04-02c语言分段函数怎么求 用c语言求分段
- 04-02C语言中怎么打出三角函数 c语言中怎
- 04-02c语言调用函数求fibo C语言调用函数求
随机阅读
- 08-05DEDE织梦data目录下的sessions文件夹有什
- 01-11ajax实现页面的局部加载
- 01-10使用C语言求解扑克牌的顺子及n个骰子
- 01-10C#中split用法实例总结
- 08-05dedecms(织梦)副栏目数量限制代码修改
- 04-02jquery与jsp,用jquery
- 01-11Mac OSX 打开原生自带读写NTFS功能(图文
- 01-10delphi制作wav文件的方法
- 01-10SublimeText编译C开发环境设置
- 08-05织梦dedecms什么时候用栏目交叉功能?