欢迎来到入门教程网!

C语言

当前位置:主页 > 软件编程 > C语言 >

C语言中判断一个char*是不是utf8编码

来源:本站原创|时间:2020-01-10|栏目:C语言|点击:

C语言中判断一个char*是不是utf8编码

里我修改了一下, 纯ASCII编码的字符串也返回true, 因为UTF8和ASCII兼容

实例代码:

int utf8_check(const char* str, size_t length) { 
  size_t i; 
  int nBytes; 
  unsigned char chr; 
 
  i = 0; 
  nBytes = 0; 
  while (i < length) { 
    chr = *(str + i); 
 
    if (nBytes == 0) { //计算字节数 
      if ((chr & 0x80) != 0) { 
        while ((chr & 0x80) != 0) { 
          chr <<= 1; 
          nBytes++; 
        } 
        if ((nBytes < 2) || (nBytes > 6)) { 
          return 0; //第一个字节最少为110x xxxx 
        } 
        nBytes--; //减去自身占的一个字节 
      } 
    } else { //多字节除了第一个字节外剩下的字节 
      if ((chr & 0xC0) != 0x80) { 
        return 0; //剩下的字节都是10xx xxxx的形式 
      } 
      nBytes--; 
    } 
    i++; 
  } 
  return (nBytes == 0); 
} 

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

上一篇:2~62位任意进制转换方法(c++)

栏    目:C语言

下一篇:c++10进制转换为任意2-16进制数字的实例

本文标题:C语言中判断一个char*是不是utf8编码

本文地址:https://www.xiuzhanwang.com/a1/Cyuyan/1428.html

网页制作CMS教程网络编程软件编程脚本语言数据库服务器

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

联系QQ:835971066 | 邮箱:835971066#qq.com(#换成@)

Copyright © 2002-2020 脚本教程网 版权所有