资源简介
utf8编码解码的纯C++代码
仅在Visual Studio 2005 /2010 调试通过
将utf8字节流解码为宽字符(wchar_t)时,结果的正确性依赖于sizeof(wchar_t)
具体来说就是wchar_t是否有足够的空间容纳 UNICODE码

代码片段和文件信息
#include “Coding.h“
using namespace Text;
#pragma warning ( disable: 4333)
namespace _utf8_
{
void encode(const wchar_t * strunsigned long strlen unsigned char * buffer )
{
while( strlen > 0 )
{
if( *str < 0x80 ) //0xxxxxxx
{
*buffer =(unsigned char)*str;
buffer++;
}
else if( *str<0x0800) //双字节模板 110xxxxx 10xxxxxx
{
*buffer = ( *str >> 6 | 0xc0 );
buffer[1] = ( *str & 0x3f | 0x80 );
buffer+=2;
}
else if( *str < 0x010000 ) //三字节模板 1110xxxx 10xxxxxx 10xxxxxx
{
*buffer = ( *str >> 12 | 0xe0);
buffer[1] = ( *str >> 6 & 0x3f | 0x80);
buffer[2] = ( *str & 0x3f | 0x80);
buffer+=3;
}
else if ( *str < 0x200000 ) //四字节模板 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
{
*buffer = (*str >> 18 | 0xf0);
buffer[1] = (*str >> 12 & 0x3f | 0x80);
buffer[2] = (*str >> 6 & 0x3f | 0x80);
buffer[3] = (*str & 0x3f | 0x80);
buffer+=4;
}
else if ( *str < 0x04000000) //五字节模板 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
{
*buffer = ( *str>>24 | 0xf8 );
buffer[1] = ( *str>>18 & 0x3f | 0x80 );
buffer[2] = ( *str>>12 & 0x3f | 0x80 );
buffer[3] = ( *str>>6 & 0x3f | 0x80 );
buffer[4] = ( *str &0x3f | 0x80 );
buffer+=5;
}
else //六字节模板 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
{
*buffer = ( *str>>30 | 0xfc );
buffer[1] = ( *str>>24 & 0x3f | 0x80 );
buffer[2] = ( *str>>18 & 0x3f | 0x80 );
buffer[3] = ( *str>>12 & 0x3f | 0x80 );
buffer[4] = ( *str>>6 & 0x3f | 0x80 );
buffer[5] = ( *str &0x3f | 0x80 );
buffer+=6;
}
strlen -- ;
str++;
}
}
bool count_force(const unsigned char * bytes unsigned long bytes_lenunsigned long &count)
{
if( bytes == 0 )
{
return false;
}
unsigned long tmpcount=0;
while( bytes_len > 0 )
{
if( *bytes < 0x80 ) //0xxxxxxx
{
bytes++;
bytes_len --;
}
else if ( ((*bytes) >> 5) ==6 ) //110xxxxx 10xxxxxx
{
if(bytes_len >1 && bytes[1]>>6 == 2 )
{
bytes+=2;
bytes_len -=2;
}
}
else if ( ((*bytes) >> 4) == 14 ) //1110xxxx 10xxxxxx 10xxxxxx
{
if( bytes_len >2 && bytes[1]>>6==2 && bytes[2]>>6==2 )
{
bytes+=3;
bytes_len -=3;
}
}
else if ( ((*bytes) >> 3) == 30 ) //11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
{
if( bytes_len >3 && bytes[1]>>6==2 && bytes[2]>>6==2 && bytes[3]>>6==2 )
{
bytes+=4;
bytes_len -=4;
}
}
else if ( ((*bytes) >> 2) == 62 ) //111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
{
if( bytes_len >4 && bytes[1]>>6==2 && bytes[2]>>6==2 && bytes[3]>>6==2 && bytes[4]>>6==2 )
{
bytes+=5;
bytes_len -=5;
}
}
else if ( ((*bytes) >> 1) == 126 ) //1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
{
if( bytes_len >5 && bytes[1]>>6==2
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 8984 2013-07-10 17:20 Coding.cpp
文件 2487 2013-07-10 18:20 Coding.h
----------- --------- ---------- ----- ----
11471 2
- 上一篇:51单片机-光立方-C语言
- 下一篇:如何在VC++ 6.0创建RTX项目
相关资源
- 国际象棋的qt源代码
- C++中头文件与源文件的作用详解
- C++多线程网络编程Socket
- VC++ 多线程文件读写操作
- 利用C++哈希表的方法实现电话号码查
- 移木块游戏,可以自编自玩,vc6.0编写
- C++纯文字DOS超小RPG游戏
- VC++MFC小游戏实例教程(实例)+MFC类库
- 连铸温度场计算程序(C++)
- 6自由度机器人运动学正反解C++程序
- Em算法(使用C++编写)
- libstdc++-4.4.7-4.el6.i686.rpm
- VC++实现CMD命令执行与获得返回信息
- 白话C++(全)
- C++标准库第1、2
- 大数类c++大数类
- C++语言编写串口调试助手
- c++素数筛选法
- C++ mqtt 用法
- 商品库存管理系统 C++ MFC
- c++ 多功能计算器
- C++17 In Detail
- 嵌入式QtC++编程课件
- 颜色识别形状识别STM103嵌入式代码
- c++ 邮件多附件群发
- c++ 透明代理(hookproxy)
- mfc 调用redis
- FTP客户端源码(c++)
- c++ 画图(14Qt-XPS)
- c++多边形交并差运算
评论
共有 条评论