ASCII码、GB2312、Big5、UTF-8、unicode编码转换知识
如果您发现本文排版有问题,可以先点击下面的链接切换至老版进行查看!!!
ASCII码、GB2312、Big5、UTF-8、unicode编码转换知识
下面,还是以汉字“严”为例,演示如何实现UTF-8编码。 已知“严”的unicode是4E25(100111000100101),根据上表,可以发现4E25处在第三行的范围内(0000 0800-0000 FFFF),因此“严”的UTF-8编码需要三个字节,即格式是“1110xxxx 10xxxxxx 10xxxxxx”。然后,从“严”的最后一个二进制位开始,依次从后向前填入格式中的x,多出的位补0。这样就得到了,“严”的UTF-8编码是 “11100100 10111000 10100101”,转换成十六进制就是E4B8A5。 6. Unicode与UTF-8之间的转换 通过上一节的例子,可以看到“严”的Unicode码是4E25,UTF-8编码是E4B8A5,两者是不一样的。它们之间的转换可以通过程序实现。 在Windows平台下,有一个最简单的转化方法,就是使用内置的记事本小程序Notepad.exe。打开文件后,点击“文件”菜单中的“另存为”命令,会跳出一个对话框,在最底部有一个“编码”的下拉条。Unicode符号范围 | UTF-8编码方式 (十六进制) | (二进制) --------------------+--------------------------------------------- 0000 0000-0000 007F | 0xxxxxxx 0000 0080-0000 07FF | 110xxxxx 10xxxxxx 0000 0800-0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx 0001 0000-0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

- 分类:
- Devops
更新时间:
相关文章
wordpress的Warning: Cannot modify header information – headers already sent by解决方法
wordpress有时候会提示类似 Warning: Cannot modify header information – headers already sent by (output st 阅读更多…
用ASP实现UTF8、GB2312、二进制、十进制代码、十六进制编码转换
UTF转GB---将UTF8编码文字转换为GB编码文字 function UTF2GB(UTFStr) for Dig=1 to len(UTFStr) '如果UTF8编码文字以%开头则进行 阅读更多…
Java获取某个文件的编码
我们可能会经常打开某个文档,发现里面有乱码,有时候我们可能会试着把它另存为其它编码的文件以希望能恢复它的原来状况。如果很幸运的话,很快就能搞定,但是有时候我们还是希望知道这个乱码文件当前是什么编码。 阅读更多…