TC官方合作论坛

标题: 汉字编码范围 [打印本页]

作者: Abin    时间: 2014-1-4 18:09
标题: 汉字编码范围

ANSI:汉字区的内码范围高字节从B0-F7,低字节从A1-FE


Unicode:汉字的Unicode编码范围为4E00-9FA5  、 F900-FA2D,如果不在这个范围内就不是汉字了.


GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883个。


Unicode 汉字内码的汉字区为4E00-9FA5, 共有20902个汉字


BIG5 是台湾计算机界实行的汉字编码字符集。它包含了 420 个图形符号和 13070 个汉字(不包含简化汉字)。编码范围是0x8140-0xFE7E、0x81A1-0xFEFE,其中 0xA140-0xA17E、0xA1A1-0xA1FE是图形符号区,0xA440-0xF97E、0xA4A1-0xF9FE 是汉字区。


在TC里,我们只要考虑汉字的Unicode码就可以了!以下再附上各国文字编码范围查询链接,希望对大家有用。

各国文字Unicode编码范围:http://www.doc88.com/p-801578373970.html
对编码使用不熟悉的可以观看下面的视频:
[进阶实例篇] 第一课 百变字符串
http://bbs.tyuyan.com/forum.php?mod=viewthread&tid=37033&fromuid=16




作者: 菜鸟狙丶    时间: 2014-1-4 18:14
本帖最后由 菜鸟狙丶 于 2014-1-4 18:17 编辑

太有用了!太有用了!
[attach]13701[/attach]这张图看上去很眼熟啊。

作者: rainshine    时间: 2014-1-4 18:41
支持一个,好东西~
作者: 夏末    时间: 2014-1-4 20:36
收藏~~
作者: whoyeyang    时间: 2014-1-5 13:16
收藏~
作者: cylhb    时间: 2014-1-5 23:46
各种随机党有福了
作者: 无啦啦    时间: 2015-2-15 20:14
cccccccccccccccccc




欢迎光临 TC官方合作论坛 (http://bbs.52tc.co/) Powered by Discuz! X3.1