搜索内容

您当前的位置:首页 > 智能数码 > 正文

汉字区位码是几进制(汉字区位码二进制怎么算)

智能数码
日期·2024-10-10 09:02

汉字区位码分别用十进制的区号和位号范围是区位码的区号是1-94,位号是1-94。一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。在汉字的区位码中,高两位为区号,低两位为位号。

汉字区位码是几进制(汉字区位码二进制怎么算)汉字区位码是几进制(汉字区位码二进制怎么算)


在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字 。其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。

简介

所谓汉字编码,就是采用一种科学可行的办法,为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理。在此介绍的是《国家标准信息交换汉字编码》。

这种编码经过加工整理一律以汉语拼音的字母为序,音节相同的字以使用频率为序,其查找方法与一般汉语字典的汉字拼音音节索引查找法相同。

就是录入汉字时的对应关系,字库。

国家标准

为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了第一个汉字编码的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。

所有的国标汉字与符号组成一个94×94的矩阵。在此方阵中,每一行称为一个"区",每一列称为一个"位",因此,这个方阵实际上组成了一个有94个区(区号分别为1到94)、每个区内有94个位(位号分别为1到94)的汉字字符集。一个汉字所在的区号和位号简单地组合在一起就构成了该汉字的"区位码"。

在汉字的区位码中,高两位为区号,低两位为位号。在区位码中,01-09区为682个特殊字符,16~87区为汉字区,包含6763个汉字。其中16-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。

所以,当我们需要n个任意汉字时,我们不必建一个全部汉字表,而是利用区位码实现常用汉字的提取。

国际码=区位码+2020H,汉字机内码=国际码+8080H。首先将区位码转换成国际码,然后将国际码加上8080H,即得机内码。

汉字区位码在上世纪七八十年代起到了很大的作用,解决了六千多个汉字在DOS操作系统的汉字输入问题。现在,特别是2013年8月19日国务院颁布实施8105个通用规范汉字之后,便不再被人们使用。

扩展资料:

为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了第一个汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。

参考资料来源:

机内码、国际码是十六进制的,区位码是十进制的。

一般换算全部用十六进制,不过特别注意:区位码从十进制转换为十六进制是两位两位分别转换的。

国际码=区位码(十六进制)+2020H

机内码=国际码+8080H

如:某汉字的区位码是2534。则25D=19H,34D=22H

国际码=1922H+2020H=3952H

机内码=3952H+8080H=B9D2H

区位码是几进制的

区位码是一个四位的十进制数。每个国标码或区位码都对应着一个唯一的汉字或符号,区位码的前两位叫做区码,后两位叫做位码。国标码与区位码之间的关系。

在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列),在区位码汉字输入方法中,汉字编码无重码。

版权声明:图片、内容均来源于互联网 如有侵权联系k19126499204@163.com 删除