区位码转国标码与区位码和内码

每个汉字有个二进制编码,叫汉字国标码。
在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。  
每个汉字使用2个字节。
共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,原则上,两个字节可以表示 256×256=65536 种不同的符号,作为汉字编码表示的基础是可行的。但考虑到汉字编码与其它国际通用编码,如ASCII 西文字符编码的关系,我国国家标准局采用了加以修正的两字节汉字编码方案,只用了两个字节的低7位。这个方案可以容纳 128×128=16384 种不同的汉字,但为了与标准ASCII码兼容,每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码(128-32-1-1=94,32:控制字符;1:码值为32的空格;1:码值为127,)。所以每个字节只能有94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。
国家标准局1980年颁布的《信息交换用汉字编码字符集&基本集》(代号为GB2312 80)将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而
GB2312最多能表示6763个汉字。
国家标准将汉字和图形符号排列在一个94行94列的二维代码表中,;每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,;如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。   国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:“保”字的国标码为3123H,它是经过下面的转换得到的:1703D-&1103H-&+20H-&3123H。区位码只是94X94矩阵的下标号
注:加20H是因为上段红色内容,因为ASCII码编码中分控制信号编码和有型字符编码,前32个是控制码,再加两个特殊码值
国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保”字,国标码为31H和23H,而西文字符“1”和“#”的ASCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字,还是两个西文字符“1”;和“#”于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,;汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为B,后字节为B,高位改1为B和B
即为B1A3H,因此,汉字的机内码就是B1A3H。
键盘是当前微机的主要输入设备,;输入码就是使用英文键盘输入汉字时的编码。目前,我国已推出的输入码有数百种,但用户使用较多的约为十几种,按输入码编码的主要依据,大体可分为顺序码、音码、形码、音形码四类,如“保”字,用全拼,输入码为码为“BAO”,用区位码,输入码为“1703”,用五笔字型则为“WKS”。
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:44206次
排名:千里之外
原创:16篇
转载:19篇
(1)(1)(5)(3)(2)(2)(13)(2)(1)(1)(2)(2)汉字的区位码 国际码 和机内码的关系和转换方法是什么?
汉字的区位码 国际码 和机内码的关系和转换方法是什么?
09-08-15 & 发布
区位码是10进制的,而国标码和机内码是16进制的,首先要把2083转化成16进制。    就是把20除16取余得到14 如同10进制转化2进制    同样把83除二取余    最后把得到的数加2020是国标码  再加上8080是机内码
请登录后再发表评论!机构级别:江西普通会员
信用等级:
学校评价()
学校被点评:0 次
未通过身份证认证
未通过办学许可认证
学校浏览人次:
加盟时间:
ASCII码 、输入码、区位码、国标码与机内码的区别
ASCII码 、输入码、区位码、国标码与机内码的区别
  ASCII码、输入码、区位码、国标码与机内码,这些名词对大家来说,可能都不陌生,但其中的联系与区别,可能就不那么清楚了。
ASCII码(Standard Code for Information Interchange)由美国国家标准协会(American National
Standards Institute)1967年发布,即美国标准信息交换码,
ASCII是7位编码,当时由于费用的原因排除了8位的编码方案(鉴于当时每位的储存空间成本昂贵)。当时的ASCII字符码有26个小写字母、26个大写字母、10个数字、32个符号、33个句柄和一个空格,总共128个字符码。编码转换成十进制规则如下:
  0~31及127(共33个)是控制字符或通讯专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为
8、9、10 和 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。 32~126
(共95个)是字符(32sp是空格),其中48~57为0到9十个阿拉伯数字; 65~90为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7为1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7为1。
通常我们应记得ACSII码从小到大的大致这样排列顺序:
  控制字符 & 阿拉伯数字 & 大写英文字母 & 小写英文字母
  上面介绍了英文字符编码ASCII码。现来看看汉字编码情况,每个汉字有个二进制编码,叫汉字国标码。在我国汉字编码标准GB2312-80中有6763个常用汉字规定了二进制编码。每个汉字使用2个字节。GB2312-80
GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计
3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而
GB2312最多能表示6763个汉字。
  下面我们再来看看其它编码。我们知道,键盘是当前PC机的主要输入设备,输入码就是使用英文键盘输入汉字时的编码。目前,我国已推出的输入码有数百种,但用户使用较多的约为十几种,按输入码编码的主要依据,大体可分为顺序码、音码、形码、音形码四类,如&保&字,用全拼,输入码为&BAO&,用区位码,输入码为&1703&,用五笔字型则为&WKS&。
计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集&&基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码规则为:汉字用两个字节表示,每个字节用七位码(高位为0),国家标准将汉字和图形符号排列在一个94行94列的二维代码表中,每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,如&保&字在二维代码表中处于17区第3位,区位码即为&1703
国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,这样就得了一个与国标码有一个相对位置差的代码,再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:&保&字的国标码为3123H,它是经过下面的转换得到的:1703D-&1103H-&+20H-&3123H。
国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如&保&?字,国标码为31H和23H,而西文字符&1&和&#&的ASCII也为31H和23H,现假如内存中有两个字节为31H和23H,这到底是一个汉字?,还是两个西文字符&1&和&#&?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,&保&字的国标码为3123H,前字节为B,后字节为B,高位改1为B和B
即为B1A3H,因此,汉字的机内码就是B1A3H。显然,汉字机内码的每个字节都大于128,这就解决了与西文字符的ASCII码冲突的问题。
如上所述,汉字输入码、区位码、国标码与机内码都是汉字的编码形式,它们之间有着千丝万缕的联系,但其间的区别也是不容忽视的。
报名咨询:电话 o79l-88l57848& o791-l8 唐老师& lo庹(tuo)老师 l8 唐老师咨询QQ ① l58l23oo46&& ② l5l8432388 ③ ll6o569l62区位码怎么转成国标码呢~~??_c++吧_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:148,774贴子:
区位码怎么转成国标码呢~~??收藏
区位码2858H····国标码是什么?
+32再+128似乎前一个是国标码后一个是机内码
网上说是区码位码分别转成16进制,然后在加20H,··那后那个转化成16进制后就不知道怎么加20H了···
登录百度帐号我的游戏推荐游戏
后查看最近玩过的游戏
为兴趣而生,贴吧更懂你。或输入码、国标码、机内码、字型码_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
文档贡献者贡献于
评价文档:
71页免费2页免费16页免费5页免费1页7下载券2页1下载券2页免费3页免费2页免费3页1下载券
喜欢此文档的还喜欢2页免费2页免费16页免费27页1下载券5页免费
输入码、国标码、机内码、字型码|简​要​介​绍​资​料​的​主​要​内​容​,​以​获​得​更​多​的​关​注
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
大小:7.62KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢

我要回帖

更多关于 区位码国标码机内码 的文章

 

随机推荐