汉字编码查询

时间:2024-03-30 17:13:25编辑:奇事君

汉字国际码的意思?

注音 ㄏㄢˋ ㄗˋ ㄍㄨㄛˊ ㄐ一ˋ ㄇㄚˇ 拼音 hàn zì guó jì mǎ 基本释义 ⒈ 指国家标准“资讯交换用汉字编码字符集”。包括国家标准号为gb2312-80的基本集及第一、二、三、四、五辅助集。基本集中对七千四百四十五个图形字元作了二进位制编码表示,其中有六千七百六十三个汉字简化字,六百八十二个一般符号、数字和外文字母等。

汉字的国内码和国际码的区别是什么?

汉字国标码把汉字分成一级汉字、二级汉字两个等级,其中一级汉字有3755个汉字,二级汉字有3008个汉字。《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个。同时,GB2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符。GB2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK及GB18030汉字字符集的出现。汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由象形文字(表形文字)演变成兼表音义的意音文字,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义三者于一体的特性。这一特性在世界文字中是独一无二的,因此它具有独特的魅力。汉字是汉民族几千年文化的瑰宝,也是我们终生的良师益友,每个人的精神家园。汉字往往可以引起我们美妙而大胆的联想,给人美的享受。

汉字编码分为哪四种?

汉字编码主要分为四大类:汉字输入码、汉字交换码、汉字内码和汉字字形码。(1)汉字的外部码汉字的外部码简称外码,又叫输人码,是输人汉字的一组键盘符号。使用不同的输入方法,同一汉字的外部码不同。用户应选用易记忆、操作简单、位码少、重码少和输人速度快的外码。(2)汉字的内部码汉字的内部码又称汉字内码或汉字机内码。机器接收到外码后,要转换成内码进行存储、运算和传送。用二个字节表示汉字的内码。为了和西文符号区分,内码的最高位设为“1”。内码通常用汉字在车库中的物理位置表示,可以是汉字在字库中的序号,也可以是字库中的存储位置。(3)汉字交换码在计算机之间交换信息时,要求传送的汉字代码符合国家规定的交换码标准,即符合GB2312-80信息交换用汉字编码集,又称为国标码。国标码收集了7445个图形字符,其中有6763个汉字和各种符号709个。(4)汉字字形码在显示或打印汉字时,还涉及到字形码,又称输出码。汉字字形是指原来铅字排版汉字的大小和形状,在计算机中指组成汉字的点阵。尽管汉字字形有多种变化,笔画繁简不一,但都是方块字且大小相同,都可以写在同样的方块中。把一个方块看成m行n列矩阵,共有m×n个点,称为汉字点阵。如16×16点阵的汉字,共有256个点。汉字编码汉字编码(Chinese character encoding )是为汉字设计的一种便于输入计算机的代码。由于电子计算机现有的输入键盘与英文打字机键盘完全兼容。因而如何输入非拉丁字母的文字(包括汉字)便成了多年来人们研究的课题。汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输。编码是关键。不解决这个问题,汉字就不能进入计算机。汉字进入计算机的三种途径 分别为:①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。机器自动识别汉字和汉语语音识别,国内外都在研究,虽然取得了不少进展,但由于难度大,预计还要经过相当一段时间才能得到解决。在现阶段,比较现实的就是通过汉字编码方法使汉字进入计算机。

汉字编码的过程是什么?

计算机处理汉字信息的前提条件是对每个汉字进行编码,这些编码统称为汉字编码。汉字信息在系统内传送的过程就是汉字编码转换的过程。1、汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。2、国标码:所有汉字编码都应该遵循这一标准,汉字机内码的编码、汉字字库的设计、汉字输入码的转换、输出设备的汉字地址码等,都以此标准为基础。GB 2312—80就是国标码。该码规定:一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。3、区位码:将GB 2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB 2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。4、区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。5、GB码(国标码):由于区位码是十进制编码,而计算机实际使用的过程中用的是二进制编码,所以在实际使用的过程中,计算机内码使用的是国标码。扩展资料:ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是现今最通用的系统,并等同于国际标准ISO/IEC 646。区位码与国标码的转换关系 :区位码先转换成十六进制数表示 ,(区位码的十六进制表示)+2020H=国标码。 区号为20,位号为83, 将区位号2083转换为十六进制表示为1453H ,1453H+2020H=3473H,得到国标码。参考资料来源:百度百科-国家标准代码参考资料来源:百度百科-区位码

上一篇:微信应用

下一篇:容器类别