汉字的内码是什么?(内码和外码分别是什么啊?)

大家好,今天小编关注到一个比较有意思的话题,就是关于内码的问题,于是小编就整理了3个相关介绍内码的解答,让我们一起看看吧。

汉字的内码是什么?(内码和外码分别是什么啊?)

文章目录:

  1. 汉字的内码是什么?
  2. 内码和外码分别是什么啊?
  3. 内码是什么

一、汉字的内码是什么?

机内码。

汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。

机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。

扩展资料:

因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。

汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1。

即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。

所有的国标码汉字及符号组成一个94行94列的二维代码表。在此方阵中,每一行称为一个"区",每一列称为一个"位"。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。

每个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,其中,高两位为区号,低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个唯一的区位码,没有重码。如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。

国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。

参考资料来源:百度百科-汉字机内码

二、内码和外码分别是什么啊?

一、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。

二、外码

外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的‘经过学习之后,可直接了解的编码形式(例如:文字或语音符号)

中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。

扩展资料:

内码的分类

1、字符编码:字符编码就是以二进制的数字来对应字符集的字符,用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。

2、汉字内码:ANSI码是单一字节(8位二进制数)的编码集,最多只能表示256个字符,不能表示众多的汉字字符,各个国家和地区在ANSI码的基础上又设计了各种不同的汉字编码集,以能够处理大数量的汉字字符。

这些编码使用单字节来表示ANSI的英文字符(即兼容ANSI码),使用双字节来表示汉字字符。由于一个系统中只能有一种汉字内码,不能识别其它汉字内码的字符,造成了交流的不便。

3、GB码:GB码是1980年国家公布的简体汉字编码方案,在大陆、新加坡得到广泛的使用,也称国标码。国标码对6763个汉字集进行了编码,涵盖了大多数正在使用的汉字。

4、GBK码:GBK码是GB码的扩展字符编码,对多达2万多的简繁汉字进行了编码,简体版的Win95和Win98都是使用GBK作系统内码。

5、BIG5码:BIG5码是针对繁体汉字的汉字编码,在台湾、香港的电脑系统中得到普遍应用。

6、HZ码:HZ码是在Internet上广泛使用的一种汉字编码。

7、ISO-2022CJK码:ISO-2022是国际标准组织(ISO)为各种语言字符制定的编码标准。采用二个字节编码,其中汉语编码称ISO-2022 CN,日语、韩语的编码分别称JP、KR。一般将三者合称CJK码。CJK码主要在Internet网络中使用。

8、Unicode码:Unicode码也是一种国际标准编码,采用二个字节编码,与ANSI码不兼容。在网络、Windows系统和很多大型软件中得到应用。

参考资料:百度百科_内码

百度百科_外码

三、内码是什么

内码是指计算机内部对字符进行识别和存储的一种编码方式。

内码是计算机内部用来表示字符的一组二进制数。在计算机系统中,由于各种语言和字符的存在,为了能够正确地处理和显示这些字符,计算机需要将它们转化为内部可以识别的二进制代码,这就是内码的作用。内码的出现是为了解决计算机对于字符的识别问题,使得计算机可以准确地处理各种语言和字符。在计算机内部,所有的信息都是以二进制的形式进行存储和处理的,而内码就是这些二进制信息中的一种特定编码方式。

具体来说,内码是针对特定计算机系统或软件环境设计的,它能够将输入的字符转换为计算机可以识别和处理的二进制数据。不同的计算机系统或软件环境可能会有不同的内码标准,这是因为不同的语言和文化背景可能会导致字符集的不同。例如,在计算机中常见的内码包括ASCII码、Unicode等。这些内码标准规定了字符与二进制数之间的映射关系,使得计算机能够正确地处理和显示各种字符。

总之,内码是计算机内部对字符进行识别和存储的一种编码方式,它是计算机处理各种语言和字符的基础。通过内码,计算机可以将输入的字符转换为内部可以识别的二进制数据,从而实现信息的存储、传输和处理。

到此,以上就是小编对于内码的问题就介绍到这了,希望介绍关于内码的3点解答对大家有用。

上一篇:app乱码转换器有哪些工具?(金山游侠V里面的内码转换器是干什么用的?)
下一篇:已是最新文章

为您推荐