unicode和非unicode是什么意思,unicode8和unicode16
今天小编为大家分享Windows系统下载、Windows系统教程、windows相关应用程序的文章,希望能够帮助到大家!
Unicode是一种重要的交互和显示的通用字符编码标准,它覆盖了美国、欧洲、中东、非洲、印度、亚洲和太平洋的语言,以及古文和专业符号。Unicode允许交换、处理和显示多语言文本以及公用的专业和数学符号。它希望能够解决多语言的计算,如不同国家的字符标准,但并不是所有的现代或古文都能够获得支持。
Unicode字符可以适用于所有已知的编码。Unicode是继 ASCII(美国国家交互信息标准编码)字符码后的一种新字符编码,它为每一个符号定义一个数字和名称,并指定字符和它的数值(码位),以及该值的二进制位表示法,通过一个十六进制数字和前缀(U)定义一个16位的数值,如:U+0041表示 A,其唯一的名称是 LATIN CAPITAL LETTER A。但请注意:JavaScript 1.3之前的版本并不支持 Unicode编码。
Unicode兼容于 ASCII字符并被大多数程序所支持,前128个 Unicode码同 ASCII码具有同样的字节值;Unicode字符从 U+0020到 U+007E等同与 ASCII码的 0x20到 0x7E,不同于支持拉丁字母的7位 ASCII,Unicode对每个字符进行16位值的编码设置,它允许几万个字符,例如 Unicode 2.0版包含 38,885个字符,它也可以进行扩展,如 UTF-16允许用16位字符组合为一百万或更多的字符,UTF将编码转换为真实的二进制位。
Unicode完全兼容于国际标准 ISO/IEC 10646-1; 1993,它是 ISO 10646的一个子集,并支持用两个八进制数的 ISO UCS-2(Universal Character Set)。JavaScript 1.3版本对 Unicode的支持意味着您可以任意地在程序中使用本地的字符以及特殊的科学符号。Unicode提供了一种标准的方法来编码多语言文本,并且因为它兼容于 ASCII,您也可以随意使用 ASCII字符。
您可以在字符直接量中使用 Unicode转义序列,该转义序列由六个 ASCII字符组成:\u加上一个四个数值的十六进制数。如:\u00A9表示版权符号。JavaScript里的每一个 Unicode转义序列由一个字符所对应解释。下表是经常使用的特殊字符和它们的 Unicode值。
空白(whitespace)\u0009制表符<TAB>
\u000B垂直制表符<VT>
行结束符值\u000A换行符<LF>
其它 Unicode转义序列值\u000b退格符<BS>
\u0009水平制表符<HT>
JavaScript对 Unicode转义序列的用法不同于 Java。首先,在 JavaScript中转义序列并没有解释为一个特殊的字符。例如:在一个字符串中的换行符转义序列在函数被解译前并不会终止该字符串,如果在注释中使用转义序列 JavaScript将会忽略它。在 Java中,如果一个转义序列被用于一个单独的注释行,它将被解译为一个 Unicode字符。对于一个字符串直接量,Java编译器将首先解译转义序列。例如:如果在 Java中使用一个换行符(\u000A),它将会终止该字符串,在 Java中将导致一个错误,因为在字符串直接量中不允许换行,您必须使用\n符;而在 JavaScript中,这两者之间并没有区别。
您可以在不同的语言中使用 Unicode来显示字符或专业符号,但这需要一个客户端能够支持 Unicode,例如 Netscape Navigator 4.x,并且客户端还得支持 Unicode字体以及操作平台的支援。例如 Windows 95它只支持部分的 Unicode,另外,为了输入非 ASCII字符,您还得有支持所有 Unicode字符的输入设备,一个标准的扩展键盘不能够做到这一点,但我们可以用 Unicode转义序列来输入 Unicode字符。如果您还需了解 Unicode更多的信息,请参见 Unicode Consortium Web site 2.0版。
unicode编码用2个字节存储字符。
2个字节=16个bit,即16位二进制编码。
最初的unicode编码是固定长度的,16位,也就是2两个字节代表一个字符,这样一共可以表示65536个字符。显然,这样要表示各种语言中所有的字符是远远不够的。
Unicode4.0规范考虑到了这种情况,定义了一组附加字符编码,附加字符编码采用2个16位来表示,这样最多可以定义1048576个附加字符,目前unicode4.0只定义了45960个附加字符。
字母和数字的 ASCII码的记忆是非常简单的。我们只要记住了一个字母或数字的 ASCII码(例如记住 A为 65, 0的 ASCII码为 48),知道相应的大小写字母之间差 32,就可以推算出其余字母、数字的 ASCII码。
虽然标准 ASCII码是 7位编码,但由于计算机基本处理单位为字节( 1byte= 8bit),所以一般仍以一个字节来存放一个 ASCII字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为 0(在数据传输时可用作奇偶校验位)。
参考资料来源:百度百科-字符编码
wwW.Xtw.Com.cN系统网专业的PC、手机系统开发下载平台,HarmonyOS系统、安卓、OS、windows电脑重装系统在线下载安装,操作系统平台技术学习,攻略教程,技术交流。
免责声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。内容仅供参考使用,不准确地方联系删除处理!
联系邮箱:773537036@qq.com