《计算机组成与体系结构(原书第4版)》 —2.6.4 Unicode

举报
华章计算机 发表于 2019/11/19 16:34:26 2019/11/19
【摘要】 节书摘来自华章计算机《计算机组成与体系结构(原书第4版)》一书中第2章,第2.6.4节,作者是[美] 琳达·纳尔(Linda Null)朱莉娅·洛博(Julia Lobur)宾夕法尼亚州立大学,张 钢 魏继增 李雪威天津大学 李春阁 何 颖天津大学仁爱学院 译。

2.6.4 Unicode

EBCDIC和ASCII都是围绕拉丁字母构建的。这样,它们对使用非拉丁语的世界上大多数人口在数据表示方面受到限制。当所有国家都开始使用计算机时,每个国家都设计出了最有效的代表他们母语的编码,它们不一定与任何其他编码兼容,这在新兴的全球经济道路上设置了另一个障碍。

表2-6 EBCDIC码(在二进制区位数字格式中给出的值)数字

image.png

表2-7 ASCII码(用十进制给出的值)

image.png

1991年,在事情还没有到无法控制之前,成立了一个由行业和政府领导人组成的联盟,它创建了一个名为Unicode的国际信息交换代码。这个组织被称为Unicode联盟。

Unicode是一个16位字母表,向下兼容ASCII和拉丁文-1字符集。符合ISO/IEC 10646—1国际标准字母。因为Unicode的基本编码是16位,所以它有能力编码世界上每种语言中使用的大多数字符。如果这还不够,Unicode也定义了一个允许编码其他百万个字符的扩展机制。这足以为人类文明史上的每一种文字提供编码。

Unicode代码空间由5部分组成,如表2-8所示。一个完整的符合Unicode的系统还将允许利用单独的代码形成复合字符,如’和A的组合形成A’。这些复合字符使用的算法以及Unicode扩展可以在本章末尾的参考文献中找到。

虽然Unicode还没有成为美国计算机专用的字母表,但大多数制造商正在他们的系统中对其进行一些有限的支持。Unicode目前是Java编程语言的默认字符集。最终,所有制造商对Unicode的接受程度将取决于他们希望将自己定位为积极的国际参与者有,以及以多低的成本生产一个磁盘驱动器以支持两倍ASCII或EBCDIC存储要求的字母表。

表2-8 Unicode代码空间

image.png


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。