unicode字符集是unicode联盟开发的一种(Unicode联盟正式发布15.0标准)
作为一个非营利性组织,Unicode Consortium 致力于开发、拓展和促进相关全球化标准的采用联盟成员中有许多企业和组织代表,且其中不少来自计算机和信息处理行业而在 15.0 新标准中,Unicode 联盟继续实施了针对核心规范、附件和数据文件的改进 —— 为其引入了 4489 个新字符,且总数达到了 14 万 9186 个,我来为大家讲解一下关于unicode字符集是unicode联盟开发的一种?跟着小编一起来看一看吧!
unicode字符集是unicode联盟开发的一种
作为一个非营利性组织,Unicode Consortium 致力于开发、拓展和促进相关全球化标准的采用。联盟成员中有许多企业和组织代表,且其中不少来自计算机和信息处理行业。而在 15.0 新标准中,Unicode 联盟继续实施了针对核心规范、附件和数据文件的改进 —— 为其引入了 4489 个新字符,且总数达到了 14 万 9186 个。
首先,本次新增内容包括了两组新脚本(总计 161 个)、20 个新的表情符号(Emoji)、以及 4393 个中日韩(CJK)表意文字。
其次,Unicode 15.0 版本中的新脚本和字符增加了对更多现代语言的支持:
● 包括在印度地区使用的 Nag Mundari;
● 在印度使用的 Kannada 字符(用于书写 Konkani、Awadhi 和 Havyaka Kannada);
● 以及由阿拉斯加卡克托维克的伊努皮亚克人设计、用于因纽特语和尤皮克语的 Kaktovik数字。
新增的 20 个表情符号,包括发夹(hair pick)、沙锤(maracas)、水母(jellyfish)、khanda(印度的一种古老武器)、以及粉色爱心(pink heart)。
其它新增符号还包括:
● 九颗尖白星(巴哈伊信仰者使用)
● 八个天体符号(天文学家和占星者使用)
● 29 个额外的埃及象形文字(格式控件)
针对其它语言和学术工作的支持:
● 在东南亚发现的历史文字 Kawi(用于书写古爪哇语和其它语言)
● 三个附加的阿拉伯文字(土耳其使用的古兰经标记)
● 三个 Khojki 字符(在手写和印刷文件中被发现)
● 十个梵文字符(用于表示在土耳其发现的吉祥标志铭文和手稿)
● 六个拉丁字母(马拉雅拉姆语的音译使用)
● 63 个西里尔字母修饰符(音标中使用)
重要的图表字体更新:
● 一组埃及象形文字(除了支持文本中旋转字形的标准化变体序列外)
● 统一加拿大土著音节的字形(为 Carrier 和其它语言提供更好的支持)
● 一套 Wancho 新字体(具有改进和简化的形状)
● 针对中日韩(CJK)语言的更新添加:
● H 块中的 CJK 统一表意文字扩展(4192 个字符)
● C 块中的一个统一表意文字扩展
最后,Unicode 属性和规范决定了文本在计算机(包括手机)上的行为,以下 15.0 版新标准的重要更新。
【UAX #9】Unicode 双向算法,修改了 UAX9-C2 中的注释,以强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。
【UAX #31】Unicode 标识符与模式参数,提供更多关于默认标识符配置文件的指导,阐明标识符中默认可忽略代码点的使用,并讨论 Pattern_White_Space 与编程语言中的双向排序问题之间的关系。
【UAX #38】Unicode Han 数据库,增加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别变更为字典索引、扩展 kKangXi 属性,并且加入了第 3.0、3.10 和 4.5 节。
【UTS #39】Unicode 安全机制,将零宽度连接符(ZWJ)和零宽度非连接符(ZWNJ)字符从 Identifier_Status=Allowed 变更为 Identifier_Status=Restricted,默认情况下的通用安全配置文件将不再允许。
【UAX #45】U-Source 语义符,在其数据文件中记录了新的表意文字、添加了 ExtH 作为新状态、改进现有 CJK 统一表意文字块的状态标识符、并添加了第 2.5 节。
【UTS #46】Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况、并添加了有关新 IDNA 派生属性数据文件的文档。
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com