非unicode字符百科(14.0中为什么会有)
随着iOS 15.4测试版的发布,Unicode 14.0标准中出现了存在争议的“怀孕男人”emoji表情符号。以下是Unicode U 1FAC3的产生过程。
Unicode Emoji小组委员会
在讨论表情符号本身之前需要了解下Unicode Emoji小组委员会(ESC)的成立情况。
ESC是负责维护和创建新emoji表情的管理机构。他们提出指导方针、征求反馈意见并编纂标准供供应商实施。
根据ESC的网站上的介绍,这个委员会的工作内容包括:
更新、修订和扩展表情符号文件,如UTS #51: Unicode Emoji和Unicode Emoji Charts;
接受来自不同渠道的意见并审查新的表情符号的要求;
为Unicode技术委员会创建关于额外的表情符号和新emoji相关机制的建议;
调查支持emoji作为图像(贴纸)的长期机制。
该团队是统一码联盟(Unicode Consortium)的一个小组委员会,其中包括我们熟悉的所有大型科技公司,像微软、Google、苹果、Meta、Adobe和其他公司。
ZWJ和emoji构建
自从Unicode 12.0在2019年发布以来,官方Unicode标准使用了三种性别--女人,男人和“性别中立”。虽然后者的官方定义会随着语言的转变而演变,但从本质上讲,人们谈论的是男性、女性和非二元性别。
对于那些问为什么一开始就规定了三种性别的人,这里是官方给出的标准理由:“通常情况下,性别是未知的或不相关的,如‘飞机上有医生吗?’的用法,或不希望有性别的外观。这种情况被称为“性别中立”、“性别包容”、“未指定性别”或其他许多术语。除上述列表外,人类形态的表情符号通常应以性别中立的方式进行描述,除非使用表情符号ZWJ序列明确指定性别外观。”
“中立emoji跟其他emoji和一个被称为零宽度连接符(前面提到的ZWJ)的特殊字符相结合以修改基础表情符号。
那么比如如何制作一个中浅肤色的女性做“不”字的emoji呢?
一般情况下,会从“人做出不的手势”emoji(U 1F645)开始,然后加上中浅肤色的medium-light skin tone(U 1F3FC),接着在“女性”emoji(U 2640或U FE0F)旁边则会加上一个零宽度连接器(U 200D)。这就形成了一个中浅肤色的女性做“不”手势的ZWJ序列。
这个系统的结构是这样的:每一个组成部分都可以在逻辑上拼接起来从而创造出所需的结果。
不过有些emoji则是以女性或男性作为基本字符开始的,而非普通人。这些通常是在规范的早期版本中存在的表情符号的结果,是例外列表的一部分或是更复杂并试图适合更小的空间。
我们可以对字符的字节大小编码展开更多的技术讨论,但这已经远远超出了本文的范围。系统中也有例外情况,后面将会谈到。
L2/19-101:未来RGI表情符号序列的优先顺序
现在我们知道了ESC的工作,它是由谁组成的并对表情符号系统的运作有了基本的了解,我们可以谈谈最终导致“怀孕男人”emoji产生的过程。
这份题为《Priorities for Future RGI Emoji Sequences》的文件标志着ESC开始认真地倡议开始使表情符号更具有代表性。
ESC定义了其在文件中增加更多肤色、性别选择、方向和颜色变化的路线图。另外,它还提出了每项工作的优先次序并将性别中立的变化放在首位,其次是混合肤色。
Emoji技术规范中则直接说明了这样做的理由:“ A(性别中立)和B(混合肤色)都是针对现有emoji集的空白,因此被认为比C(方向性)或D(颜色变化)更需要优先实施,后者则是为了扩大表情符号的功能范围。”
很明显,ESC的目标是代表各种各样的人类和他们的独特经历。从混血儿的握手、夫妇到同性家庭,他们正在慢慢地覆盖尽可能多的领域,从而确保每个人都能在他们选择的情况下代表自己。
那么为什么孕妇不是那些特殊的性别案例之一呢?
为了回答这个问题,我们需要看一下L2/21-055号文件:ESC对2020年第四季度反馈的意见。这份文件存在的唯一原因是解释发生了什么。
按照标准做法,最初的计划是用非二元性表示法取代原来的“孕妇”emoji(U 1F930),然后用男性(U 2642和U FE0F)和女性(U 2640和U FE0F)将其修改为所需性别。从理论上讲,这个系统得到了尊重,所以大家都很高兴。
为了确保现有的性别化表情符号的完整性并为未来的添加保留一条长长的跑道,基于 “人”的emoji永远不应该被编码为性别符号。因此,“人”和“男人”的变体正在被添加为原子字符。
换言之,由于该emoji的遗留使用和性别在其意义中的重要性,再加上没有非二元性别的修饰符,反而得到了两个额外的独立变体。“怀孕男人”(U 1FAC3)和“怀孕的人”(U 1FAC4)将与原来的“怀孕的女人”(U 1F930)并存,打破惯例。
例外情况需要变通
如果你读过L2/21-055,那么你可能已经看到最初为该emoji的中性和男性版本提出了不同的名称:分别是“胀肚的人”和“胀肚的男人”。为什么这两个都没有坚持,原因也是明摆着的:
“新字符的拟议名称“胀肚的人”和“胀肚的男人”在语义上完全脱离了U 1F930的含义,这对于形成性别三联体的emoji来说从来都是这样的。怀孕和胀肚并不是同义词;一个不能合理地用来替代另一个。虽然U 1F930有时确实被幽默地用来表达臃肿的一般概念,但这跟它作为Unicode字符的实际语义没有关系。U 1F930是为一个非常特殊的目的而编码的--代表怀孕和为人父母--并且追溯性地改变其官方含义以包括任何胃部膨胀,这既是对预期父母的不尊重也是对现有数据的破坏。”
翻译一下:所有包含三种性别变化的emoji都有一个共同的命名方案,在这里改变三种表现形式中的两种名称没有意义。它在一个应该是相当有逻辑的系统中引入了更多的不规则性。
此外,将女性改为非二元性别坚持改变了原来的emoji的含义从而破坏了向后兼容。
简而言之,跳过公司之间一些多余的对话,这就是如何最终得到一个“怀孕男人”的emoji。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com