拥有情感的人工智能(情感机器人AI能学会爱吗)
摘要:随着计算机技术和人工智能的发展,智能机器人从认知智能进一步扩展到情感智能。在情感计算、感性工学、人工心理等理论的指导下,产生了OCC模型、马尔科夫模型、HMM模型等情感模型,结合机器人头部表情设计和人机交互技术,形成软件集成的机器人控制体系结构,制作出了情感机器人。然而,情感机器人对社会造成了一些负面影响,引起人们对机器伦理的担忧。未来情感机器人的发展还有一些急需解决的困境。
关键词:情感机器人 情感模型 人机交互 表情头
引言
随着机械动力学、计算机科学和人工智能的飞速发展,机器人拥有了更高的自由度、更快的信息处理速度、更强大的认知能力,但却没有高度仿人的情感智能。也就是说,机器人与人之间依旧有着明确的区分,某种程度上机器人仅仅被人类当做行动和计算工具,没有完整的心智。20世纪80年代,Minsky等人开始研究如何为机器人赋予情感,诞生了情感机器人。本文将围绕什么是情感机器人、怎么制作情感机器人、情感机器人带来的社会影响以及面临的困难与挑战展开论述。
情感机器人概述1、情感机器人的诞生背景
20世纪是机器人高速发展的时代。1959年美国人英格伯格和德沃尔制作出世界上第一台工业机器人“尤尼梅特(UNIMATE)”,标志着现代机器人的诞生。第一代机器人是示教再现型机器人,重复执行人教的或控制器指示的动作;第二代机器人是有感觉的机器人,能够通过传感器获取视觉、听觉、触觉、嗅觉等感觉信息,更好地适应环境;第三代机器人是智能机器人,拥有记忆、推理、决策能力,能够与人对话和自我修复。尽管智能机器人在认知能力上拥有了更丰富的数据库、更高效的信息采集方式、更快的信息处理速度,以及更敏捷的决策和动作,在情感智能方面却与人类的情感机制相差甚远。
1997年,美国MIT媒体实验室的R. Picard出版《Affective Computing》,提出情感计算是为了建立一种“能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计算系统”,集中测量表现情感的生理信号。20世纪70年代,日本提出“感性工学(Kasnei Engineer)”的概念,以感性科学为基础,设计给人带来快乐和舒适的“感性商品”。1999年,中国的王志良首次提出人工心理的概念,试图利用信息科学的手段,对人的心理活动(尤其是情感、意志、性格、创造)进行全面的人工机器(计算机、模型算法等)实现。这些关于情感的理论构想推动了情感机器人的诞生。
1996年,日本早稻田大学开发出WE-3系列仿人头部机器人;1999年,日本索尼公司研发出AIBO宠物狗,情感机器人开始进入人们的生活;2000年,美国MIT媒体实验室开发出Kismet婴儿机器人,能够模仿婴儿向父母表达需求。如今,情感机器人成为机器人研究领域的新热点,在日本、美国、欧洲和中国都得到了更进一步的发展,并且在人们的日常生活中得到了更加广泛的应用。
WE-4R机器人
AIBO宠物狗
Kismet机器人
2、情感机器人的定义
情感机器人(Emotional Robotics)是通过人工方式具有识别、理解和表达情感的能力的机器人,主要分为物理机器人和虚拟机器人两大类。物理机器人的研究主要是包括表情识别、人脸检测与跟踪、手语识别、表情合成、唇读等基于人工情感的机器人控制体系结构,聚焦对于人类基本面部表情的模仿;情感虚拟人(Affective Virtual Human)则是使虚拟人在计算机生成的虚拟环境中具有特定的个性和情感交互能力,是人工心理理论在虚拟现实中的应用。
3、情感机器人的典型代表
(1)Pepper机器人
2015年,日本软银集团开发出具有语音和面部识别、动作和情感表达功能的Pepper,应用于家庭服务和公共服务。Pepper通过内置的语音识别技术、分析表情和声调的情绪识别技术,识别主人的感情和情绪,并通过语音、表情、动作给予亲切的情感反馈。除此之外,Pepper还设置了情绪引擎,能在长时间的相处中记住主人的情绪习惯,适应主人的性格,像是现实版的大白。
Pepper
Paro
(2)海豹机器人Paro
日本产业技术综合研究所开发的海豹机器人Paro外形上像一只毛绒海豹玩具,能够感应光线、声音、触觉、温度和姿势,与老人进行交流。Paro身高约55厘米,重2.5千克,相当于新生儿的大小。研究证明,Paro在治疗老年痴呆症上有显著作用,类似于动物辅助治疗但不会有咬伤患者和使患者感染疾病的风险。目前,Paro机器人作为医疗器械通过了美国食品药品监督管理局的认证,在美国、日本等国家推广。
(3)智能心理机器人“静静”
2019年,中智关爱通发布中国首款智能心理机器人“静静”,也是国内首个通过国际EAP(职业心理健康)协会中国分会认证的人工智能EAP机器人。“静静”不仅可以提供心理健康知识,还能进行初步的心理辅导和推荐匹配的心理咨询师。通过情绪识别技术,静静能够分辨开心、愤怒、惊讶、恶心、害怕、悲伤、中性七种情绪,发现使用者有负面情绪时,静静会主动发起聊天,给予使用者心理支持。如果使用者的心理状态异常发展到需要人工心理干预的程度,静静会联系线下的心理咨询师,更好地保障使用者的心理健康。
静静
Milo
(4)自闭症陪护机器人Milo
Robokind公司研发的Milo机器人具有卡通人物的有趣外形,语速比正常人的语速慢20%,能够重复特定的表情和动作。对于自闭症儿童来说,学习情绪表达与社会交往是一件困难的事,但在与Milo的相处过程中,他们的注意力提高,能够不受他人情绪的影响通过观察Milo的重复表情有效学习。Milo安装了沟通、同理心和行为模块,并且能够根据不同孩子的特点选择模块的难易程度,能够有效提高自闭症儿童的学习效果。目前,莱斯特小学已将Milo作为美国教育部三年试点教育项目的一部分。
情感机器人的制作方法情感机器人涉及的关键技术和理论包括表情头的设计、面部动作编码系统理论、电动机控制、机器视觉、人机交互与合作技术、机器人软件平台设计、数据库与知识库的建立、情感模型及机器学习,接下来将详细介绍。
1、机器头表情实现
在人们的情感交流过程中,表情占了55%的信息传递内容,因此情感机器人头部的设计是非常重要的部分。为了使情感机器人与人进行流畅的情感交流,情感机器人头部必须具备友好的人机界面、适当的机械结构、和谐的人机交互模式。根据面部动作编码系统(FACS),设计眼球、眼睑、眉头、嘴角、下颚、颈部、嘴唇部位的运动,总计14个自由度。
在制作情感机器人头部之前,首先要对人类的头部运动和面部肌肉进行分析。在此基础上,选择采用机械结构或仿人器官使机器人产生仿人表情。根据Ekman的FACS理论,设计与面部表情相关的运动单元(AU),确定惊奇、恐惧、厌恶、愤怒、高兴、悲伤六种基本面部表情的肌肉运动情况。然后,选取合适的电动机和机械材料,例如HG14-M舵机和硬铝合金LY12。
表情头的具体制作分为四个步骤。第一,使用三维设计软件Pro/E进行实体建模,大致确定内部机械结构的尺寸。第二,进行机械零件的加工、装配和初步调试,对于重要特征尺寸的机械零件采用浮动设计,对需要孔和边定位的零件使用长型槽定位。第三,安装和固定玻璃钢外壳和眼球、眼睑等配件。第四,进行修饰和化妆,安装硅胶外皮、头发、睫毛、眉毛。
在制作面皮和面部支撑壳时,采用不易变形、弹性较好且与人类皮肤效果接近的硅胶材料作为面皮,使用轻质高强、电性能和热导性能好的玻璃钢材料制作面皮支撑件。制作好机器人头部的泥模和石膏模后,将液体硅胶刷到石膏模具内壁,等到形成的面皮厚度达到要求后,在面皮上涂刷调制好的玻璃钢溶液,等到玻璃钢完全固化后即可脱模成型。
机器人头部的动作设计主要包括眼球、眉头和嘴部。为了实现眼球的上下、左右运动以及眼睑的开合,使用两个通过配套件直接与眼球相连的小舵机控制眼球的左右运动,另一个舵机通过四杆机构同时控制两个眼球的上下移动,还有两个舵机通过四杆机构控制眼睑的张开和闭合。至于挑眉和皱眉,则是通过舵机的舵盘拉动硅胶面皮的眉头部分来实现。设计嘴部运动时,通过舵机带动连杆,使连杆的下牙片带动面皮下颌实现张嘴、闭嘴。
2、人机交互与合作
人机交互(Human-Computer Interaction, HCI)是关于设计、评价和实现供人们使用的交互式计算机系统,且围绕这些方面的主要现象进行研究的科学。狭义上说,人机交互指人与计算机之间的信息交换,包括计算机信息输入与输出两部分。人机交互技术是一个跨学科的领域,主要研究人机交互界面表示模型与设计方法、多通道交互技术、认知与智能用户界面、可用性分析与评估、虚拟环境中的人机交互。
随着多媒体技术和虚拟现实技术的发展,人机交互技术包含了语音、图像和视线的多通道交互,有利于情感机器人分析处理人类语音、表情并与人类进行眼神交流,构建更加自然和谐的人机环境。
语音交互技术包含语音合成和语音识别两部分。语音合成技术是将文字转换成能够表达情感状态的语音,使情感机器人能够模仿人类的语音语调来说话。例如,微软的Speech SDK 5.1通过初始化COM组件和调用一系列函数的方式,能够合成三种英文语音和一种中文语音,并且能够调节语音合成的音量和速度。语音识别技术则是将语音信号转化为文本或命令,使情感机器人能够听懂人类的话,将自然语言转化为可运算的机器语言。以微软Speech SDK 5.1提供的API为例,经过初始化COM、初始化识别引擎、创建识别上下文、设置识别引擎返回消息、加载识别语法、处理消息一系列过程实现语音识别。
情感机器人要与人进行自然的交互,必须能够识别交互的对象是谁,即说话人识别(speaker recognition),分为说话人辨别(speaker identification)和说话人确认(speaker verification)两个范畴,采集音频和视频信号进行分析。说话人听觉识别不是为了辨别语音的内容,而是区分不同说话人的发音从而确定交互对象。例如,基于模板匹配算法,在训练过程中,从说话人的训练语句中提取特征向量,生成语音码本;在测试阶段,从说话人的测试语音中提取特征并与码本进行模式匹配,从而识别说话人身份。说话人视觉识别则是为了收集人脸图像信息从而确定说话人,主要分为人脸检测与定位、图像标准化、特征提取、人脸识别四个流程。
在人与计算机进行交互时,眼动行为可以反映用户在显示器上视线停留的位置,从而使计算机能够通过追踪人类的视线判断用户感兴趣的内容,即视线追踪技术。该技术由信息获取和视线方向判别两部分构成,获取面部图像并进行预处理后检测生物特征信息,从而获取平面视线方向参数,再根据数学模型计算空间视线方向和盯视屏平面落点。视线追踪技术可以代替鼠标,根据用户视线落点发出激活按钮界面,并在用户视线转移后确定激活。
总的来说,人机交互系统的设计必须以人类为中心,坚持用户控制原则、直观性原则、可视性原则、易用性原则、及时响应原则、简洁性原则、一致性原则。除此之外,多种感官通道的交互与相互融合也是构建更加和谐的人机交互体验的重要内容,满足用户的情感需求。
3、体系结构与软件集成
体系结构是在智能机器人系统中智能、行为、信息、控制的时空分布模式,是机器人智能的逻辑载体,主要研究机器人的软硬件系统控制以及功能实现。
机器人的控制体系结构主要有基于认知模型的功能规划法和基于行为的方法。已有的自主式智能系统可分为串行功能分解体系结构、分层递阶式结构、包容式体系结构、混合式体系结构、基于功能/行为集成的进化体系结构,以及基于人工情感的拟人机器人控制体系结构。2012年,杜坤坤等人提出基于人工心理的情感智能机器人控制体系结构,即基于人工心理认知/行为的分层式交互机器人体系结构,分为信息交互层、本能反射层、信息融合层、智能决策层四个层次。信息交互层采用多智能体(Agent)模块化设计,分散收集语音、人脸、表情、位置、网络等信息,有利于提高处理速度,保障人机交互的实时性。
在情感机器人软件平台的设计上,采用开放式软件总线结构。通过通信模块,直接集成各应用程序到系统环境中,实现功能共享和信息交互,形成“即插即用“的集成框架。该结构与传统结构相比,提高了模块间的功能共享、可扩展性、和总体性能,是一个更佳的机器人软件交互平台。对于网络功能模块的设计,将IGRS (Intelligent Grouping Resource Sharing)协议封装在DLL库中,提供API接口供应用开发者调用。
4、情感模型
制作情感机器人,必须对情感进行数学建模。
1985年,Minsky提出让计算机拥有情感处理能力的观点;1995年,Picard提出情感计算的概念;20世纪90年代,日本开始感性工学的研究;2000年,王志良提出人工心理的概念。这些思想为情感模型的建立奠定了基础。目前,国内外的人工情感模型有基于认知的OCC模型、基于欧式空间的马尔科夫模型、基于概率空间的HMM模型,近年来关于情感建模展开了普适性研究、个体情绪差异性研究、实用性研究,使情感模型更精细化,更接近人类情感。除此之外,还出现了基于机器学习的情感模型,能够使情感机器人自主学习情感的处理与表达,提高与人进行情感交流时的自然度与和谐度。
接下来介绍比较简易的马尔科夫模型,以及在情感机器人设计中的应用。
该情感模型建立一个以恐惧、喜悦和愤怒为维度的三维空间,设定这三种基本情感只有0, 0.5, 1三种强度,形成27个离散情感状态,构成了如图所示的情感空间。其中,原点(0, 0, 0)代表平静或其他未知情感状态。该模型被称为马尔科夫模型。
将马尔科夫模型应用到机器人的情感设计上,情感空间中的每一个点都代表一个特定的情感状态。受前一时刻的情感位置、外界环境刺激以及机器人性格影响,情感状态会在这个三维情感空间中发生转移。通过性格矩阵和情感概率计算,计算机能够仿真机器人的情感状态转移结果。根据计算出的情感状态,对应恐惧、高兴、愤怒、悲伤、惊奇、厌恶六种基本表情。该模型的情感状态转移规律基本符合人类自然的情感转移规律,尤其是加入性格矩阵后机器人拥有更加鲜明的个性,更接近人类情感。
情感机器人的社会影响
为机器人赋予情感后,社会的交往关系、家庭结构、法律体系等都会发生意想不到的变化,继而引发一系列对于人机关系的思考。
首先,具有一定程度人类情感和自由意志的情感机器人,有资格获得人类身份吗?如果情感机器人做出违法犯罪行为,例如家庭护理型情感机器人愤怒之下伤害卧病在床的老人,应该由谁来承担责任?是具有行动、认知、思维、情感能力的机器人,还是购买者或开发者?情感机器人是否具有法律上的主体地位,能够享有法律权利和承担法律责任吗?
其次,随着技术的发展,情感机器人能够具有越来越丰富的社交功能,这对人类的社会交往体系形成巨大冲击。如果有一个外貌靓丽并且耐心倾听你的烦恼的情感机器人,不会违抗你的命令和批评你的情绪化行为,你会觉得生活更幸福吗?另外,随着情感机器人在工业、医疗、家政等领域的运用普及,一个人所能接触到的自然人会越来越少,甚至完全宅在家里办公、生活,人与人之间的亲情、友情、爱情价值又该如何实现?
最后,情感机器人甚至可能带来家庭结构的深刻变革。定制完美伴侣将不再是梦,你完全可以与情感机器人谈恋爱、结婚;丁克一族能够抚养机器人小孩,并且由机器人继承遗产;在外地工作的青年可以购买情感机器人来为家里的老人提供贴心照料。例如,美国的科普女士在丈夫去世后与她父亲制造的机器人结婚。这个机器人拥有与科普女士的丈夫相同的外貌、声音和生活习惯,并且因为输入了一生只爱科普的资料,永远不会移情别恋。
面对情感机器人对人类社会的影响,你是坚持人类中心主义还是倡导建立人机平等关系?人类与机器谁主谁奴?如何构建和谐相处的人机命运共同体?这些都是值得思考的伦理问题。
情感机器人的困难与挑战由于人类情感的研究仍处在前科学阶段,尚未形成统一范式,目前没有一个统一的情感模型。这使得采用不同情感模型设计的情感机器人的情感输入、处理、反馈能力差别较大,情感机器人市场出现良莠不齐的现象。另外,现阶段的情感机器人几乎只能进行情感的统计和概率分析,尚不具备理解和学习情感表达的能力,这会成为情感机器人进一步发展的巨大阻碍。
除了技术难题外,人们对情感机器人可能引发的伦理危机的担忧也是阻碍情感机器人发展的重要因素。作为情感机器人的设计者,如何使情感机器人朝着有利于人类的方向发展是必须把握的关键,情感机器人要适应人类需要而设计,并且要安装安全程序防止机器人伤害人类。在人机关系日益密切的时代,如何处理人类与机器人的地位问题,机器人是否具有人格权,这些都是亟待解决的问题。
结语
情感机器人已经成为了人工智能和机器人领域新的研究热点,在社会生活中得到了日益广泛的应用。虽然还面临着情感模型、表情仿真等技术难题,以及相关伦理考量,但情感机器人的发展总体上呈向好趋势。未来的情感机器人需要在人机关系上经过哲学探讨,结合人类的需要进行改造升级,以更好地融入人类社会。人机共生的未来如何,让我们拭目以待。
参考文献
杜坤坤 刘欣 王志良 解仑.情感机器人.北京:机械工业出版社,2012.
吴敏 刘振焘 陈略峰.情感计算与情感机器人系统.北京:科学出版社,2018.
王志良.人工心理与人工情感.智能系统学报,2006,(1).
刘遥峰 王志良.基于情感交互的仿人头部机器人.机器人,2009,(6).
孟秀艳 王志良 李娜 刘遥峰.情感机器人的情感模型研究.计算机科学,2008,(6).
刘燕.情感机器人哲学伦理学维度.内蒙古农业大学学报(社会科学版),2012,(2).
杨国亮 任金霞 王志良.基于情绪心理学的情感建模.计算机工程,2007,(22).
刁生富 蔡士栋.情感机器人伦理问题探讨.Journal of Shandong University of Science and Technology,2018,(3).
杨国亮 王志良.情感建模研究进展.自动化技术与应用,2004,(11).
中关村在线.奥创有点远 或将被商业化的八大机器人.引自今日头条,https://www.toutiao.com/a4376982354/?log_from=6f7304c1f31fc_1637567895879.
2021年11月22日
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com