ai 3d设计(重磅AI模型新UI设计语言)
受到新冠疫情的影响,谷歌去年没能开成 I/O 开发者大会,颇为惋惜。幸运的是,今年情况有所好转,I/O 2021 如期“虚拟”召开。美国时间今天白天,I/O 2021 的主旨演讲已经完成,各个分论坛仍在进行中,大会将从18到20日持续三天时间。
大会一开始,谷歌播放了一部剪辑视频,记录了过去多年 I/O 大会上一个又一个令人印象深刻的瞬间,从演示产品故障,到骑着独角兽的开发者穿过会场,从区区几十人的小会议室,到上千人挤满了整个 Shoreline 剧场的常面,历久弥新。
憋了一年时间没和大家“见面”,相信谷歌也有很多新技术和产品想要发布,很多话想要跟开发者和用户去讲。
当然,对于极少数幸运的谷歌员工来说,至少 Keynote 演讲还是现场的……
- 过去一年世界发生了很大变化,有目共睹。在硅谷,远程工作风靡各大公司,既改变了谷歌的运转方式,也激发了它面向这种“新常态”去开发新技术、优化老产品。其中一个就是 Smart Canvas,一个集 Docs、Sheets 和 Slides 之大成的全新(类 Notion)团队协作产品 ;
- Project Starline,一个整合了谷歌 AI、增强现实实力,在内部开发了多年的秘密项目,也在本次 I/O 大会上正式和人们见面。这是一块“魔镜”,能让视频通话另一边的人看起来就像坐在你的面前一般真实;
- 今年谷歌还宣布了两项全新的深度学习技术:LaMDA 和 MUM,能够为自然语言处理这一机器学习的皇冠级应用领域,带来前所未有的性能和使用体验提升;
- 作为保留节目,每年更新一次的 Android 移动操作系统,今年也迎来了第12个版本。谷歌决定,Android 12 要采用全新的用户界面设计语言。“Emotion is essential,beauty is personal”,审美注定因人而异,用户界面设计要贴合用户的情绪。为此,谷歌推出了 Material Design 设计语言的全新升级版:Material You (MY);
工作模式变了,产品样貌变了,甚至连过去在隐私方面稍差的刻板印象,谷歌都想要通过这次大会去颠覆。但是,按照谷歌 CEO Sundar Pichai 的说法,公司一直以来的使命不会动摇:让谷歌为每一个人提供更多帮助(building a more helpful Google for everyone.)
硅星人整理了 I/O 2021大会目前为止所有重要发布内容,了解谷歌最新动向,看这一篇就够了!
Smart Canvas
最初,微软 Office 的文档、表格和演示文档被称为办公行业的三件套。而在海外市场,谷歌的 Docs、Sheets 和 Slides 同样颇受青睐。
近几年,办公协作领域已经开始洗牌,初创公司 Slack 和 Notion 从团队即时通讯、文档协作、知识库、第三方服务整合等方向出发,做出了很优秀的新尝试,也让 Office、Google Workspace(曾用名 G Suite)变成了“传统”产品,经受了巨大的挑战。
而今年 I/O 大会上发布的新计划 Smart Canvas,是谷歌对 Notion 的回应。(准确来说它不是一个产品,而是谷歌加强 Docs、Sheets、Slides 整合的诸多新尝试的一个统称。微软去年也对 Office 产品做过类似逻辑的产品优化。)
Smart Canvas 仍然基于 Docs——和过去不同的是,现在创建一个谷歌文档,你可以直接在文档里面完成更多的操作,比如表格、ppt、投票、知识库的无缝接入。
Smart Canvas 的某些功能设计甚至可以说是直接“致敬”Slack 和 Notion 的:
文档里可以直接用 @ 对团队成员定向任务分配和发送通知,快速插入表格、投票、Task(谷歌的 to-do list)、外部网页和文档等更多模块格式,并且无需担心排版美观问题;Docs 的分页模式,在 Smart Canvas 模式下也能自动关闭;如果你不喜欢文字评价,还可以用 emoji 低调表达对同事的赞美——这个功能在 Slack 和 Discord 等 IM 类产品上非常受欢迎:
这样的谷歌文档,终于变成了一个项目管理面板,具备了 Notion 用户更熟悉的,在效率圈里流行的“知识库”概念。
在文档写作的同时,团队成员还可以直接在文档页面上点击 Google Meet 按钮,一键启动视频会议,提高团队沟通的效率。
Smart Canvas 的主旨,是让常用的文档协作和团队办公所需的操作,变得更加无缝,将 Google Docs 变成一站式的办公平台。这样,谷歌的办公套件才可以更好地应对竞争对手的“进犯”,保住自己的用户,而不是放任 Docs 被 Notion、Slack 等平台接入,成为它们的模块,肥水流了外人田。
“Smart Canvas 能够让如今分散在各地的远程办公团队实现更好的协作,”Google Workplace VP Javier Soltero 表示。这套新产品将面向企业和消费者在内的所有用户开放。
Project Starline: 来一场逼真的网友见面
深居简出一整年的人们,无比期待能够恢复正常的人际沟通。但遗憾的是,新冠病毒和人类完全说再见恐怕还遥遥无期;而与此同时,现有的视频会议已经让远程办公的人士深感疲倦和焦虑。这些产品无论再怎样优化,都无法取代真正的面对面交流。
过去几年里,谷歌内部其实一直在进行着一个神秘的“增强版”视频会议项目,名为 Project Starline。而在今年的 I/O 大会上,我们终于得以一览它的真面目。
这就是 Project Starline,一个集成了软件和硬件,整合了计算机视觉、实时渲染、AR(增强现实)、空间音频等技术的谷歌新技术项目。
它的效果,就好像对方真的坐在你面前一样。
这类技术在圈内被称为 Telepresence,没有一个特别好的简中翻译,但也有人称之为“网真”。
Project Starline 仍然无法达到真正面对面的效果取代,但或许是目前最接近的替代方案了。
这套设备目前仅在谷歌少数几个办公室内安装和测试使用,需要高分辨率摄像头、十多枚深度传感器、特殊的“光场屏幕”等专门定制的硬件,配合谷歌仍在开发测试的算法软件,才可以呈现出最佳效果。由于技术门槛和造价的缘故,这套设备暂时,甚至在未来的很长一段时间里,应该都无法进入平常人家。不过,Pichai 透露已经有重要企业用户对这套技术表示了兴趣。
在这个全民已经习惯了视频会议的时代,Project Starline 让我们看到了希望:还有人不满足于质量糟糕的背景虚化和粗暴的美颜滤镜,这个领域还有技术创新正在发生。
更强大的自然语言和知识处理模型
作为一家跟信息打交道的公司,自从创始初期,谷歌就一直很注重语言和知识的处理。搜索引擎和谷歌翻译是许多早期网友和全球信息打交道的重要工具。而谷歌在 AI 研发方面长久的投入,在全线服务中都有开花结果。
最近几年,谷歌主导开发的 Transformer 深度学习模型和 BERT 自然语言处理训练技术,在相关领域取得了非常优秀的结果。而在本届 I/O 大会上,谷歌又发布了两项新的 AI 技术,在计算机对话、问答等自然语言处理,以及知识搜集和处理能力上再创新高。
LaMDA(全称 Language Model for Dialogue Applications 对话应用语言模型,读作“拉姆达”)是谷歌发布的最新深度学习模型技术,在自然语言处理上取得了突破性的进展。
用通俗易懂的话来描述:LaMDA 模型可以扮演任何一种带有知识属性的实体,比如冥王星或者一架纸飞机,和用户展开自然、亲切的对话,解答他们的问题,帮助他们发现和了解更多的知识。
如下图,用户和 LaMDA “扮演”的冥王星之间展开了一场对话。LaMDA 分享了关于冥王星的许多知识,用的却是通过拟人的方式,在开放式的对话中完成了知识的传递,让用户感觉到更加亲切。它不仅能够理解用户的自然语言发言中隐藏的问题,还能针用户所表达的情绪去优化自己的回答。
用户表示“听上去你那里非常美丽”,LaMDA 回答:“我保证冥王星真的值得一去(连接上文中用户‘想要去看看’的表达),”还加入了一小段俏皮话,“当然,你可得多穿点衣服,毕竟我这冷的时候是真冷。”
后面,LaMDA 甚至会主动加入用户并没有明确表示需要的信息,比如“我很高兴听到你说我很漂亮。我觉得人们对我的评价太低了。有些人竟然把我定义为一个矮行星。”
这些看上去并无来由的“多余”发言,实际上体现了 LaMDA 设计的一个目标:用自由的方式主动推进对话流畅进行,让用户没有那么强烈的“在和一个机器人对话”的观感。哪怕用户用同样的问题一次又一次挑战它,得到的回答都是不同的。
具体技术层面,LaMDA 和 BERT、GPT-3 等谷歌过去斩获各项殊荣的自然语言模型一样,都是基于 Transformer 架构开发的。但和其它类似模型不同的是,它的训练语料是完整的对话,而非随机的网络语料,从而让 LaMDA 的发言听起来更合理和亲切。
“LaMDA 有望在未来给人类带来和科技更加自然的交互方式,并且解锁全新的应用场景。”谷歌表示。
LaMDA 更像是一个独立的对话机器人,而 I/O 上发布的另一个重要的深度学习模型 MUM,则可以显著改善谷歌搜索引擎的返回结果。
MUM 全称多任务统一模型 Mutitask Unified Model. 它同样基于 Transformer,但性能比 BERT 提高了足足一千倍!训练过程包含了75种语言,并且同时对自然语言理解、处理和生成进行训练。更厉害的是,它是一个多模态学习的模型,目前可以理解文字和图片当中的信息,未来也可以扩展到视频和音频。
在实际场景中,MUM 最擅长的就是解答复杂问题。
资深网友应该都有类似的感觉:当你想要通过搜索引擎了解某个信息,或者解答某个复杂问题的时候,你通常需要优化提问的方式,用固定的提问句式,让问题更加清晰、直白、易懂,这样搜索引擎才能理解你想问的是什么——尽管这种提问方式可能并不是你正常说话的方式。
比如这个问题:“我爬过富士山了,接下来要去攀登珠峰,准备工作需要有哪些调整?”这样的问题直接丢给一般的搜索引擎,可能无法(或者很难)得到准确合适的回答;但如果对方是一位登山户外专家,同样的提问方式很容易理解——谷歌开发 MUM,就是为了让搜索引擎能像专家一样,解答这种复杂问题。
以这个问题为例,MUM 会比较两座山的海拔差异,用户提问的日期季节和对应的天气情况,以及珠峰的专门情况需要哪些特种装备等等。以及,问题中的“准备工作”四个字除了装备之外可能还意味着训练工作,那么 MUM 给出的答案也可能包括攀登珠峰必须的身体素质条件以及对应的训练要求等。
MUM 的多模态学习能力,可以从全网的文字、图片和视频种提取更多信息,提供给给用户。以及,多语言能力还让 MUM 可以帮助用户跨越沟通的鸿沟,从多种语言的网络资料当中挖掘更多信息。
也就是说,有了 MUM,再也不需要担心搜索引擎看不懂你的复杂问题了!
更偏向产品应用的 MUM,和尚处在研发探索阶段的 LaMDA——今年 I/O 主旨演讲中提到的这两项突破性 AI 新技术,都体现了谷歌在自然语言处理和信息搜集整理方面的持续,而其背后是谷歌对其使命的重视:“用更好的方式提供优质的信息,为用户提供更多帮助。“
Android 12:全新个性化设计理念
谷歌 2014年推出的 Material Design (MD) 用户体验设计理念,深受很多 Android 开发者的喜爱,尽管最近几年谷歌自己也会偶尔颠覆自己贯彻的设计语言。而随着 Android 12 的发布临近,我们终于看到了新版本 Android 操作系统即将采用的全新设计理念:Material You (MY).
众所周知,Android 的一大优势就是千人千面,而今年谷歌打算把这种高度可自定义的理念玩到极致。
Material You 背后的核心思路是:情绪至关重要,审美因人而异(emotion is essential, beauty is personal.) ”与其定义什么样的蓝色才是 Material 风格的蓝色,这次我们想要让用户成为用户界面的共同设计师,“谷歌设计 VP Matias Duarte 如是说道。
Android 12 的设计风格改变,应该是迄今为止最大规模的一次。MY 设计理念重新思考了从颜色搭配到界面元素形状,从光影到动画效果的所有视觉元素。
最明显的个性化设计,就是全新的系统全局调色板。
Android 操作系统的首屏上最大的界面元素,正是壁纸。Android 12 内置了一个取色算法 (color extraction),能够从用户的壁纸上提取出主色、辅助色,并且生成一套最美观的色彩搭配,然后自动应用到系统全局的界面元素上,包括控制栏、通知、菜单、锁屏、音量条、小组件等。
在系统交互动效的流畅度方面,由于高刷新率屏幕的应用,Android 手机在过去几年里已经追上甚至一定程度上超越了苹果。但其实,人们仍然会有一种印象,就是 Android 手机更卡,苹果手机更流畅。
今年,Android 团队还彻底重写了很多交互逻辑、动效,以及对应的系统层代码等,希望能够让交互体验变得更加流畅,同时也更省电。这一次谷歌宣称,底层优化让操作系统核心服务的 CPU 占用降低了15%左右。
最明显的界面设计变化应该来自屏幕顶端下划的通知/控制菜单。通知和设置选项的颜色有了明显的区分,重要的设置选项现在按钮更大,锁屏界面通知划掉之后显示更大的时钟数字等等……并且这些界面元素的颜色、线条风格都可以让用户自选搭配。
(在这次交互体验重新设计中我唯一不太满意,也是我之前诟病 iOS 和三星操作系统最多的地方:在 Android 12 上,至少对于今年即将发布的新 Pixel 手机,长按电源键不再默认进入电源菜单,而是会激活 Google Assistant 语音助理——为了提高 Assistant 打开率也是费尽心思了啊……)
全新设计理念是这次 Android 12 的主要内容,但谷歌在隐私方面的重大改进也值得一提。
谷歌用户可能知道有一个 My Activity 面板,可以快速浏览自己使用谷歌所有产品服务的记录,并且删除指定的条目——现在这个类似的功能也上了 Android 12,叫做 Privacy Dashboard 隐私面板,用户可以更方便的在手机上浏览过去一段时间内都做过什么操作、生成了哪些数据,快速删除这些操作记录和相关的数据,驳回特定 app 的权限等等。
以及,现在有任何应用调用摄像头或麦克风权限,Android 12 也会在右上角有个提示了。同样的功能在 iPhone 上已经实现了很久,这次谷歌总算跟进了——不过,谷歌还多做了一步,可以让用户直接全局关闭摄像头和麦克风,同样会在右上角显示,如下图:
这并不是谷歌在隐私方面唯一可以在苹果面前昂首挺胸的地方。今年 I/O 上,谷歌高管还专门多次提及了 Pixel 手机的主板上的 private compute core。这是一个用来在本地进行一些较为轻量的机器学习类计算,实现某些特定功能(如本地视频字幕、Now Listening 等)的计算单元——谷歌宣称这个模组是完全开源的,在商业化移动操作系统领域是独一家(这个领域基本上也就苹果谷歌两家……)
2030年实现全球无碳运营
信不信由你:虽然曾被一小部分机器学习研究者批评”为了机器学习飙分,狂堆算例,不计环境代价“,谷歌还是宣称自己是非常注重可持续发展的,是全世界第一家实现碳中和(2007年)、第一家实现百分之百可再生能源驱动(2017年)的大公司。
这一次,Pichai 又大胆立下环保战书:到2030年,成为全世界第一家实现全球全天候零碳的公司。(这里的零碳指的是全球的所有谷歌办公室、数据中心等部门,一周七天,每天24小时,均使用清洁可再生的无碳能源,不是说无碳排放……毕竟那样可能还得把所有呼出二氧化碳的真人员工都解雇了。)
Pichai 还是给自己留了点回旋的余地:这是一个大胆的试验性的想法,就像 量子计算和 LaMDA 一样。
但不管怎么样,这都是一个注定异常艰难的任务。要说在某些国家,想要实现零碳非常容易,比如美国的新总部,整栋楼的发电、通风和取暖都会利用太阳能板、敞开式设计、地热管线等;或者北欧的数据中心,谷歌干脆在旁边建了几座风电场;但到了 Pichai 的老家印度,清洁能源可就真的不好搞了。
好在谷歌是一家技术性的公司。外部解决不了的问题,它可以内部化,用它最擅长的技术手段——高性能分布式计算——去解决。
去年4月,谷歌发布了业界首个所谓的”碳智能计算平台“,按照清洁能源的供给情况智能地进行计算负载分配。这个平台工作的逻辑不难理解:地球的自转形成白天黑夜循环交替,也造成了气象变化和温差。那么谷歌可以把更多的计算负载分配到风能更充足的夜晚,以及太阳能更充足的正午。
而今年,这个计算平台正式升级为全球级别,也即不仅在指定地点可以按时分配,谷歌现在还可以在全球不同时区的数据中心之间智能分配。这个升级版的系统采用机器学习对计算负载的日间变化进行预测,从而提前完成冗余分配和灾备等操作,号称不影响业务的实际运行效率和用户的正常使用体验。
同时在时和空两个维度实现全球数据中心计算负载实时分配的,谷歌应该是头一家。
”明年的这个时候,我们应该可以实现把超过三分之一的非生产用途计算负载,分配到清洁能源更充沛的地区,“ Pichai 表示。
听起来很美好,实际上谷歌的宏图壮志也受到客观因素的限制,比如清洁能源就那么多,各个把可持续挂在嘴边的公司都要争抢;再比如各国数据和云计算立法提上日程,未来有可能某些关键的计算负载不允许跨境流转等等……
以上就是这一届 I/O 2021 大会主旨演讲上最重要的干货了。当然,谷歌是家大公司,业务条线很多,开一次年度开发者大会就有大量内容,一篇文章也难免全部覆盖。所以预告一下:接下来几天我们还会持续报道这届I/O,特别是 AI 技术(AI 医疗方面),敬请期待!
最后,送上一张谷歌总部现场开会的”盛况“,给那些今年去不了 Shoreline 的开发者朋友过过眼瘾吧!
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com