算力需求飞速增长 算力承载阿里的雄心
1969年,美国成功登月,成就了人类史上一次雄心勃勃的科学壮举。
为登月计划提供算力的阿波罗制导计算机(AGC),时钟频率1.024MHz。据此推算,今天的一部手机,就能将上万艘阿波罗宇宙飞船送上月球。
算力,深刻改变了人类社会。
在美国登月前的1961年,人工智能之父约翰·麦卡锡,在麻省理工学院百年庆典上,对未来计算畅想道:
“有一天,计算可能会被组织成一个公共事业,就像电话系统是一个公共事业一样”。
这一大胆的预言,在当时几乎无人相信。
但时隔60年,麦卡锡的预言,仿佛一柄穿越时空的利剑,劈开迷雾,将人类社会送进一个崭新的计算时代。
今天,算力已经是和水、电一样重要的公共资源。
没有算力,电厂将停摆,工厂将停工,自动驾驶、智慧城市等将成为空中楼阁……就连手机购物,也将变得不可能。
从这个意义上来讲,算力是继热力、电力之后新的生产力,决定了国家和地区的竞争力。
在国内,一场省市间的算力大战,鏖战正酣。
来自工信部的数据显示,截至2022年,广东、上海、江苏等经济发达省市,占据了全国综合算力指数榜的前五强。
放眼全球,国家之间的算力之争,更是激烈。从某种程度上讲,国家综合实力越来越比拼算力。
2021年,著名咨询公司IDC发布了一份全球算力报告。报告显示,中美两国领衔全球算力之争,紧随其后的,是日本、德国、英国和法国。
这几乎就是全球GDP国家排名的翻版。
可以说,算力在过去60年间,深刻改变了人类社会。云计算则大大加速了这一进程。
2006年,亚马逊公司推出S3服务,从根本上改变了用户对于计算资源的获取方式,使得他们不用自购主机,也能享受云端的算力服务。
从那时起,云计算就成为推动人类算力增长的主引擎。
但旧的IT部署方式,难堪重任,云计算需要新的IT架构。从2008年开始,以亚马逊、微软、谷歌等为代表的美国科技公司,开始全力探索新的云计算架构。
在这场时代的浪潮中,中国企业没有缺席。
华为在芯片、数据库、操作系统等技术领域,不断突破。而阿里早在2009年,就开始了飞天操作系统的研发。
13年的坚守,最终让阿里在云计算领域,收获颇丰。
就在刚刚举办的2022云栖大会上,阿里云宣布:自研CPU倚天710已大规模商用,并且未来两年20%新增算力将使用自研芯片。
作为阿里云第一颗为云而生的CPU芯片,倚天710是阿里云技术长征路上的重要突破。
不仅如此,不久前的阿里云峰会上,阿里还对外发布了云基础设施处理器(CIPU)。
官方消息称,CIPU将向下对接数据中心的硬件资源,向上接入飞天操作系统,能够管控阿里云全球百万台服务器。
“中国云计算公司的研发正深入到信息产业最核心的领域。阿里平头哥研发的CPU芯片倚天710已大规模部署于阿里云的数据中心,使得单位算力的性价比大幅提升、功耗显著下降,这是中国云计算和芯片技术发展的重要标志。希望以阿里云为代表的的中国云计算,能继续加大创新力度,让计算真正像水电气和网络一样普惠大众。”中国工程院院士邬贺铨表示。
这是中国企业在云计算领域的一次全新尝试。
不尝试,就很可能被困死在于原地。
自从1946年,世界上第一台计算机ENIAC诞生之日起,计算的载体经历了从大型机、小型机、PC、移动终端到云计算的进化。
在云计算之前,小型机几乎是所有企业算力的载体,企业需要通过线下购买或者租用服务器来获取算力。
这种集中式的计算架构,在2007年前后,随着消费互联网的爆发,其所能提供的算力已经远远满足不了现实需求。
对阿里这样的电商企业而言,挑战尤其巨大。
彼时,淘宝网用户激增,高峰时段的流量井喷,对阿里的算力提出了更高要求。
在传统模式下,解决算力不足问题,只能靠扩大采购规模,比如IBM小型机、Oracle数据库、EMC存储等。
但采购成本的飙升,甚至超过业务本身的增长,使得这种模式很难长久持续。
为了打破瓶颈,阿里做出了一个在当时看来极为大胆的决定:用分布式的云计算来替换传统的集中式架构。
具体来讲,就是用一个分布式系统,将全世界的服务器连接在一起,也就是后来的飞天操作系统。
在此之前,以亚马逊为代表的美国高科技公司,已经在探索这一方向。但对国内互联网企业来讲,这还是第一次。
2009年2月,在北京上地一间简陋的办公室里,阿里云团队写下飞天的第一行代码。
这对阿里来讲,是一次全新的开始。
但做一个分布式系统,其复杂程度比传统业务系统更高。尤其是,服务器数量增加到数千台时,系统性能、稳定性等方面的技术挑战,指数级上升。
阿里云团队因此面临外界大量的质疑。最难的时候,甚至公司内部,也有很多人认为,开发飞天这件事,完全不靠谱。
向前走,步步艰难,回头,更是一条死路。在两难抉择面前,阿里选择了坚持。
2013年5月,经过四年多的攻坚,阿里不但将飞天变成了现实,还在全球首次实现一次集群5000台服务器。
充沛的算力,使得阿里不但可以满足自身需求,还开始大规模对外提供基于飞天的云计算服务。
然而,云计算并非没有短板。
传统上,云计算的思路是通过虚拟化技术,将一台计算机虚拟成不同主机,从而为用户提供弹性、分布式的服务。
但在虚拟化,或者说“打包”过程中,会产生一定的损耗,导致极大的算力浪费。
针对这一历史遗留问题,阿里再次跳出旧框架。
2016年,当阿里意识到,软件层面的优化已逼近极限时,果断选择了一条在当时看来很“激进”的路线:
打造一款专用硬件来负责芯片不擅长的虚拟化调度工作。
于是,2017年9月,第一代神龙架构诞生了。神龙架构兼具虚拟机的弹性和物理机的高性能,以软硬件结合的设计,彻底释放了云计算的潜力。
今天,神龙计算平台经过多轮迭代,打破以CPU为中心的传统云计算架构,成为新一代算力管控和加速中心,也就是CIPU。
2022云栖大会上,阿里云首次展示了倚天710和CIPU、飞天操作系统完美协同的成果,倚天710在云上提供的算力性价比提升超30%。
这是中国企业在云计算产业的又一次新尝试,阿里巴巴的技术生态闭环,更加成熟。
尽管阿里、华为等企业,在云计算领域取得了诸多技术突破。但总体来看,云计算和它背后的算力产业,还是面临基础薄弱、大而不强等一些问题。
尤其是在和算力直接相关的芯片、操作系统等底层技术领域,中国还面临很多瓶颈。
这也是眼下中国经济面临的新挑战。经过40多年的改革开放,靠跟随、模仿,我们已经把容易摘的果实都摘完了。
接下去,要想摘更多、更大的果实,就必须下决心科技攻坚,在“科技珠峰”上,选择爬更陡的北坡。
这也是最近几年,国家重点发力的领域。具体到云计算产业,早在2012年,云计算就被列为“十二五”国家战略性新兴产业。
近年来,随着数字中国战略的推进,从中央、地方政府到企业,兴起一股大规模建造数据中心的浪潮。
2022年上半年启动的东数西算工程,更是将这股浪潮推至更高点。
这一全国性的算力网络,其建设将决定包括产业数字化在内,中国数字战略的落地,最终推动中国经济转型升级。
不仅如此,一张强大的算力网络,还是科技创新的发动机。
没有强大的算力作支撑,就不会有人工智能的落地,包括预测蛋白质结构在内,很多科技创新将难以产生。
而建设全国性的算力网络,一方面需要政府、企业在内,全社会投入巨大的人力、物力。另一方面,还要攻克一些关键核心技术。
从美日韩和欧洲诸国的经验来看,大企业在国家科技竞争中的作用显著。
美国在互联网时代的统治地位,很大程度上,是政府推动下,以苹果、谷歌、亚马逊等大公司积极创新的结果。
韩国以弹丸之地,在全球科技产业,尤其芯片制造领域,占有一席之地,其背后是三星等大公司几十年如一日,在科技创新上的投入。
这些企业,也因为融入国家大战略,获得极大的发展。
在中国,没有大规模的通讯基础设施投资,就不可能有全球最大的互联网,也不会有阿里、腾讯、百度等互联网大公司。
如今,这些大公司已超越应用层面,更多深入技术底层。
阿里巴巴就是其中代表,从做云计算开始,阿里投身硬科技攻坚已有14年。在这一过程中,阿里的技术实力不断增强,而阿里这家公司也变得越来越“重”,为实体经济作出更扎实的贡献。
从更宏观的行业层面,BAT等互联网大公司,本身就是国内数据中心建设的重要参与者。另一方面,通过云计算,这些互联网公司不断推动千行百业的数字化转型。
从工业互联网到智能汽车,从远程医疗到智慧城市……“算力”渗透到实体经济的方方面面,这已经成为互联网公司推动数实融合的典型形态。
以阿里为代表的企业,还在应用层面之上,努力突破云计算底层技术。
这不但有利于企业的长期发展,也在带动整个行业的转型升级。展望未来的中国,大公司必然会在科技攻坚上走得更深、更实。
正如阿里云智能总裁张建锋在2022云栖大会上所言:
“云计算的竞争不再是比拼业务规模扩张的速度,只有在核心技术和产品的研发上持续创新才能走得更远。”
阿里巴巴是一家有雄心的企业,它今天的雄心早已不是自身的业务目标,而是继续做时代的弄潮者。
科技攻坚对中国是一场大考,每一家大公司都要考虑,自己在这场考试中,将交出一张怎样的答卷。阿里巴巴,正在不断书写新的答案。
本文源自华商韬略
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com