华为麒麟芯片什么时候开始强大(起底华为麒麟芯片崛起之路)
根据IDC2018Q2的数据,华为智能手机的销量已经超过了苹果,排在了全球第二位,毫无疑问在高端手机领域已经站稳了脚步,现在每年的P系列和Mate系列的更新都必然是业界和手机市场的大事。在华为手机高歌猛进的同时,不要忘记了麒麟芯片也在茁壮成长。这颗小小的麒麟芯从诞生之初再到今天成为手机移动设备的主流旗舰芯片之选,当中经历了很多。
近年,作为支撑华为手机商业成功的重要力量,麒麟芯片越来越受关注。但实际上麒麟一路走来的艰难险阻,只有经历过的人才有深刻体会。这里,我们希望通过 2003 年以来的若干小故事,来探究麒麟的奋斗和变革历程。需要说明的是,麒麟只是一个代称,实际上是指用于手机的一系列芯片或部件,即华为无线终端芯片,包括麒麟、巴龙、HiKey(氦客开源开发板)、RF、Connectivity、PMU(电源管理单元芯片)、Codec(编解码器)等。
4G LTE Modem:星星之火,可以燎原
2009 年 12 月,一个天寒地冻的日子,几个中国年轻人带着 CPE(客户终端设备)在德国郊区做户外信号测试。到现在,大家还记得户外冷冰冰的食物和水,记得全身冷到僵硬的感觉,但记忆最深刻的,还是测试过程中大家一起奋斗的那股干劲儿。他们当时测试的,是华为第一代商用 LTEa 终端芯片巴龙 700,内部代号叫北极星 Polaris。他们希望「北极星」能够指引胜利的方向。
华为无线终端芯片要从 2003 年说起。那时,公司决定研发用于 WCDMA(宽带码分多址)的手机芯片—代号是梅里。可惜这个项目不太成功。2007 年中,公司正式宣布停掉梅里项目。时任海思总裁徐直军表示,尽管梅里这个项目不做了,无线终端芯片领域还有更多挑战值得攻克,鼓励大家坚持下去。他说:「我们华为就是『傻傻地投』。」
梅里这款产品虽然最终没能成功商用,但给团队积累了最为珍贵的产品经验与教训,更重要的是培养了一批人。梅里项目的结束其实是一个全新的开始,公司决定兵分三路:在 3G Modem(调制解调器)和 AP(应用处理器)处理器领域分别积蓄力量,另一方面也开始了 4G LTE (注:LTE,通用移动通信技术的长期演进,即通常所说的 4G 无线通信。) 新技术的预研和探索。
于是三个团队分别重新踏上征途。王劲和 King 带领团队开始 3G Modem(含 2G)研发;Jerry 则带领梅里团队的一部分核心力量,在高端 AP 领域继续探索;第三个团队则专攻 4G LTE 方向。2007 年底,华为无线产品线研发 4G 网络设备需要配套的 4G 测试终端。Sean 曾经有过 3G 测试终端的开发经验,责无旁贷地挑起了 LTE 测试终端开发的大梁。同时,由于缺人,公司决策将高端芯片专家 William 从发展得如火如荼的数字媒体芯片领域抽调到 LTE 领域,负责 LTE 芯片的开发。William 是一位非常有经验的芯片开发专家,在数据通信芯片、安全芯片、数字媒体芯片等领域有着成熟的产品开发经验。后来证明,正是这样才实现了 4G 乃至 5G Modem 芯片的「星星之火,可以燎原」。
新鲜血液的加入,不仅带来了成熟的 SoC(片上系统)架构和电路设计经验,还带来项目开发的新思维。William 说:新团队没有经历梅里项目的磨难,但正是因为不了解,反倒有更多勇气去挑战,真正激发出团队潜力。与此同时,Sean 带领的团队也燃起全新的奋斗热情,坚守的兄弟们一心都想把项目做好,他们的心中始终燃烧着一团熊熊烈火。但不论团队如何热情高涨,艰难困苦一如既往地在前面等着大家。
第一代LTE 单模 Modem 巴龙 700:是 25Mbps,还是 100Mbps?
在定义第一代 LTE 芯片巴龙 700 的最高速率时,大家在 25Mbps(传输速率单位,兆比特每秒)和 100Mbps 之间摇摆不定,当时 HSDPA(高速下行分组接入)的下行峰值速率在 3.6 Mbps 左右,有些人觉得 LTE 做 100Mbps 太高了,能做到 25Mbps 就行。但 William 不这样想。基于路由器领域的经验积累,他认为,4G 初期的速率在无线领域看来确实很高,但在路由器领域,这个速率差不多是 10 年前的水平。尽管传输的原理不同,很多核心技术却是相通的。William 坚持 100Mbps 没什么问题,物理层以上的问题能够解决。
这是一款 LTE 单模芯片,支持 LTE FDD/TDD(频分双工 / 时分双工),不支持 2G/3G。在当时 LTE 网络没有大规模部署的情况下,单模 LTE 应用场景受限,既不能做手机,也不能做数据卡,只能放在固定位置用于 CPE 产品形态。而且彼时行业已经推出成熟的 2G/3G/4G 多模 LTE 芯片,并且在主流市场商用发货。从这个角度说,单模 LTE 芯片巴龙 700 是一个彻头彻尾的「落后」的产品,既然这样,为什么还要设计这样一款产品?
其实这是有原因的。负责产品规划的专家 Benjamin 说:2010 年恰逢德国政府发布国家宽带战略,号召运营商在 DD 800MHz(LTE Band 20,运营商的一个频段)频段上开展移动宽带业务,弥补德国广大乡村地区无线宽带接入的缺口,消除数字鸿沟。这在对手眼里,不算肥肉,但对 4G Modem 巴龙团队来说却是天赐良机,于是才设计了巴龙 700。Sean 和 William 团队完成了巴龙 700 的交付,德国的运营商同意采用基于巴龙 700 平台的 CPE,4G 巴龙芯片获得了一次宝贵的机会。在当时业界已经推出多模芯片的背景下,一款单模 LTE 芯片能够获得德国运营商的认可,实属不易。
借此契机,华为充分发挥端管协同优势,成功支持德国几家重要的运营商利用 DD 800MHz「数字红利频谱」在全德范围内部署移动宽带网络,巴龙 700 成功在夹缝中打开市场。开头提到的在德国郊区进行信号测试,就是这个时候。
趁热打铁,基于对中国移动 TD LTE 频段的支持,巴龙 700 在上海世博会演示的即摄即传体验峰值速率达到了 100Mbps,海思也成为最早完成工信部 TD LTE 测试的厂家。基于巴龙 700 的数据卡还支撑华为网络完成在日本运营商的拓展。这就是 LTE 单模三年技术攻关播种下的革命火种。
第一代LTE 多模 Modem 巴龙 710:选择成熟的 3G 架构,还是面向未来的 LTE 架构?
2012 年,多模已经成为行业主流,业界 LTE 芯片已经做到第二代,甚至第三代,海思也迅速转入多模 4G LTE 芯片巴龙 710 的研发和攻关。这时他们遇到了多模 Modem 架构选择的问题。
此前,2G/3G Modem 芯片开发架构基于 ARM9(此处 ARM 为英国 ARM 公司,下同)和 ZSP(一款数字信号处理产品),有成熟的解决方案的交付能力;而之后的 4G LTE 单模 Modem 芯片则基于新的 ARM11 CPU(中央处理器)和 CEVA(思华科技,公司名,也是其产品的名字)处理器,开发了全新的更有竞争力的架构。对于 LTE 多模 Modem 的架构,两个团队进行了激烈的讨论,一方认为应该选择成熟的 3G 架构,有利于产品的快速量产; 另一方认为应该选择面向未来的 LTE 架构,有利于未来演进。双方相持不下。时任海思研发管理部部长的何庭波没有立即拍板, 而是给大家讲了一个故事。2G 时代,半导体巨头 TI(得州仪器)、英飞凌,基于成功的 2G Modem 去开发 3G Modem,结果失败了。而后起之秀高通则是先开发了 3G Modem,之后把 2G 功能融合进去,结果成功了。何庭波沉默了一会,对大家说:「现在我们面临同样的历史时期,要从 3G 向 4G 切换。采用旧的成熟的架构,加入新的功能,事实证明是不适用的,无法很好地演进。我们的 4G 技术架构选择,要面向未来。」于是最终决定:采用 4G LTE 架构,把 2G/3G 功能融入进去。正是这次选择,奠定了巴龙 LTE 未来芯片的清晰演进路线,从 LTE Cata. 4(注:LTEcat 是 4G 网络速度的一个技术标准)的 150Mbps,到 Cat. 6 的 300Mbps,再到 Cat. 12 的 600Mbps,整个架构支撑了华为无线终端芯片在 LTE 上的持续演进。
海思巴龙参与了大量的 LTE 测试 (图片来自:《熵减:华为活力之源》)
万里征程:从 4G LTE 迎头追赶,到 5G 时代全球领先
2013 年 CES(国际消费类电子产品展览会)期间,公司从产品竞争力的角度出发,决定把 Modem 和 AP 合起来,选择走 SoC 的发展道路。当时距离交付只剩下八个半月的时间,时间紧、任务重,团队克服重重困难按时交付,并且在巴龙 720 这代产品上实现了很强的竞争力,创下了最短开发周期的纪录,同时这款Modem 也持续为麒麟 920/ 930/ 950 等提供着强劲的通信能力支持。从巴龙 720 开始,巴龙 750、巴龙 765 等后续产品逐渐走上正轨,随后推出的每一代产品几乎都实现了业界最强的规格,在LTE 时代站稳脚跟。
2019 年 1 月 24 日,华为正式面向全球发布业界领先的 5G 多模终端芯片—巴龙 5000 和基于该芯片的首款 5G 商用终端—华为 5G CPE Pro,领航 5G 时代。
日本客户对 Modem 产品向来要求特别严格,巴龙以过硬的规格和性能赢得日本运营商客户的信任和赞赏 (图片来自:《熵减:华为活力之源》)
5G 的形势和 4G 相比已经大不相同。在巴龙 5000 与网络系统设备商联调的过程中,Sean 和 William 及团队听到最多的反馈就是「你们真的很快」。2019 年 6 月 28 日,中国移动发布首份 5G 芯片和终端评测报告,巴龙 5000 不论在网络兼容性、吞吐率上,还是在续航上,都一骑绝尘。
经过 4G LTE 时代艰苦卓绝的奋斗和积累,巴龙 Modem 芯片终于在市场上喊出了自己的声音,也让行业内的其他厂商刮目相看。「做全球最好的 Modem」成为现实。
2019 年 1 月 24 日,巴龙 5000 正式发布。实际上早在此之前,巴龙 5000 就开展了 IoDT(互操作性测试)测试 (图片来自:《熵减:华为活力之源》)
麒麟 920:初露锋芒,爆款产品是如何诞生的?
捷总是一家创业公司的 CEO。他是从华为手机部门离职出去的,和原先华为的兄弟们仍然保持联系。2014 年 9 月,华为推出一款名为 Mate 7 的手机。之后,他的亲朋好友不断地给他打电话,请他帮忙买 Mate 7。他很奇怪,打电话求助华为的兄弟,没想到对方说:「哎呀,不好意思,现在没货。我们自己都抢不到 Mate 7。」电话这头捷总一脸惊愕。
这就是华为爆款手机 Mate 7 刚发布后的情景。它搭载的就是脱胎换骨了的麒麟 920。那么麒麟 920 是如何诞生的?在它之前,经历了什么?在它之后,又发生了什么?
2007 年,如上文讲到的,梅里项目结束后,公司决定兵分三路。经过几年艰难探索和尝试,三个方面军陆续都取得了一些突破:3G Modem 巴龙芯片经过几代的更迭,陆续突破了欧洲、日本等重要的运营商;AP 处理器经历 K3V1 的小规模出货,到 K3V2,支撑华为 D1、P6、G710、Mate、D2,P1、D1 XL 等手机产品以及平板、电视盒子和电子相框等大规模出货,奠定了关键技术基础,摸索和积累了一系列产品研发和量产的方法学,在市场上初步打开局面;4G LTE 团队是革命火种,在 3G 向 4G 变迁的大潮来临之前储备力量,艰苦研发与攻关,终于在 4G 来临时打出了一场又一场漂亮的通信胜仗。
2012—2013 年,国内 4G 即将开始大建设;2G/3G Modem、4G Modem、AP 齐头并进,但分立的 K3V2 和巴龙 710 难以担负起业务发展的使命,要支撑华为手机发展,多模 SoC 推出至关重要。历经昏天黑地的艰难攻关,华为推出了首款手机 SoC 麒麟 910,支撑 Mate 2、P6 S、P7、H30 等手机规模发货,获得了良好的口碑。
麒麟为上古时期灵兽,聪慧、祥瑞,拥有来自东方的神秘力量,赋予芯片非凡的智慧和强大的力量。麒麟 910 开始了华为手机 SoC 时代,而最大突破却是来自麒麟 920。
麒麟 920 的一波三折
麒麟 920 和麒麟 910 几乎是并行开发和交付的,这被称为「拧毛巾模式」。但它的诞生却是一波三折。
早在 2012 年 12 月 28 日,大家就在讨论开发一个 K3V2 pro 版本,作为 K3V2 的升级版,重点解决一些问题。但后来大家觉得它的竞争力不太强。2013 年 1 月,公司决定:不要再犹豫了,果断停掉 K3V2 pro。
2013 年公司新立项一个产品,名称为 K3V3。当时的想法是做一颗规格领先的独立 AP 芯片(为什么业界总有 K3V3 的传说,原来不是空穴来风),外挂一颗全球首发支持 LTE Cat. 6 的巴龙 720 芯片,采用 AP Modem 的模式,交付终端客户。就在项目按计划进行的时候,芯片研发主管 William 敏锐地发现,这种模式的交付,对客户来说,成本竞争力很不够。有没有办法,在保证规格竞争力的同时,大幅降低整体成本,从而为客户提供有竞争力的解决方案版本?
办法总比困难多,通过整体的系统架构设计、规格分析、成本分析,最终项目团队确定,采用整合 AP 和 Modem 的 SoC 方式,可以在保证规格竞争力的同时,大幅降低芯片成本。确定方案可行之后,William 立即就投入了沟通说服工作,得益于海思专家主管一体的高效机制,方案很快就获得了大家的认可并拍板执行。确定投片时间为 2013 年 4 月。
无限风光在险峰,虽然优化方案得到了认可和实施,但是留给项目组的开发时间却极其有限。整体架构需要重构,媒体部分需要重构,手机验证平台需要重构……一个关键模块的显示子系统,本来是一位新加入的海外高端专家负责,两个月前就觉得快搞定了,可是过了两个月一看,发现还是处于「快搞定」的状态。怎么办?推倒重做。这时候,芯片专家 James Wang 带头投入,负责关键模块的代码重构和编写开发,两周搞定;验证专家 Tom 又带人扑上去,三周搞定;手机验证平台对交付影响巨大,没有熟悉的人,怎么办?原本做 Modem 验证但从没做过手机芯片验证的专家 Martin 牵头,成功地完成了手机验证平台的重构,这个平台在后来历代麒麟芯片验证交付中发挥了巨大作用。
麒麟 920 采用了 ARM big. LITTLE(大核 CPU 与小核 CPU 相结合的 CPU 架构设计)架构,四个大核 A15,确保强劲的性能; 四个小核 A7,确保优秀的能效。这是当时业界最先进的八核架构,性能和功耗完美均衡。实际上此前大家曾经对这个架构还很犹豫,纠结于大小核的升级,最后海思总裁何庭波坚决拍板:用大小八核架构,并在专家 James Fang 带领下实现业界第一个真八核 HMP(异构多处理器架构)方案,Benchmark(跑分)和操作体验全面领先,一举超越多家竞争对手。
在 2013 年初的那个阶段,麒麟 910 还在攻关中,甚至巴龙720 也还没有完全稳定下来。但这不影响麒麟 920 紧锣密鼓的研发。2014 年春天,麒麟 910 经历了艰苦的攻关,搭载麒麟 910 的几款手机(尤其是 P7)基本上赢得了消费者不错的口碑,但大家都有点心有余悸。在这种情况下,麒麟 920 的表现尤其值得期待。
这时候麒麟 920 的各项测试指标基本出炉,大家有点不太相信自己的眼睛—实在太强悍了。
2014 年 6 月 6 日,麒麟 920 在华为北研所发布。没人会想到,这样一款强悍的产品是在华为院士艾伟的自黑中开始的。只有很少的专业媒体受邀参加了本次发布,他们已经被这款产品所震撼。随后,2014 年 6 月底发布的荣耀 6,以及 9 月份发布的华为 Mate 7,成为爆款手机,进一步提升了麒麟 920 的声誉和影响力,它被誉为「国产最强芯」。文章开头所说的 Mate 7 一机难求的故事,就是这个时候发生的。
此后,大家对 SoC 手机芯片的开发更加有把握,更加自信,也更加出神入化。
2014 年 12 月,麒麟 620 发布,这是华为首款 64 位的手机 SoC,其支撑的荣耀 6X 手机成为公司首款出货量超一千万台的手机。可能没人知道,此前公司规划的是麒麟 610,是 32 位的。后来大家果断终止了 610,改为了 64 位的 620。这一做法后来被称为「壮士断腕,绝地重生」。
2015 年 3 月,麒麟 930 发布,它也完成了从 32 位到 64 位的转化,采用了性能和功耗更为均衡的 A53 核,巧妙跳过了手机上的「火炉」A57。这一做法后来被称为「四两拨千斤」。
2015 年 11 月,麒麟 950 发布,业界率先导入 16nm FinFET(鳍式场效应晶体管)顶尖工艺,这是中国半导体厂商第一次站上了半导体工艺的最前沿。其研发历程异常艰险,后文详述。
2016 年 4 月,麒麟 650 发布。这是业界首款在中档位手机SoC 上导入 16nm FinFET 顶尖工艺的芯片,并且实现了全模,即补齐了自研 CDMA 2000(码分多址,3G 移动通讯标准之一,下文简称 CDMA)通信制式。16nm 顶尖工艺支撑麒麟 650 更长的生命周期,成为海思首款出货超亿套的手机 SoC 芯片。这一做法后来被称为「神来一笔」。
组织架构的调整
Paul 是无线终端芯片部门主管。在麒麟 910 和 920「拧毛巾」开发的过程中,作为事业部主管,他面临一系列难题—不仅是技术的难题,还有团队融合的难题。他既要融合 4G Modem 和 2G/3G Modem 团队,还要融合 K3 团队。他们原本都各自拥有端到端交付能力,都有芯片、物理层、架构、解决方案、测试等各模块。这在以前各自独立交付的环境下是有效的,但现在要做SoC 的开发,这样的组织架构就有很多问题。为此,在海思领导的支持和帮助下,Paul 进行了组织架构的调整,把这种各自端到端的交付组织,改为按模块分别交付的组织—芯片、物理层、架构属于公共部门,服务于麒麟和巴龙解决方案部,最终由麒麟和巴龙解决方案部交付给终端公司。
多年后,回顾此次组织架构的调整,大家开玩笑地做了个比喻:一家食品铺子里有几个组,分别负责制作包子、烧麦、饺子等,每个组都有做馅、做皮、捏在一起等完整的能力。现在,重新分组,每个组分别负责生火、做馅、做皮等,最终交给另外的组捏在一起,再卖给消费者。每个组把自己所负责的那项能力做精,最终的产品质量大大提升,受到消费者的喜爱。这种组织架构一直沿用到现在。
补齐通信制式:TD-S CDMA 和 CDMA,每次都掉一层皮
麒麟 910 是首款 SoC,其不仅要融合 AP 和 Modem,即 K3V2 和巴龙 710(4G Modem)、巴龙 2G/3G Modem,还必须支持中国移动的 TD-S CDMA 制式(时分 – 同步码分多址,3G 移动通讯标准之一,下文简称 TD-S)。TD-S 标准没有国际大厂商投入,只有国内厂商投入,产业链各个环节,仪表、设备、标准的细节、产业化等,都不完备,困难很大。
公司几经讨论,最终决定与中国一家早期研究 TD-S 制式的高校合作,从其获得授权。但拿过来之后,发现存有大量问题,诸如代码混乱,时序变化,测试力度不够,商用困难,出问题很难定位,即使定位到,也很难修改。公司花了很大代价开发和稳定这个版本。TD-S 制式的研发负责人 Andrew 说:2013—2014 年的冬天,TD-S 团队几乎所有的人都去做测试工作了。大家开着自己的私家车,一遍一遍地跑外场,做测试。外面下着大雪,大家一边开车,一边拨打测试电话。现在想想,还真挺危险的。
从 2013 年下半年,一直到 2014 年第二季度,中间经历了长达 9 个月的艰难历程。2013 年底,Paul 临危受命带领大家攻关,Jim 是攻关组长,Andrew 是解决方案软件组长,几乎每天晚上 9 点大家都会开晚例会,分析问题,分工解决问题,通常开完会都十点多了,会后还要继续工作。
2013 年底,一个寒冷的冬夜,Paul 出差北京开完攻关会议回到酒店,接到一个同事电话,请他参加他们部门的年会,Paul 婉拒了。因为他实在太忙了,摆在他面前的难题太多了。这个身经百战、战果累累、年底这段时间本应拿奖拿到手软的部门主管,此时此刻却几乎要哭出来了。他在想:「我为什么要来负责这块业务?我能做好吗?」
来自内部和外部的压力很大,兄弟们工作很艰苦。很可惜有的人离职了,包括一些骨干。但大部分人仍然在坚持,这些兄弟在这个领域默默坚持了近 10 年,这是他们大好青春的 10 年。Paul 曾经问过这些兄弟,为什么能一直坚持。他们说,没有为什么,既然定了目标,就一定要做出来。Paul 说,有这群兄弟在,心中就有目标,坚持下去,一定能取得突破。
到 2014 年四五月份,TD-S 的问题终于解决,搭载的手机陆续量产。麒麟 910 背水一战、九死一生的攻关历程,成为大家刻骨铭心的回忆。
麒麟手机 SoC 从 910 开始,到 620、920、930,在通信制式上一直稳定,但还缺一个制式—麒麟芯片一直不支持中国电信的 CDMA 制式。这个问题随着全网通手机的普及显得越来越严重。那时的华为全网通手机,要么采用其他厂商的 SoC,要么
采用麒麟芯片加外挂其他厂商的 CDMA Modem。在要不要自研CDMA 制式芯片这个问题上,大家有所争论。有的专家认为,随着 4G 的普及,CDMA 可能将逐渐被淘汰,没有必要去开发一款产品来支持将被淘汰的制式。但也有很多专家认为,即使 CDMA 本身不演进了,但其还会存在一段时间,全网通一定是大势所趋。麒麟如果没有全模芯片,华为手机的竞争力将受到很大影响。最终,大家达成一致:集成 CDMA 制式。
然而,在是采用其他厂商的授权的 CDMA 还是自研的问题上,大家又开始了争论。Jim 是 CDMA 开发主管,鉴于先前 TD-S 的痛苦经历,他对领导 Paul 说:「你不要从外面买 CDMA。我一定能做出来。」
考虑到时间进度,公司还是和其他 CDMA 厂商开展了谈判,决定从其获得授权。坊间传说,双方基本谈成,但在最后一刻对方狮子大开口,海思决定不再购买其授权了。于是,开发 CDMA 的任务责无旁贷地落到 Jim 身上,2014 年,他带领团队加紧攻关,终于完成 CDMA 制式。CDMA 的研发,华为公司坚实的通信功底起到巨大作用。架构主管 Jary 说:由于华为基站早就实现了CDMA 制式,所以从网络侧抽调了若干专家,一起攻关 CDMA 终端芯片。但这中间也遇到了很多困难,例如,Jim 曾经发现 RF 芯片锁死,大约每 200 台手机就有一两台出现这种情况,很难定位问题。他和团队以及 RF 的同事,一行一行地检查代码,做压力测试,终于定位到问题并解决。最终 CDMA 制式在麒麟 650 上成功交付,也为后面所有的麒麟芯片的全网通制式扫清了障碍。此后,麒麟 950、960、970、980 等在通信规格和性能上一直高歌猛进,并延续到 5G 时代。
实验室里的紧张调试(图片来自:《熵减:华为活力之源》)
麒麟 950:跨越自我,从鲁莽时代到业界 Tier 1
2015 年秋天,史上最牛的跨越之作麒麟 950 即将量产。作为麒麟解决方案的主管,King 要对套片解决方案端到端量产负责,他这时候有点焦头烂额。他给海思领导 Julian 写了一个邮件,列出麒麟 950 的若干问题和风险,包括 SoC、PMU、RF 等。他说:「麒麟 950 有可能重演当年梅里的风险。」他的邮件发出去没一分钟,就收到了 Julian 的回复:「你赶紧去产线上盯着。问题不解决不要回来!」King 看着邮件,脑子一片空白,这时电话响了,Julian 说:「你走了没?」
为什么说麒麟 950 是一款超越之作?是因为它在很多方面实现了很大的跨越,不仅超越了自己,而且超越了同时期的业界其他旗舰。比如:
1. 第一次站上了半导体工艺的最前沿,导入 16nm FinFET 顶尖工艺。
2. 首次自研 ISP(图像信号处理)并商用 , 确定了华为手机在拍照领域的领导地位。
3. 首次商用 ARM 最新 CPU、GPU(图形处理器):麒麟 950 首次商用 ARM Cortex A72 CPU 和 ARM MaliT880 GPU,在性能上实现了新的突破。
4. 首次自研 DDR(双倍速率同步动态随机存储器)Phy(端口物理层)并商用 , 同时支持已经成熟的 LPDDR3(低功耗内存技术)和标准还未完全确定的 LPDDR4,支撑华为手机当前和未来的成功。
5. 首次商用自研 PMU:新的 GIC500(通用中断控制器)、新系统总线以及 FBC(帧缓冲压缩)技术应用,使得麒麟 950 具备更强大的硬件性能基础。
6. Modem 算法的优化:基于对业务的理解和行业标杆的分析,海思把 Modem 的算法和物理层识别为关键业务,围绕算法设计和工程化能力建设的主线,通过不断优化整合,分层能力建设,逐步确定了在 Modem 上稳固的领先优势。
7. 新一代自研射频芯片 Hi6362,支持更广泛的全球漫游。
8. 新组织架构的首次全方位练兵。一款手机 SoC 芯片,通常是提前 2~3 年开始研发,从规划、设计到生产,环环相扣,每个环节都很重要。2014 年中,无线终端芯片业务部完成组织架构调整,可以说麒麟 950 是组织结构优化调整后第一个真正意义上的芯片团队和解决方案团队通力配合研发出的产品版本。新的组织架构需要磨合,到底是否有效,产品说了算。
2015 年春天,麒麟 950 回片,团队在上海举办了开工会,海思总裁何庭波在开工会上给大家总结了十二个字:夯实基础、踩稳节奏、开放创新。每个模块的负责人都立下了「军令状」,团队开足马力向「跨越」这个目标挺进。
但到了下半年,因为麒麟 950 的高规格,全新的工艺、处理器、模拟 IP(知识产权)、PMU、RF,导致套片量产过程中出现了各种问题,工艺和功能问题耦合在一起,DDR 误 bit(比特,二进制制位,信息的最小单位)问题、供应商模拟 IP 的低概率问题、PMU 的应力不足的 die crack(芯片裂纹)问题、RF 的 ESD(静电阻抗器)问题,每个问题都非常棘手。最要命的是,那时距离手机产品上市只有 2 个月了。这才出现了前文 King 所说的:「麒麟 950 有可能重演当年梅里的风险。」这话并不过分。庆幸的是,这时候的团队已经不是梅里时的团队。海思领导 Julian 亲自带头,连夜跑到供应商处解决问题,Paul 也身先士卒和大家一起讨论解决方案,King 立即赶赴产线,在一线集合海思 SoC、RF、模拟、封装、可靠性、产品线等各方面专家集中攻关两个月。在所有兄弟的共同努力下,终于麒麟 950 得以成功量产。
那么这些问题是如何解决的?先看看麒麟 950 上惊心动魄的RF 问题。麒麟 950 配套的 RF 芯片是 Hi6362,海思从 3G 时代自研 RF 芯片,到 4G 时代已经基本追平了业界主流水平,Hi6362 已经是第二代 4G RF 芯片,大家信心满满。2015 年秋天,那时 Mate 8 手机已经投入试产,大家在紧锣密鼓地测试中。一天,由于被测试手机比较多,检测人员无意中发现两台 Mate 8 手机叠放在一起信号会立刻失效。这太恐怖了。
RF 专家 Orion 立即带领团队进行问题定位,经过两个多月的攻关,终于发现是 ESD 出了问题,也就是 RF 芯片生产过程中少了一层膜(mask),这个失误会直接影响到 RF 芯片的可靠性,最终导致芯片无法正常工作。发现问题的当天下午,开发团队第一时间奔赴 RF 的代工厂,与对方专家一起看版图,最终在凌晨 3 点半发现版图调错的问题,并对另外一个量产版本做了检查,幸运的是这个版本是正确的。完成这些工作已是第二天早上 6 点,大家都如释重负,两个月来的攻关终于尘埃落定了。旧版本全部报废,开足产能生产新版本。
到这里,问题似乎解决了。但一个更棘手的问题摆在大家面前:那时已经生产出来 6 万台 Mate 8 手机,怎么办?按照测试人员的说法,只有两台手机靠在一起,才会出现问题,这种概率比较小。从这个角度来说,这些手机可以销售。而如果出问题,则会直接影响到华为手机的口碑。考虑到如果这些手机全部报废,会出现价值几亿元的损失,大家不知道怎么办才好。最终海思总裁何庭波果断决策—6 万台有问题的手机直接报废,因为华为手机的品质和消费者的信赖是公司生命之本。
麒麟 950 上除了 RF 问题,还有前面提到的工艺问题、ISP 问题等,都一一得到解决。这些内容我们后面分别详细介绍。
2016 年 6 月 20 日,任总给麒麟 950(含巴龙)研发团队颁发了总裁嘉奖令。2016 年 6 月 28 日,海思举办主题为「跨越」的庆功会,徐直军、余承东、何刚、李小龙等均到场,祝贺麒麟 950的成功,并对未来的麒麟提出了更高的希望。
无线终端芯片业务部主管 Paul 说:「别人说我们是奇迹,每一步都很成功,其实每个成功的背后都是大家的艰辛付出。我们是一群普通人,却做出了一流的产品。这其中,目标导向的价值观起到很大作用,大家力出一孔,艰苦奋斗,致力于把事情做好。不服输,长期坚持朝目标努力。新征程,现在,我们要面向未来。」
2016 年 6 月 28 日的麒麟 950 庆功会上展示的任正非给麒麟 950(含巴龙)研发团队颁发的总裁嘉奖令(图片来自:《熵减:华为活力之源》)
先进工艺:提前布局 决战巅峰
2013 年 1 月,一个寒冷冬日的午后,Leo 和几位领导和同事一起去拜访台积电,目的是希望和对方合作开展业界顶尖的 16nm FinFET 工艺。当时的海思在工艺上并不领先;规模上,在台积电的客户清单上排名 50 位左右。所以,导入 16nm,这几乎就是「mission impossible」(不可能完成的任务)。这个任务能完成吗?
作为一家半导体设计公司,海思对先进工艺的追求是锲而不舍的,而先进工艺又是最难的。按照提前 2~3 年立项的时间节奏,
2013 年,海思就开始规划麒麟 950,工艺是一项重要规格。那时手机芯片的主流制造工艺是 28nm。对于 2 年后要上市的麒麟 950,海思如何选择?
为什么选择 16nm FinFET?
持续数十年的 Bulk CMOS(体效应互补金属氧化物半导体工艺)工艺技术在 20nm 走到尽头,加州大学伯克利分校胡正明教授在 20 年前就开始探索并发明的基于立体型结构的 FinFET 晶体管技术和基于 SOIa 的超薄绝缘层上硅体技术的 UTB-SOI(超薄通道绝缘体上硅)技术,也就是行业内常说的 FD-SOI(全耗尽绝缘体上硅)晶体管技术,能解决半导体制程到 25nm 后的制造和功耗难题,成为半导体产业仅有的两个重要选择。因为他的两个重要发明,摩尔定律在今天得以再续传奇。
但实际上,从胡教授在 20 世纪 90 年代发明 FinFET 技术,到 2015 年 FinFET 技术量产,这中间却用了近 20 年的时间。
海思很早就意识到了手机芯片工艺的技术极限,2012 年底,海思总裁何庭波拜访胡正明教授,向其请教 FinFET 技术在 16nm 工艺上的可实现性,做出了通过技术创新突破瓶颈的选择:跳过 20nm,开始了 16nm FinFET 工艺的技术突破之旅。在两年后的2015 年,在麒麟 950 发布会上,胡正明教授谈 16nm FinFET 技术的视频,令所有与会者震撼。这是后话。
台积电:为什么要和海思在顶尖工艺上合作?
虽然做出了选择 16nm FinFET 工艺的决定,但要真正实现商用却面临着巨大的难题和挑战。首先是 16nm FinFET 工艺的生产和制造问题,当时在手机芯片制造领域拥有 FinFET 技术的芯片制造商台积电(TSMC),对芯片设计厂商的技术水平、技术积累、商用经验和商用规模都有着极高的要求。2013 年初的海思,手机芯片的量确实不大(麒麟 910 是 2013 年下半年才商用),更没有后来成为爆款的麒麟 920,所以在台积电那里根本算不上大客户,在先进工艺上海思又一直处于跟随的状态,并没有率先商用顶尖工艺的经验。所以,当时几乎看不到台积电与海思在顶尖工艺上合作的可能性。
2013 年 1 月,一个寒冷的午后,海思总裁何庭波带领骨干成员去台湾拜会了时任台积电轮值 CEO 刘德音先生,Leo 是其中一员。他回忆道:到达台湾的当天,何庭波不巧生病了,发着高烧,但她还是坚持第一时间去台积电拜访。正是这次重要的会面,促成了双方在 16nm FinFET 上的战略合作。海思作为大陆领先的芯片设计厂商,在台积电有着优秀的量产纪录,和台积电有着良好的合作关系,更重要的是具有清晰的战略思路。那时,华为手机已经决定做自有品牌高端手机,而其他领先芯片设计公司大多选择了在其他代工厂生产,台积电迫切需要一个与之抗衡的大客户, 这个大客户很可能就是海思。可以说,台积电看到了海思芯片在华为手机未来全球版图规划中的重要性,深刻地意识到此次合作对于双方的战略意义,于是选择海思作为 16nm 全球首发芯片合作伙伴,麒麟 950 终于拔得 16nm 头筹。
同样是 16nm,麒麟 950 还做了几次切换:先是 16nm LL(能效比较好),后来切换到 GL(性能比较好),最后确定 FinFET
Plus。芯片主管 William 说:这无异于一辆汽车在飞驰中换引擎,开发工作量非常大。2013 年 10 月 21 日立项,在 2014 年底投片之前,大家都异常焦虑。果然,一堆问题冒出来了。
首款自研 LPDDR:为什么要走钢丝?
先进的工艺总是伴随着很多工程化的难题,16nm FinFET 新工艺要求单芯片集成的晶体管数目从 20 亿个增加到 30 亿个,金属互连的难度成倍提升;基于 3D 结构的晶体管,工艺复杂度大幅增加。
与此同时,麒麟 950 还首次搭载自研的 LPDDR,这是当时最有挑战性的技术方案之一。在选择更有竞争力但技术风险更大的LPDDR4,还是技术成熟风险更小的 LPDDR3 的问题上,当时内部意见很不统一。经过五次反复,最终决定两代都做。同时兼容LPRRD3 和 LPDDR4,业界没有可以参考的经验,甚至第一次面对定义封装的问题,首款、自研,这些字眼里充满了风险,负责芯片开发的高层主管 George 亲自和 William 带了 30 人的团队,一起和 DDR 研发主管 Leo 的团队检验设计,每天看代码、看设计。期间出现的警告 log(日志)多达几万条,大家就一条一条过,每天都忙到夜里十一点,有同事甚至累到病倒。当时还赶上春节,大家也都基本没有休息,时刻在担心最终的效果。Leo 说:那时候简直像在走钢丝。
庆幸的是钢丝终于走过去 了。回过头来 想,同时实现LPDDR3 和 LPDDR4 是多么英明的决策:LPDDR3 已经成熟,可以快速调试和部署,争取宝贵的时间窗口,不影响整体芯片的开发,并且可以支撑中低端手机;LPDDR4 面向未来,增强竞争力。此外,团队还解决了铜污染、MIM(金属注射成形)技术等各种问题。每个问题也是艰苦攻关才得以解决。
麒麟 950:终于站上工艺最前沿,这是整个中国半导体产业的创举和骄傲
最终,华为在 16nm FinFET 工艺上,在 2014 年 4 月实现业界首次投片—在海思的网络处理器 Phosphor 660(它就是现在的鲲鹏 920 的前身)上,2015 年 1 月实现量产投片—在麒麟 950 上,并于 10 月实现量产发货。麒麟 950 终于实现了 16nm FinFET 工艺的率先商用。从 FinFET 技术概念的提出,到今天 16nm FinFET 技术在华为麒麟芯片得到商用,20 年的过程艰难又曲折。
自此,海思开启工艺领先之路。麒麟 960 第一次在封装工艺上站上业界最前沿,并且其安全性达到了金融级安全标准。2016 年 11 月,麒麟 960 荣膺第三届世界互联网大会「领先科技成果」。麒麟 970 采用了当时业界最顶尖的 10nm 工艺。但更重要的是,麒麟970 首次在手机 SoC 中集成了专用 NPU(嵌入式神经网络处理器),开启了端侧 AI 行业先河,其难度也是非常大的。麒麟 980 是业界首款 7nm 工艺的手机 SoC 芯片。7nm 相当于 70 个原子直径,逼近了硅基半导体工艺的物理极限,麒麟 980 实现了在针尖上翩翩起舞。
ISP:全球人才布局,麒麟拍照如何做到从追赶到一骑绝尘?
2013 年夏天的一个周末,在法国海边小城尼斯,Joe 和 8 位「居家好男人」一起「组团」去家具城买家具,他们买了若干桌子、椅子、柜子等,用自己的私家车运到空空如也的办公室,卸货,组装,忙得不亦乐乎。终于,他们拥有了像样的办公环境。
那天正好是中国的传统节日端午节。Joe 去超市给法国同事们买来了粽子,想让他们尝尝中国的传统美味。法国同事们对中国文化和美食非常感兴趣,让 Joe 觉得好笑又温暖的是,因为是第一次吃粽子,他们不知道粽子皮能不能吃。作为图像图形学的科学家,Stephen 解决这个问题的办法是:试一下。他咬了一口,觉得粽子皮太硬了,于是得出结论:应该不能吃。
他们是麒麟芯片拍照团队的成员。
在麒麟 950 之前,华为没有自研的 ISP。早在 2011 年,就有人反映华为手机拍照功能不尽如人意。在一次高层会议上,任总问海思总裁何庭波:「为什么华为手机的拍照不强?」何庭波说:「我们缺乏自研 ISP。」任总说:「为什么不投资做自研 ISP?」何庭波说:「没钱。」任总说:「没人投,我投!」
经过多方论证和准备,2012 年,麒麟团队终于启动了自研ISP 的立项,商用目标是 2015 年的麒麟 950 及 Mate 8 手机。随后,ISP 团队、3A(自动对焦、自动曝光、自动白平衡)算法团队和 PQ(图像质量)团队开始筹备和构建,但还是缺人,缺专家。
2012 年,TI 解散了他们的 ISP 团队 OMAP(TI 的开放式多媒体应用平台)。听到这个消息,负责芯片研发的老大 George 第一时间飞到海外,希望将 TI 的 ISP 团队吸纳过来。可是,他见了 OMAP 在全球不同城市的人,都没有收获,很多优秀的人才要么已经被其他公司抢走,要么就是不符合海思的要求。George 很失望。正在这时,一位朋友告诉他,TI 在法国尼斯还有个团队,可以去碰碰运气。于是 George 立即飞往尼斯。这次运气不错,George 与温文尔雅、思维缜密的 Stephen 相见恨晚,力邀其加盟。自此,ISP 团队正式组建,除尼斯外,还有北京、深圳、上海、日本等团队,大约 100 多人,全力投入 ISP 技术攻关。Robin 和 Joe 就是那个时候从其他团队抽调过来的,Robin 担任 ISP 芯片团队主管,Joe 是SE(系统工程师)。
Joe 于 2013 年 5 月去尼斯,与 Stephen 等 8 位同事并肩作战。刚开始的时候,没有办公室。大家在一个公共写字楼里租了一间大约 20 平方米的会议室,里面只有一张会议桌,9 位同事围着这张桌子办公。没有网络,大家只能靠手机的无线信号网络工作。这种情况持续了一个半月左右,办公地点终于定了下来,有了自己独立的办公室,但里面什么都没有,也没有行政人员帮忙。按照当地的办事流程,这些都配齐,可能还要两三个月,于是就出现了文章开头所描述的场景:大家干脆自己去家具城买办公家具, 自己动手组装。这期间,Joe 与尼斯团队一起经历了跨国工作的磨合期—大家来自不同的国家,面临语言障碍和文化差异,粽子皮能不能吃,只是文化差异的一个小缩影。最终,大家克服语言障碍、团队熟悉度不足、工作习惯和环境差异等问题,形成了协同、高效的战斗力和良性的工作氛围。
大家都很关注自研 ISP 的成像效果,不同部门的人也都在积极配合。Robin 回忆,当时华为终端部门对麒麟自研 ISP 非常重视,硬工部老大亲自坐在电脑前,一张一张地对比图片成片质量。秘书们义务帮忙,进行图片盲测,对麒麟芯片以及其他手机拍摄的图片进行对比和排序,发现有不好的,及时返回给算法改进。
用户拍照体验好不好,除了 ISP 芯片本身,软件和算法解决方案也至关重要。Robin 和 Joe 的芯片团队已工作了近两年,而大量的解决方案软件和算法亟待开发或成熟,时间已非常紧张。
2015 年 4 月,Roc 加入拍照团队,担任麒麟拍照解决方案研发主管,那时距离自研 ISP 回片时间不到一个月,距离首产品 Mate 8 手机商用也不到半年。他紧急整合解决方案软件、算法、PQ 团队,并与 ISP 芯片、终端、2012 媒体工程部等兄弟团队集中队伍、协同作战。开始时拍照的体验很不理想,功耗、性能、基础效果体验都大幅度落后竞品,他带领联合团队持续开发、攻关和优化,在 Mate 8 上市前的半年时间里,经常每天晚上 11 点开晚例会,每月休整 1~2 天,终于功耗、性能、基础效果体验的问题都陆续得到解决,拍照体验的竞争力开始浮出水面。
麒麟、巴龙发展历程图(截止到麒麟 810)(图片来自:《熵减:华为活力之源》)
经过 3 年多的艰难攻关,在 2015 年推出的麒麟 950 上,海思第一代自研 ISP 正式亮相。首产品即商用,这在海思历史上还是很少见的,但这次自研 ISP 不负众望,支持 14bit 双 ISP,吞吐率性能提升 4 倍,高达 960MPixel/s(每秒百万像素),让 Mate 8 手机拍照效果实现了大幅提升。但 Roc 的团队几乎一口气都没有歇,立即投入 P9 的拍照能力的攻关。它们两个最大的不同是:Mate 8 只考虑单摄像头,而 P9 是双摄像头,所以需要修改架构。终于,到第二年第一季度,自研 ISP 技术与徕卡双镜头「双剑合璧」,助力 P9、P9 Plus 成为 2016 年的明星手机产品,黑白彩色双摄开启了华为手机拍照优势的新篇章。
当时一家著名分析机构的首席分析师如此评价麒麟自研 ISP:「这比买商用 ISP 肯定更贵,但值得。」
事实证明一切,麒麟 960 拍照性能继续提升。麒麟 970 不仅ISP 性能得到提升,还开创性地融入了 AI,搭载麒麟 970 的华为 Mate 10 和 P20 手机都分别冲上了 DxOMark(法国知名图像处理软件 DxO 公司推出的成像质量排行榜)榜单第一;而 P20 pro 更是在 DxOMark 榜单第一的位置上稳居一年多,直到被后来的搭载麒麟 980 的 P30 pro 超越。
唯坚持,得突破。选择最难走的道路,看最美的风景,这需要智慧和勇气,更需要巨大的努力和付出。每一代麒麟的演进, 都「太难了」,但即使是在最难的时刻,团队也没有放弃对创新的追求。麒麟为什么能成功?是因为大家长期坚持追求三个词:
Focus(聚焦)、Persevere(坚持)、Breakthrough(突破)。
(注:文中 Julian、Paul、George、William、King、Sean、Benjamin、Orion、Jerry、Jim、Andrew、Robin、James、Jary、Joe、Leo、Roc 等均为化名。他们可能不是特定的某个人,而是这么多年来矢志奋斗的麒麟和巴龙团队的缩影。
本文初稿由林江艳主笔,陶玉柳、董国立、欧阳飞、田书丽等进行了补充。)
(本文整理自《熵减:华为活力之源》华为大学编著,任正非亲自作序推荐,版权归作者及本书所有,转载请务必注明作者及作品出处)
,
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com