华为芯片20年
华为1991年从成立ASIC设计中心起,到2004年成立海思半导体,直至成为中国自主芯片设计的代表,那么华为究竟做了哪些芯片呢?
从大类上看,华为主要设计了五类芯片:
1、SoC芯片
2、AI芯片
3、服务器芯片
4、5G 5、其他专用芯片。 华为芯片全景图 1. SoC芯片(麒麟系列):手机SoC芯片一直是华为的主力研究,至2018年8月31日推出的麒麟980处理器以及预计今年下半年将推出麒麟985芯片,华为手机芯片已经达到世界一流水平。 2. AI芯片(昇腾系列):2018年10月10日,在华为的HC大会上发布了昇腾910和昇腾310两款AI芯片,分别采用7nm工艺制程和12nm工艺制程。昇腾系列AI芯片采用了华为开创性的统一、可扩展的架构,即“达芬奇架构”,实现了从极致的低功耗到极致的大算力场景的全覆盖。 3. 服务器芯片(鲲鹏系列):华为优化调整设计了其合作伙伴ARM授权提供的技术,在2019年1月7日发布了鲲鹏920以及基于鲲鹏920的泰山服务器、华为云服务。 4. 5G通信芯片(巴龙、天罡系列):华为的5G芯片主要分为终端芯片(巴龙系列)和基站芯片(天罡系列)。巴龙系列是手机终端基带芯片,一直是华为手机的专用芯片。2019年1月24日,华为推出业界首款面向5G的基站核心芯片(天罡芯片)和5G多模终端芯片(巴龙5000)。 5. 其他专用芯片:(路由器芯片、NB-IoT芯片、IPC视频编解码和图像信号处理的芯片等):凌霄系列主要用于家庭接入类的产品;利尔达NB-IoT模组为全球领先的窄带物联网无线通信模块;IPCSoC芯片涵盖了视频监控的核心技术——ISP技术和视频编解码技术。 所有手机芯片方案的核心都是两块:AP和BP。AP即Application Processor(应用处理器),包括CPU(中央处理器)和GPU(图形处理器),BP即Baseband Processor (基带处理器),负责处理各种通信协议,如GSM、3/4/5G等。此外,还有射频等核心单,它们组合在一起构成了SoC芯片集成电路的芯片。 SOC可以有效地降低电子/信息系统产品的开发成本,缩短开发周期,提高产品的竞争力,是未来工业界将采用的最主要的产品开发方式。华为的SOC芯片是由海思半导体来设计和研发的。 华为海思芯片SOC结构 海思芯片的发展经历了较长的一段时间。 2004年,华为海思开始研发手机芯片,并于2009年如期推出一个GSM低端智能手机解决方案,使用的是Windows mobile操作系统。该方案中BP技术是自研的,技术源自华为的GSM基站。AP芯片名叫K3V1,工艺制程上采用的是110nm,落后于当时竞争对手采用的65/55/45 nm制程。加上操作系统上选择的是日落西山的Windows Mobile,因此第一代海思芯片性能不理想,很快遭到市场淘汰。 2012年,华为发布了K3V2,号称是全球最小的四核ARM A9架构处理器。与K3V1最本质的不同是K3V2采用了ARM架构,支持安卓操作系统而不再是Windows Mobile。同时期的高通APQ8064和三星Exynos4412都已经用上了28、32nm的工艺。K3V2工艺是40nm,发热量大,游戏的兼容性不强,也没有获得市场认可。 2015年5月,全球第一款采用16nm FinFET Plus工艺制造的中低端芯片麒麟650发布,带领荣耀5C、G9继续破千万销量。 2015年8月20日,麒麟芯片出货量突破1亿颗两个月内日均出货29万颗。 2015年11月,华为发布麒麟950 SoC芯片,该芯片的综合性能再次飙至第一,凭借性能优势和工艺优势,成功领先高通半年。该款芯片陆续用在华为旗下的Mate 8、荣耀8、荣耀V8运营商定制版和标配全网通版等手机上。 2016年4月,发布麒麟955 SoC芯片,把A72架构从2.3GHz提升到2.5GHz,带领P9系列成为华为旗下第一款销量破千万的旗舰机。 2017年9月2日,华为发布人工智能芯片麒麟970并用于华为Mate 10,在2017年10月16日在德国慕尼黑正式发布。截至目前,华为已经成功发布了最新的新一代继任者,第二代AI芯片麒麟980,将旗舰手机CPU的水平再次提升到了一个新高度。 华为海思芯片的历史沿革 目前市场上生产手机芯片的几大龙头分别是苹果,华为,高通和三星。 苹果A系列:苹果的A12处理器是全世界第一款7纳米的芯片,性能稳居第一,不过由于苹果没有自主基带技术,GPS/WIFI芯片都需要外购,所以A系列芯片从来不含基带部分,也无需承担GPS/WIFI的功能; 华为麒麟系列:华为的麒麟980,采用最先进的八核心设计,最高主频高达2.8GHz。预计麒麟990还会继承5G基带,实现真正5G全网通; 高通骁龙系列:发布的骁龙855处理器,它采用全新的Kryo 485构架,7纳米工艺技术,图形渲染提升20%,CPU性能提升45%,最高主频2.84GHz,也是十分强大; 三星Exynos系列:Exynos 9810处理器是三星自主研发M3架构,拥有4个2.9GHz的M3大核和4个1.9GHz的A55小核,10纳米制作工艺。 全球各大手机芯片厂商对比 服务器是一种高性能计算机,作为网络的节点,存储、处理网络上80%的数据、信息,因此也被称为网络的灵魂。服务器最核心的部位就是服务器芯片,可以说是整个服务器的大脑。但是正是因为它的重要性,也决定了它的技术难度是不容小觑的。 2019年1月7日,华为发布了鲲鹏920(Kunpeng 920)服务器芯片,该芯片基于ARMv8指令集研发,采用7nm工艺,最多可达64核心,支持8通道DDR4内存及PCIe 4.0协议,因此拥有其独特的性能优势:1. 性能跑分超出之前业界标杆产品的25%,能效提高30%,但功耗反而降低;2. 双端口设计使得这款芯片的速率达到业内主流产品的两倍;3. 鲲鹏920所搭载的内存宽带超过业界主流46%,网络宽带提升四倍。华为鲲鹏芯片目前在性能上已经达到行业领先水平。 服务器芯片市场是利润丰厚的市场,之前的服务器芯片技术一直作为科技核心被美国所垄断,根据DRAMeXchange数据,全球97%的服务器用处理器为X86架构,因此英特尔是服务器领域绝对的霸主。鲲鹏920芯片的推出对于国产服务器水平的飞跃也起着极为关键的作用。尽管华为宣布鲲鹏920处理器仅供自用,但参考麒麟系列处理器发展历程,我们有理由相信,通过自采自用鲲鹏920处理器能够让ARM 架构处理器得以发展壮大。考虑到服务器市场主要是针对企业用户,这一过程将会比手机处理器面临的困难更大、花费的时间更长。 华为服务器芯片性能与其他厂商对比 除了鲲鹏920处理器,华为还推出了三款泰山(TaiShan)系列服务器,使用的就是鲲鹏920,包括TaiShan 22080、Taishan 5280/5290、TaiShan X6000,分别面向均衡服务器、存储服务器及高密度服务器市场。 目前芯片发展开始面临一个矛盾的窘境:一方面处理器性能面临物理极限,无法按照摩尔定律进行增长;另一方面数据体量随着云、深度学习、AI等新应用兴起,对计算性能要求超过了“摩尔定律”增长的速度。处理器自然发展本身无法满足高性能应用的需求,出现了技术缺口。在这种情况下,采用专用协处理器的异构计算方式来提升处理性能成为最为理想便利的解决方案。 异构芯片在应用中通常有CPU、GPU、FPGA、ASIC四种架构选择,可提供专门的硬件加速实现各种应用中需要的关键处理功能,足以满足AIoT平台下对于芯片个性化需求。CPU与GPU是常见的通用型芯片,CPU适合逻辑控制、串行运算与通用类型数据运算,GPU拥有大规模并行计算架构,擅长处理诸如图形计算等多重任务。由于深度学习通常需要大量的但并不复杂的训练算法,因此相比CPU而言,GPU更适合深度学习运算。FPGA(现场可编程门阵列)是一直可编程的半定制芯片,具有并行处理优势,并且也可以设计成具有多内核的形态。FPGA最大的优势在于其可编程的特性,用户可以根据需要的逻辑功能对电路进行快速烧录来实现自定义硬件功能。 相较于CPU、GPU等通用型芯片以及半定制的FPGA来说,ASIC芯片的计算能力和计算效率都直接根据特定的算法的需要进行定制的,因此ASIC芯片具有体积小、功耗低、可靠性高、计算性能高、计算效率高等优势。所以在其所针对的特定的应用领域,ASIC芯片的能效表现要远超CPU、GPU等通用型芯片以及半定制的FPGA。 AI时代的四种异构芯片选择 2018年,华为发布了两颗云数据中心AI芯片:单芯片计算密度最大的昇腾910和极致高效计算低功耗的AI SoC昇腾310。 昇腾910属于Ascend Max系列,用于数据中心服务器,性能表现超过英伟达最强芯片AI V100,是全球已发布的单芯片计算密度最大的AI芯片。基于昇腾910华为还将推出大规模分布式训练系统昇腾Cluster,链接1024个昇腾910芯片,构成AI计算群,提供超高级AI计算能力,计算能力最高可达256P,使AI的训练速度达到崭新的水平。 昇腾910,昇腾cluster与现有产品的算力比较 昇腾系列AI芯片采用了华为开创性的统一、可扩展的架构,即“达芬奇架构”,实现了从极致的低功耗到极致的大算力场景的全覆盖,目前全球市场上还没有其它架构能做到。 “达芬奇架构”能一次开发适用于所有场景的部署、迁移和协同,大大提升了软件开发的效率,加速AI在各行业的应用落地。 华为在2018年全联接大会上重点介绍了全栈全场景AI解决方案。全栈全场景AI解决方案是华为曾经发布了面向政府、企业的华为云EI,以及面向智能终端的HiAI这两套解决方案的整合。 纵轴全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。 横轴全场景包括消费类终端、公有云、私有云、各种边缘计算 华为全栈全场景AI解决方案 5G是指第五代移动通信技术,是4G之后的延伸,其峰值理论传输速度可达每秒数十Gb,相对于4G的网络传输速度快了数百倍,同时,5G还拥有毫秒级的传输时延和千亿级的连接能力,是开启万物互联、人机深度交互的通讯基础。 5G相对于4G的独特优势 5G通信的技术底层是5G芯片,5G芯片主要分为射频芯片和基带芯片。 射频芯片主要用于接受和发射信号,包含PA(功率放大器)、滤波器、开关芯片等。基带芯片主要用于对传输的信号进行调制解调。华为作为全球通信设备龙头企业,拥有众多的专利储备,因此拥有强大的基带芯片设计能力,相较之下,苹果A系列芯片虽然达到世界一流水平,但是却缺乏基带芯片的设计能力,因此需要外挂第三方的基带芯片。 相对于2G、3G、4G基带芯片而言,5G基带芯片有众多设计难点。1. 多频段兼容带来的设计复杂度。2. 支持毫米波也成了5G基带芯片的一个设计难点。3. 支持的模式数增加也使得设计难度有所增加,5G基带芯片需要同时兼容2G/3G/4G网络。 在2019世界移动大会预沟通会上,华为发布了两款5G芯片,分别是5G基站核心芯片(华为天罡)和5G终端的基带芯片(巴龙5000)。 天罡芯片——业界首款5G基站核心芯片。华为天罡是全球第一个超强集成、超强算力、超宽频谱的芯片,为AAU 带来了革命性的提升,实现基站尺寸缩小超55%,重量减轻23%,功耗节省达21%,安装时间比标准的4G基站,节省一半时间,有效解决站点获取难、成本高等挑战。同时天罡芯片可以让市场上存在的大多数基站直接升级到5G,这就意味着4G升5G可以在不更改供电或者是断电的情况下直接升级,极大的方便了更新5G。 华为5G天罡芯片应用与使能概念图 巴龙5000——全球第一个支持5G的3GPP标准的商用芯片组。Balong 5000具备5项世界之最,1个世界领先:全球领先的集成2G、3G、4G的多模单芯模组;速度世界最快,@Sub-6 GHz 200MHz:下行链路速度4.6Gbps,上行速度2.5Gbps;世界首个上行/下行解耦多模终端芯片;世界首个同时支持NSA和SA架构的芯片组;世界最快的高峰下行速度@毫米波 800MHz Gbps;世界首个5G芯片上的R14 V2X。 巴龙5000它支持5G跨所有频带,提供一个完整的5G解决方案,是全面开启5G时代的钥匙,它可以支持多种丰富的产品形态,除了智能手机外,还包括家庭宽带终端、车载终端和5G模组等,将在更多使用场景下为广大消费者带来不同以往的5G连接体验。 主流生产商5G终端2018年商用CPE,2019年商用智能机 华为发布了首个基于巴龙5000芯片的5G终端产品:5G CPE Pro。这是世界上最快的5G CPE,支持Wi-Fi6技术。主要的应用场景是智能家居。5G CPE Pro可支持4G和5G双模,在5G网络下可以实现3秒下载1GB的高清视频,即使是8K视频也可以做到秒开不卡顿,为小型CPE设立了新的网速标准。 华为5G CPE Pro基本情况 本文作者:西南证券电子陈杭团队,来源:半导体风向标1.1 麒麟芯片:全球领先的国产手机SoC芯片
1.2 鲲鹏芯片:打破服务器领域垄断局面的新晋者
1.3 昇腾芯片:全栈全场景AI解决方案
1.4 5G芯片:基站和终端全方位布局