百度用“昆仑”让中国缺“芯”的切肤之痛划上句号?百度AI开发者大会上最引人注目的发布是百度自主研发的中国第一款云端全功能AI芯片“昆仑”,其中包含训练芯片昆仑818-300,推理芯片昆仑818-100,主要面向AI大规模运算需求,这是目前为止业内设计算力最高的AI芯片,且功耗仅为100+W。
之所以最引人注目,一个是这是李彦宏亲自发布的产品;第二个是2018年“中国芯”事件备受瞩目,芯片的发布自然让人关注。不过,百度芯片发布,却不是要蹭这个热点,从百度AI战略角度来看,芯片是其一定要补齐的一环,而且在做AI芯片上百度无疑是具备先天优势的。
百度昆仑抓住新算力需求
芯片产业的摩尔定律想必大家都不陌生,通俗版的解释是每18个月同等价格的芯片计算能力会翻倍。最近几年在PC和移动等个人芯片已满足大多数计算需求时,关于摩尔定律不再生效的论调也遍地都是。
实际上,传统计算硬件还在发展,只是速率慢了。随着大数据、人工智能的崛起,需要AI运算处理的数据,差不多每24个月就至少增长一倍,建构模型的复杂度是原来的五倍,与之相关,就需要计算能力强大十倍芯片能及时跟上,这一计算能力的提升,需要算法、软件和硬件工艺相互配合共同来完成。
为了应对量级增长的算力需求,百度发布了昆仑AI芯片,参数如下:14nm工艺;260Tops性能;512GB/s内存带宽;100+瓦特功耗。昆仑AI芯片具有高效、低成本和易用三大特征,其针对语音、NLP、图像等专门优化,同等性能下成本降低10倍,支持paddle等多个深度学习框架、编程灵活度高、灵活支持训练和预测。
AI芯片不是陌生词汇,主要分为两类,一类是面向终端的有一定深度学习能力的芯片,如麒麟970、苹果A11神经网络芯片,主要是在图像处理等场景中有更强的计算能力;一类是面向云端的进行大规模AI计算的芯片,谷歌TPU已进化到3.0版本,国内有寒武纪MLU100,寒武纪已得到阿里投资,阿里在中兴被制裁后不久也宣布要自主研发Ali-NPU,称其性能将是目前市面上主流CPU、GPU架构AI芯片的10倍,而制造成本和功耗仅为一半,性价比超过40倍。
Ali-NPU尚未面世,百度昆仑芯片能对比的是谷歌TPU和寒武纪MLU100,与二者相比,昆仑不仅计算力更高,还可以适配诸如自然语言处理、大规模语音识别、自动驾驶和大规模推荐等具体场景的计算需求。且百度昆仑既能用在云端场景,又能用在终端场景,具备很强的通用灵活性。
百度做芯片是蹭热点吗?
在2018年中兴被制裁后,中国科技公司都意识到了芯片为核心的底层技术的重要性,不少公司如阿里、格力都启动了芯片项目,华为、小米等此前就在布局芯片的巨头也加大了力度,尚未做芯片的腾讯也有对应表态。做芯片,不只是给资本市场想象空间,也能大幅提升大众形象。那么,百度此时此刻发布AI芯片是要蹭热点吗?答案是否定的,因为如果要蹭热点,百度应该在中兴事件发酵的关键时期就发布芯片,而不是等到中兴问题已基本解决的今天。
许多人不知道的是,百度做芯片不是一时兴起,百度一直在积极储备芯片技术,它是中国最早部署GPU/FPGA集群的互联网公司,早在2011年,就将GPU和FPGA应用于搜索、语音、图像等核心业务,虽然不是自己做芯片,却积累了许多芯片技术,而在国际高性能微处理器研讨会hotchips上,中国历史上总共发了8篇论文,百度占了3篇。2017年百度发布了XPU,这是一款基于FPGA的云计算加速芯片,当时芯片关注度不高,百度此举在云计算行业有不小的影响,百度也是第一个发布自有芯片的互联网巨头。百度还投资了光学芯片Lightelligence,与华为、ARM、英伟达等在芯片上合作。
芯片是周期长、投入高、普及难的产业,正是因为此中国芯片产业一直没有实现对国际巨头的赶超,做CPU/GPU永远都会有几年甚至十几年的差距,而大家处于同一起跑线的AI芯片则是中国科技巨头弯道超车的机会。不过,做芯片跟做App不同,决不能一蹴而就,李彦宏对此也有清晰地认知,今年3月在两会上就曾表示:
“中国对芯片研究的投入程度还不够,而芯片在人工智能和网络安全中的作用举足轻重。这需要很多基础性的研究、长期的投入,无论是科研院所、大型国企还是民企都需要一个更好的支持机制来实现突破。”
百度不是看到中兴制裁事件后才关注芯片,才决定做芯片,工程师出身的李彦宏对技术一直有很好的感觉,百度以身作则,在芯片上低调布局了八年,一直默默地研发,才有今天的AI芯片发布。
百度也不是为了做芯片而做芯片,而是出于企业战略考量。百度战略是“夯实移动基础、决胜AI时代”,AI战略中,芯片不可或缺。从百度今年发布多款小度智能音箱来看,打造从芯片到终端到应用到云端到服务的闭环,是百度AI战略落地的一个思路。云端AI芯片也将是百度AI能力开放的重要组成部分,作为最大的AI开放平台之一,自然要在AI云端芯片上布局。
百度早已在做芯片且有成果产出,做芯片是出于企业战略出发,而不是为了蹭热点,当然,企业也要将自身利益与国家利益结合,百度成为中国AI芯片界的重量级玩家,踏踏实实地做芯片,对于中国强化底层技术特别是芯片技术有重要意义。
百度芯片未来的发展
只要肯持续大规模投入,百度大概率可以做好AI芯片。
芯片成功需要一体化的技术能力,芯片不只是半导体技术,而是多个技术的整合,A11芯片与iOS结合才能有Face-ID这样的杀手锏功能,百度做AI芯片,可与DuerOS、百度大脑算法、PaddlePaddle AI基础框架整合——这是百度自主研发的并行分布式全功能深度学习开源框架,本次发布的昆仑芯片就与PaddlePaddle深度整合,针对语音、图像、自然语言处理等百度擅长的AI技术进行优化。
芯片还需要丰富的应用场景。Win-TEL阵营的生态模式让Windows可以不断消耗Intel的芯片计算力,苹果/华为的自产自销模式也让A系列和麒麟系列芯片各有用武之地。百度有繁荣的AI生态,开发者大会上百度宣布百度AI开放平台已经开放110余项领先的场景化AI能力与解决方案,特别是智能家居和智能汽车生态, DuerOS智能设备激活量已经超过9000万,月活跃设备超过2500万,生态合作伙伴数量和既能开发者数量都稳居第一;而Apollo自开放以来已经吸引了诸如宝马、福特、现代、英伟达、英特尔、微软、博世、大陆、QNX等产业链上下游生态伙伴,同时Apollo与金龙客车合作的全球首款L4级无人驾驶巴士“阿波龙”已经下线量产。这些庞大的落地场景都可以吃掉AI芯片的性能。
百度去年发布的云端加速芯片是面向云计算行业,今年发布的昆仑芯片有更加通用的场景,不只是支持深度学习算法,也能适配诸如自然语言处理、大规模语音识别、自动驾驶、大规模推荐等具体场景的计算需求,可以说是一款通用型的AI芯片,可以承载主要的AI计算需求。
未来,昆仑系列或许会向终端发展,推出针对IoT设备的终端AI芯片,百度在IoT上正在构建自己的生态,一条主线是DuerOS形成的智能家居为主的硬件生态,其中不乏联想、美的、海尔、创维等巨头;另一条主线则是Apollo自动驾驶汽车开放平台,其中有奇瑞、长安、长城、一汽、江淮、金龙等汽车巨头。可以预见,百度AI芯片将会成为其IoT生态的基础设施,与PaddlePaddle基础框架、百度大脑AI云服务、DuerOSAI操作系统等一起给IoT设备提供全面AI能力。
芯片本身是一个不错的生意,它有清晰的商业模式,每一个智能设备都有至少一块芯片,芯片非常容易形成壁垒进而具备议价权,三大芯片巨头英特尔、英伟达和高通最新市值分别高达2339亿美元,1470亿美元和833亿美元,就证明了芯片的商业价值。对于百度来说,如果能够通过AI芯片抓住正在爆发的AI和IoT产业潮,就有望形成可观的商业回报,这意味着AI芯片对于百度来说也是一个很有潜力的新业务。
当然,正如李彦宏所言,芯片需要长期的投入和许多基础性的研究,百度距离做成芯片还有很远的路要走。好的开始是成功的一半,几年后回头再看,百度今天在国家会议中心发布的昆仑芯片,对于百度的AI战略、中国的芯片产业,都会是一个重要的开始。