阿里与谷歌自研AI芯片启用新时代商用科技巨头与芯片封装工艺流程共创未来变革
在云端与终端的AI芯片领域保持领先地位,未来将面临前所未有的挑战。阿里巴巴和谷歌等互联网巨头自研AI芯片的商用不仅标志着技术突破,更是对传统芯片巨头们关系的一次重大变革。
2019年杭州云栖大会上,阿里的首款AI芯片含光800虽只需短暂介绍,却激起了外界广泛关注。这是否意味着传统芯片巨头们正被边缘?互联网企业进入自研芯片时代早已非新鲜事,但每一次推出都能吸引众多眼球。
造芯初衷
谷歌率先迈入这一领域,其2006年的考虑是使用GPU或FPGA或专用集成电路(ASIC),但当用户日益增长的语音识别需求迫使其转变。2013年,谷歌启动了一项高优先级项目,以快速生产一款定制 ASIC用于推理,并购买现成 GPU 用于训练。
目标是提高性价比10倍,为此,谷歌设计、验证、构建并部署了TPU(张量处理器),一个过程耗时15个月。2016年的I/O开发者大会上,谷歌正式发布首代 TPU,但直到2018年2月才宣布TPU服务开放给公众。此后,在同年的I/O大会上,TPU 3.0宣布推出,其计算性能提升八倍,可达100PFlops。
自研之路
阿里巴巴亦踏上了自研之旅,从1999年的淘宝起家,如今业务遍及电商、金融、物流等场景,每个场景都有不同的计算需求。淘宝拍立淘商品库每天新增10亿商品图片,用传统GPU算力识别需要1小时,对于数据中心来说,这样的时间消耗及其巨大且能源浪费严重。
因此阿里也投身于自研AI芯片之路。在2017年的云栖大会上成立达摩院,一系列研究中心联合实验室涵盖机器智能、智联网、大数据分析等多个产业领域。而在同年度还宣布成立独立半导体企业“平头哥半导体有限公司”。
两年后的云栔大会中,他们终于迎来了首款AI云端推理芯片含光800。这款产品在业界标准ResNet-50测试中表现卓越,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。在城市大脑实时处理视频监控任务中,它能够缩短延时至150ms,与40颗传统GPU相比只需4颗含光800即可完成任务,这意味着1个含光800算力相当于10个GPU。
竞合关系
科技巨头与晶圆厂之间从紧密合作演进为竞争关系显而易见,无论是在云端还是终端,都展开了激烈的竞争。一方面,由于这些定制化 ASIC 芯片更容易达到特定业务和场景下的性能和能效最优,而另一方面,即便性能弱于现有产品,只要符合自身生态支撑,就可能成为优势所在,不必完全依赖市场上的成熟产品。
雷锋网认为,这种 竞合关系不仅局限于云端,还将扩展至终端设备。此前就有报道指出,谷歌已经推出了Edge TPU边缘处理单元,以及Armed TPU AI加速卡,而阿里的C-Sky系列、高性能RISC-V架构处理器玄铁910以及SoC平台“无剑”构成了他们终端生态系统的一部分,将来会更加全面覆盖整个硬件链条,使得它们形成了一站式全栈解决方案提供商的地位,即便是在与第三方合作的情况下也是如此。
结论:
当前的情形显示出科技公司正在逐渐掌握自己的命运,不再完全依赖外部供应商,而是通过创新驱动来确保自身技术优势和经济效益最大化。不过,此举并不代表对现存行业结构带来革命性的改变,而是一个渐进式调整过程,其中既包含合作也包括竞争,最终影响的是谁能更好地适应不断变化的人工智能时代。