今天(6月23日),鲲云科技在深圳发布全球首款数据流AI芯片CAISA,定位于高性能AI推理,已完成量产。记者现场获悉,鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了最高11.6倍。第三方测试数据显示仅用1/3的峰值算力,CAISA芯片可以实现英伟达同类产品最高3.91倍的实测性能。鲲云科技的定制数据流技术不依靠更大的芯片面积和制程工艺,通过数据流动控制计算顺序来提升实测性能,从而实现更高的算力性价比。鲲云科技创始人、首席执行官牛昕宇现场表示,CAISA架构解决了数据流架构作为人工智能计算平台的三大核心挑战,即实现了高算力性价比、高架构通用性、以及高软件易用性。目前,以CAISA作为主芯片的星空X3加速卡已经实现量产,星空X9加速卡将于今年8月推出市场。随着首款量产数据流AI芯片的发布,CAISA将带来AI芯片研发的新方向。据悉,此次发布是深圳华强北之光黑科技系列发布的首场活动,深圳市副市长聂新平、福田区区长黄伟、福田区副区长舒毓民莅临活动现场。
超高芯片利用率
定制数据流芯片架构完成3.0升级
据了解,此次发布的CAISA芯片采用鲲云自主研发的定制数据流芯片架构CAISA3.0。CAISA3.0架构继续保持数据流技术路线的全球领先地位,指令集架构采用冯诺依曼计算方式,通过指令执行次序控制计算顺序,并通过分离数据搬运与数据计算提供计算通用性。CAISA架构依托数据流流动次序控制计算次序,采用计算流和数据流重叠运行方式消除空闲计算单元,并采用动态配置方式保证对于人工智能算法的通用支持,突破指令集技术对于芯片算力的限制。
上图为鲲云科技创始人、首席执行官牛昕宇在发布会现场。
这样,相较于上一代芯片架构,CAISA3.0在架构效率和实测性能方面有了大幅的提升,并在算子支持上更加通用,支持绝大多数神经网络模型快速实现检测、分类和语义分割部署。CAISA3.0在多引擎支持上提供了4倍更高的并行度选择,架构的可拓展性大大提高,在AI芯片内,每一个CAISA都可以同时处理AI工作负载,进一步提升了CAISA架构的性能,在峰值算力提升6倍的同时保持了高达95.4%的芯片利用率,实测性能线性提升。同时新一代CAISA架构对编译器RainBuilder的支持更加友好,软硬件协作进一步优化,在系统级别上为用户提供更好的端到端性能,可以让用户快速和低成本的部署和迁移已有算法到CAISA硬件平台上。发布会现场,牛昕宇博士还公布了由人工智能产业技术联盟(AIIA)测试的包括ResNet-50, YOLO v3等在内的主流深度学习网络的实测性能。
未来AI技术将“人人可用”
AI芯片打通“算法落地最后一公里”
据了解,鲲云科技是一家在深圳福田成长起来的高性能人工智能芯片公司,由数据流定制计算领域院士团队创立,致力于提供下一代人工智能计算平台,加速人工智能落地。2017年,鲲云科技将总部迁入深圳福田深港协同创新中心,目前在我国山东、英国伦敦设有研发中心。其明星产品“星空”加速卡已在航空、航天、电力、教育、工业检测、智慧城市等领域落地。在去年第20届高交会上,鲲云高性能AI芯片”获得高交会“优秀产品奖”;而“鲲云人工智能芯片及AI开发平台”获第四届中国硬件创新创客大赛冠军。
目前鲲云科技已与多家行业巨头达成战略合作,成为英特尔全球旗舰FPGA合作伙伴,在技术培训、营销推广以及应用部署等方面进行合作;与浪潮、戴尔达成战略签约,在AI计算加速方面双方开展深入合作;与山东产业技术研究院共建山东产研鲲云人工智能研究院,推进人工智能芯片及应用技术在山东落地。2018年成立人工智能创新应用研究院,定位于建立人工智能产业化技术平台,支持人工智能最新技术在各垂直领域快速实际落地,启动“鲲云高校计划”,开展人工智能课程培训和科研合作。除与Intel合作进行人工智能课程培训外,鲲云人工智能应用创新研究院已同帝国理工学院、哈尔滨工业大学、北京航空航天大学、天津大学等成立联合实验室,在定制计算、AI芯片安全、工业智能等领域开展前沿研究合作。
牛昕宇此前接受广州日报全媒体记者专访时曾指出,现在是移动互联网到物联网升级的关键时期,正是“人工智能算法落地的黄金期”。而人工智能算法落地要依托于一颗非常高能效的芯片,鲲云的核心技术能够解决这样一个问题。展望未来,牛昕宇说,未来AI芯片将解决“算法落地最后一公里”的问题,将推动更多用户和场景可以使用人工智能,最终让“人工智能技术变为人人可用的商品”,改变我们的生活方式。“自动驾驶的未来演进将是一个很好的案例”他说。