应用

技术

物联网世界 >> 物联网新闻 >> 物联网热点新闻
企业注册个人注册登录

大算力、低带宽,“周易”X2 NPU已面向市场交付

2023-04-04 09:33 物联传媒

导读:安谋科技正式发布了自研新一代人工智能处理器“周易”X2 NPU,称“周易”X2 NPU不仅在算力、精度、灵活性等方面进行了大幅提升,还针对车载、边缘计算等应用场景进行了专门优化。

由于芯片紧缺情况缓解,国际车企销量正在回升。根据统计数据,2023年2月中国汽车市场恢复,占世界汽车份额32%,中国车企的发展机会俨然来临。

此时随着车企都陆续以提高智能化水平为提高竞争力的主要手段,越来越多的摄像头、传感器等感知设备被安装进汽车中,对算力、帧率、数据安全性、人机交互能力等多方面的需求水涨船高。

从逻辑上说,智能化需要人工智能技术支撑,优秀的AI产品离不开NPU的运行支持。

3月28日,安谋科技正式发布了自研新一代人工智能处理器“周易”X2 NPU,称“周易”X2 NPU不仅在算力、精度、灵活性等方面进行了大幅提升,还针对车载、边缘计算等应用场景进行了专门优化。同时,安谋科技正式发布“周易”NPU软件开源计划,通过开放源码,满足客户更自主、更灵活的算法移植需求,携手合作伙伴共建国内NPU产业生态。

物联传媒了解到,新势力汽车品牌是“周易”X2 NPU准的重要合作伙伴,并且“周易”X2 NPU已经面向客户正式交付,预计今年会有多款搭载“周易”X2 NPU的芯片产品面世。

“最开始是支持芯片客户,之后会从生态、软件合作伙伴到应用,甚至参与或支持一些标准法规的建立。希望到2030年,能够实现支持中国自动驾驶成熟量产方案的落地。”安谋科技执行副总裁、产品研发负责人刘澍在发布会上表示。

111.png

汽车AI应用场景:区别于手机,算力和带宽需求突出

以手机拍照为例,AI应用主要是对一路视频的处理,比如去噪声、虚化背景、美颜、超分辨率等,最终的用户对象是人。

反观汽车场景,因为智能驾驶汽车均部署多个摄像头,因此AI首先就要完成多路视频的融合处理,以及还要对不同种类传感器收集来的数据进行汇总分析,支撑设备自动做出决策。

显然,落地于汽车的AI处理能力与手机或其他物联网终端相比风格迥异,突出的特征表现在“对算力有更大的需求”:

智能音箱、扫地机器人、智能摄像头等AIoT设备的算力要求一般在1TOPS-4TOPS范围内;手机、智能座舱的算力要求一般是10TOPS-30TOPS;PC的算力需求一般在45TOPS;高级驾驶辅助系统(ADAS)的算力要求则可能达到几百TOPS级别。

对照“周易”X2 NPU的产品介绍,其采用第三代“周易”架构,支持多核Cluster,最高可达320TOPS算力。

如何做到算力提升?

据安谋科技NPU产品总监杨磊介绍:“周易”X2有一个集群(Cluster)的概念,有多个NPU的核,比如说有1到4个核,这样就构成了一个Cluster,这样算力就有成倍的提升。Cluster内部有总线的互联,用于数据的沟通和维护,也有内部的存储系统,协调不同的核间的数据通信。再往上一级还支持多个Cluster,这样整个算力又可以成倍向上提升,所以“周易”X2 NPU这代产品是通过了多核构成Cluster,多个Cluster构成了一个子系统的方案完成大算力产品形态的交付。其中有一个很核心的功能,就是任务调度器,它可以同时调度多个Cluster的多个核心。

另外,随着汽车和手机图像数据的分辨率越来越大,高分辨率不仅对算力要求提升,对带宽的需求也是成倍增加。节省带宽同时成为一项重要的需求。

“通过采用i-Tiling的技术方案,‘周易’X2 NPU大幅减少了带宽需求,降低了系统成本。i-Tiling的原理是把一个很大的图片拆分成若干个小块,这样每一个tile就变得很小,小的好处是可以在芯片上,也就是芯片内部的memory缓存在内部,这样就不需要把这个数据从外面的设备中做读写操作,从而从根本上节省了对外部带宽的需求。”杨磊说,“我们采用了这样的技术之后,就可以把40G带宽缩减到只需要4G带宽就可以完成这个工作。”

222.png

图:“周易”X2 NPU主要产品特征

另外,“周易”NPU不只是提供硬件的NPU IP,还支持提供上层一整套完整的“周易”Compass软件平台,通过平台中模型编译器等工具组件调试性能、分析异常。汽车领域客户也可以基于平台自定义算子,构建具有独特优势的技术或方案。

行业碎片化情况下,开源计划打开需求“白盒”

安谋科技统计了过去一年里国内60个用到NPU的芯片项目,发现其中大概55%的项目用的是自研NPU,剩下部分是基于IP的解决方案。

尤其在汽车场景,起因是硬件终端企业高度重视算法和数据的安全性,假设在软件部署过程中遇到问题,仍然希望独立完成需求的开发和测试,对将资源开放给芯片厂或IP公司存在顾虑。当企业都选择自建生态、自研芯片时,可以想象行业碎片化将要加重,应用繁荣也将受到阻碍。

为此,企业更强烈的诉求是“白盒开发”:即软件部署的过程中工具链是以源代码的形式提供的,他们可以基于NPU做出新的算子,并且独立实现。

“周易”NPU软件开源计划应运而生。

开源好处:在满足合作伙伴更自主、更灵活的算法移植需求的同时,进一步提升软件开发效率,避免重复造轮。

开源内容:在“周易”NPU软件开源计划下,安谋科技已率先对外开放NPU中间表示层规范、模型解析器、模型优化器、驱动等,并向相关合作伙伴提供“周易” Compass软件平台,包括软件模拟器、调试器、C编译器等在内的多种软件工具。并且这也只是NPU开源计划的第一步,后续还将逐步开放更多资源,如模型量化、算子实现等源代码。

333.png

图:“周易”NPU软件开源计划(绿色部分是第一阶段开源内容)

开源成果:“周易”NPU软件开源计划已经有第一批合作伙伴率先加入,其中不乏来自AIoT、智能汽车、智能操作系统等领域的明星企业。

杨磊指出:“最新的一代V3架构是免费授权的。从扩大生态的角度,合作伙伴不一定非要用安谋科技的NPU,可以通过参与开源的项目来自己做NPU,从而共建一个软件的生态。”

另外,2022年7月起安谋科技开启了生态伙伴计划。不仅关注NPU,安谋科技整个自研矩阵都是“计划”中的一部分,面向产业链上下游所有可能的参与者,帮助他们构建产品及方案。截止目前,共有40多家合作伙伴参与到“计划”中,包括汽车领域内的芯片提供商、tier1、tier2和算法厂商,AIoT、高性能计算等领域的合作伙伴。

安谋科技持续推进“产品自研”之路

根据物联传媒了解,“周易”NPU 2018年立项,2019年第一颗搭载“周易”的芯片成功面世。截止目前,“周易”推出了Z系列和X系列两大类产品:

Z系列主要面向AIoT场景,特征是算力要求不高、对成本敏感,比如智能音箱、扫地机器人、电视机、机顶盒、安防摄像头等。

X系列主要面向大算力场景,例如手机、PC、汽车的智能座舱、自动驾驶汽车等。

值得一提的是,无论是面向新兴的AIoT市场还是更大规模计算领域,Z系列与X系列实际共用了一套NPU架构,例如本次“周易”X2是第一款基于V3架构的NPU,相比于V1、V2架构,V3架构更强调并行性和可扩展性,但V3架构支持向前兼容V1、V2的软件。安谋科技的一站式服务,也体现在从硬件IP到软件平台的全面覆盖上。

安谋科技NPU研发高级总监孙锦鸿为此表示:“安谋科技拥有超过130位工程师组成的NPU研发团队,负责开发包含硬件和软件的NPU全栈研发,人员主要分布在上海、深圳、北京。”

而从公司整体业务发展方向来看,安谋科技作为芯片IP领域的明星企业,近5年来都坚定自研产品路线,构建了“周易”NPU、“星辰”CPU、“山海”SPU、“玲珑”ISP、“玲珑”VPU 五大产品线,自研IP已经向超过160个本土客户进行授权,客户基于自研IP的芯片出货量已经超过2亿颗。

对这家公司的未来发展,安谋科技执行副总裁、产品研发负责人刘澍强调:

“我们不是追求更多、更杂,而是更精、更专。科技行业是日新月异的,国际上的领先公司都在向更高的领域、更个性化的领域突破。作为中国科技产业的一份子,安谋科技同样希望在更新、更高性能的领域如智能汽车产业、边缘服务器产业等贡献力量……”