应用

技术

物联网世界 >> 物联网新闻 >> 物联网热点新闻
企业注册个人注册登录

行业观察——边缘AI芯片架构的思考:为何可扩展GPU架构值得关注

2025-04-18 15:18 北京华兴万邦管理咨询有限公司

导读:在算法不断演化的时代,架构的“适配力”远比一时的TOPS值更重要。

作者:北京华兴万邦管理咨询有限公司  翔煜  商瑞

 

随着大模型在不断演进的同时将推理应用大规模推向边缘和端点设备,以及物联网智化、具身智能、AI智能体(AI Agent)和物理AI等新的AI应用场景和模式的快速涌现,AI赋能设备的主控芯片设计师正面临着全新的挑战。尤其是对于边缘和端点设备,它们既可能成为大模型的承载设备,也可能是用智能去为应用提供更好的核心功能,新的产品定义方向使主芯片架构师不得不去思考,其芯片在如何应对大模型快速演进的同时,还能实现用智能手段赋能传统应用和实现新兴功能

因此,在追求极致性能、功耗和面积(PPA)的模式之外,架构师们需要富有前瞻性地去选择高性能、高灵活性、可升级和开发者(生态)友好的架构。我们不妨先回顾AI发展的历程,从感知AI到生成式AI,再到智能体AI和物理AI,其应用场景不断拓展。在感知AI阶段,Al技术在语音识别、深度推荐系统和医学影像等领域取得显著进展;生成式AI在数字营销和内容创作方面发挥了重要作用;智能体AI为编程、客户服务、患者护理提供助力;物理AI推动了自动驾驶汽车和通用机器人发展。

 

伴随着AI技术的发展,在传统的CPU、GPU和FPGA等计算技术之外,诸如TPU、NPU 和DPU等专门针对特定算法或者模型的新型硬件数据处理加速器也开始出现,它们带来高效率因而在许多场景中得到了应用。与此同时,AI技术不断向新的场景和应用广泛渗透,使得面向特定模型和场景的NPU等架构难以应对模型的变化和场景的多样化,从而使传统的 灵活性更高的CPU和GPU架构依旧在计算领域占据重要地位。

但是,AI技术的进步和新场景的出现,正在迫使半导体知识产权(IP)提供商和芯片设计公司快速做出变化,无论是采用传统架构的厂商,还是新的xPU提供商都需要尊重产业规律。华兴万邦亦认为,从技术经济学和企业实际经营来看,高额的研发费用和市场营销费用是多数芯片设计企业面临的最重要费用,而灵活可扩展的架构可以覆盖更广的市场并可以实现更长的产品生命周期,它们是摊销这些费用以提升盈利能力的重要手段

 

架构创新迫在眉睫

Imagination Technologies中国业务发展负责人黄音在慕尼黑电子展AI技术创新论坛演讲中分析道:“当前主芯片设计不仅需要芯片企业投入大量研发资源,更需要协调生态合作伙伴的技术路线。面对AI算法快速迭代的挑战,行业在探索创新架构的同时,仍需重视经过长期验证的基础计算架构价值。以GPU为例,其架构在保持高并行计算优势的同时,新一代设计正通过模块化扩展能力(如可配置Shader集群、弹性内存子系统)来适应不同AI工作负载需求。作为专注图形计算领域的IP厂商,Imagination观察到,理想的AI加速架构需要在三个维度取得平衡:支持细粒度并行的计算单元设计、满足算法动态调整的可配置性,以及维持开发工具链的持续兼容性。”

 

“扩展能力是Imagination GPU开发演进的方向:在具备强大的渲染能力的同时,融合AI并行计算能力,在边缘AI的场景下能提供灵活又高效的算力。所以,Imagination将帮助芯片设计人员发现真正的破局点,帮助他们去构建一个可以持续适配模型和算法演进、以及支持新兴应用的架构平台——而不是为某个模型做一次性的‘专用硬件定制’,从而避免硬件(处理器)总是费力费钱跟着算法跑的问题。”黄音补充道。

Imagination正在帮助客户导入更加灵活的架构。以该公司不久前发布的Imagination DXTP GPU IP为例,它采用了先进的平衡架构,增加了缓存和系统级带宽,实现了更高的持续性能,几何吞吐量提高50%,不仅能够轻松同时处理图形和计算任务,而且其功率效率还较其前序产品提升了20%,为边缘AI提供了理想的GPU平台。DXTP  GPU已经被全球知名科技公司采用,用于对AI 多数据类型处理、计算任务加速和本地内存的支持。

 

 

三个落地是成功的关键

当然,对于芯片设计师而言,这需要做到三个必须“落地”,即模型算法落地、垂直功能落地和开放生态落地。针对模型算法落地,Imagination的突破点是坚持构建一个通用可编程的并行架构平台,并通过开放的编译器和推理后端(backend),支持客户软硬件协同设计和提供适配路径,帮助其客户把诸如Transformer、Diffusion类模型和前沿算法快速落地到GPU上。为此该公司将帮助客户认识到在算法不断演化的时代,架构的“适配力”远比一时的TOPS值更重要。

垂直功能落地方面,Imagination在移动、汽车、云和桌面等领域深耕了数十年,积累了丰富的经验和许多创新的支撑性技术,可以帮助客户去避开其中的潜在风险和快速在领域内创造优势,这可以从该公司的D系列GPU IP的产品功能创新上可以看出其垂直领域功能落地能力。例如,DXT GPU 是Imagination面向移动应用、高端游戏和专业图形设计等应用推出的新一代GPU IP,它不仅率先在移动平台上提供了可扩展的光线追踪功能,还有2D双速率纹理映射等多项可以提升处理速度和优化内存带宽的技术。

为了帮助桌面和数据中心客户实现高性能的云端GPU创新解决方案,Imagination推出了DXD GPU IP,首次将Imagination的API覆盖扩展至DirectX,这一举措显著提升了DXD与Windows平台上的应用程序和游戏的兼容性。同时,Imagination 的硬件虚拟化技术 HyperLane支持在单个GPU上安全且独立地运行多个操作系统,极大地提升了服务器的使用效率,降低了云游戏的运营成本,并为云游戏行业的发展带来了创新的运营模式。

Imagination为汽车智驾芯片提供的专用IP是该公司支持芯片设计企业垂直功能落地的又一个典范,血的教训换来了更加严格的安全法规,使智驾芯片设计公司在算力、生态和生命周期之外,必须去认真去考虑功能安全性。为了帮助芯片设计企业满足全球汽车智能化需求,Imagination推出了DXS系列GPU,该系列IP不仅为智能驾驶舱和先进驾驶辅助(ADAS)等应用所需SoC带来匹配的算力,而且专为诸如汽车处理器等对功能安全性要求极为严苛的应用,开发了结合GPU的计算模式特点并大幅降低成本的分布式功能安全机制(DSM)并通过了ASIL-B认证。这为汽车和工业等越来越多需要GPU的图形处理能力和计算能力的电子系统带来了巨大的创新。

 

Imagination在支持客户实现产业生态落地方面也同样颇费心机,其GPU IP全面支持OpenCL、SYCL、Vulkan Compute等开放标准,与PyTorch、TensorFlow等主流框架完美兼容。如Imagination通过与安卓生态系统合作,优化对LiteRT的支持,为开发者提供丰富工具和示例,便于开发高性能AI应用,充分展现了其GPU架构的适配能力。这种开放生态简化了新硬件与设备的集成流程,避免供应商锁定问题,使客户能在不同平台轻松部署。通过整合多方资源,Imagination可帮助客户实现协同优化,提升资源利用率和执行效率,巩固了其在GPU市场的领先地位,为企业应对AI算法和产品快速迭代提供坚实支持。

 

总结与展望

大模型的下沉、算法创新和边缘及端侧AI的崛起为基于 GPU的主控芯片带来了新的发展契机,在AI一体机、新物联网、智能安防和自动驾驶等领域已经出现了巨大的需求,这些设备对高性能的图形处理和AI推理同时都有越来越多的需求,因此更灵活和可扩展的架构可以使芯片设计公司的产品覆盖更广泛的市场领域,同时可以拥有更长的产品生命周期,也就有了更高的潜在盈利能力。