时间:2023-06-09 15:01:09
NPU(神经处理单元)是一种针对深度学习任务进行优化的处理器,具备高度并行计算和低功耗的特性,能够快速高效地执行神经网络模型的推理和训练任务。设计具有竞争力的自动驾驶NPU需要同时理解通用NPU和ADAS NPU所面临的挑战。通用NPU和超大算力芯片面临的主要挑战可以从功耗墙、内存墙和利用墙等方向着手分析问题和挑战 .
NPU芯片技术与市场发展杂谈指出,为了有效利用NPU,一个重要的挑战是实现高资源利用率,减少非必要的运算。酷芯NPU支持结构化/非结构化稀疏计算,可以裁剪计算中的0值或模型中最不重要部分的冗余,就可以保证降低不必要的存储和计算,提升机器学习模型部署时的性能.
ADS-NPU芯片的架构设计,同样需要用【见微知著】的能力,来解决异构计算、稀疏计算、逼近计算、内存计算等几类常见的难题与挑战。NPU会有百万级的并行计算单元,可以采用Spatial加速器架构来实现,即Spatial PE空间单元阵列通过NoC,数据总线,或跨PE的互联来实现矩阵乘运算(全卷积计算或全连接FC计算)、数据流高速交互、以及运算数据共享 .
随着NPU处理器的开发迭代,各个大厂相应推出了大算力计算平台。例如,智奇科技基于瑞芯微RK1808芯片研发了算力扩展方案,旨在进一步提高系统算力。并且,能够更加灵活地控制成本,从而提高方案的性价比 .
对于大算力NPU的硬件架构而言,其演进需要解决高并发、大吞吐等问题,针对算法的多样性需求,同样需要通过软件定义架构,来实现底层微架构硬件的可配置、可调度、可弹性扩展特性,以及顶层架构的微任务与多并行调度,提升底层PE与 .
在人工智能领域,GPU在大模型运算方面极具优势,而NPU以其低功耗、高算力将深度学习系统做到小型化,使人工智能在嵌入式机器视觉应用中大放异彩。未来对高性能计算领域的更高要求,NPU具有巨大的发展潜力 .
综上所述,设计NPU芯片需要解决功耗、内存、利用等方面的挑战。同时,为了提高系统算力,设计需要解决异构计算、稀疏计算、逼近计算、内存计算等难题。
《NPU算力芯片的设计挑战与解决方案》不代表本网站观点,如有侵权请联系我们删除
精彩推荐