NPU算力芯片的设计挑战与解决方案

时间：2023-06-09 15:01:09

NPU（神经处理单元）是一种针对深度学习任务进行优化的处理器，具备高度并行计算和低功耗的特性，能够快速高效地执行神经网络模型的推理和训练任务。设计具有竞争力的自动驾驶NPU需要同时理解通用NPU和ADAS NPU所面临的挑战。通用NPU和超大算力芯片面临的主要挑战可以从功耗墙、内存墙和利用墙等方向着手分析问题和挑战 .

NPU芯片技术与市场发展杂谈指出，为了有效利用NPU，一个重要的挑战是实现高资源利用率，减少非必要的运算。酷芯NPU支持结构化/非结构化稀疏计算，可以裁剪计算中的0值或模型中最不重要部分的冗余，就可以保证降低不必要的存储和计算，提升机器学习模型部署时的性能.

ADS-NPU芯片的架构设计，同样需要用【见微知著】的能力，来解决异构计算、稀疏计算、逼近计算、内存计算等几类常见的难题与挑战。NPU会有百万级的并行计算单元，可以采用Spatial加速器架构来实现，即Spatial PE空间单元阵列通过NoC，数据总线，或跨PE的互联来实现矩阵乘运算（全卷积计算或全连接FC计算）、数据流高速交互、以及运算数据共享 .

随着NPU处理器的开发迭代，各个大厂相应推出了大算力计算平台。例如，智奇科技基于瑞芯微RK1808芯片研发了算力扩展方案，旨在进一步提高系统算力。并且，能够更加灵活地控制成本，从而提高方案的性价比 .

对于大算力NPU的硬件架构而言，其演进需要解决高并发、大吞吐等问题，针对算法的多样性需求，同样需要通过软件定义架构，来实现底层微架构硬件的可配置、可调度、可弹性扩展特性，以及顶层架构的微任务与多并行调度，提升底层PE与 .

在人工智能领域，GPU在大模型运算方面极具优势，而NPU以其低功耗、高算力将深度学习系统做到小型化，使人工智能在嵌入式机器视觉应用中大放异彩。未来对高性能计算领域的更高要求，NPU具有巨大的发展潜力 .

综上所述，设计NPU芯片需要解决功耗、内存、利用等方面的挑战。同时，为了提高系统算力，设计需要解决异构计算、稀疏计算、逼近计算、内存计算等难题。

查看更多相关的资讯

《NPU算力芯片的设计挑战与解决方案》不代表本网站观点，如有侵权请联系我们删除

精彩图文

精彩推荐

点击排行