神经网络压缩与加速（解析神经网络压缩算法）

小多多 • 2021年12月13日下午9:29 • 杂谈

神经网络压缩技术最重要的是设计抽象层次上的发展，遵循软件算法-硬件架构-软硬件协同设计的轨迹。从软件算法角度来看，压缩深度神经网络模型一直是AI领域的一个重点研究问题。一方面，用一些新的学习表征、模型结构和学习方法，生成一个稀疏性极低的紧致神经网络模型，降低对计算能力和访存的需求。另一方面，通过修改已有的神经网络模型挤压其稀疏性。方法主要包括以下3种。（1）张量分解算法：通过满秩分解、SVD分解等方法将张量降秩；（2）结构化剪枝算法：以通道、矩阵等模型结构为粒度减少神经网络中冗余权值的数量；（3）固定位宽量化算法：统一降低神经网络模型权值参数的表达位宽。业界往往通过耦合上述多项算法以实现更高的模型压缩率。值得一提的是，这些算法可以在GPU等通用处理器上取得明显的计算性能提升。图4展示了结构化剪枝算法，以Channel、Filter、Shape等网络结构为粒度对神经网络的权重剪枝，保证了剪枝粒度大于GPU并行调度粒度（即线程组宽度），从而有效提升了GPU的执行效率。然而，若要进一步提升压缩算法的效率，如更细的剪枝粒度、更灵活的位宽设置，就不得不对硬件架构进行深度定制。这不仅增加了架构设计的复杂度，还降低了架构的灵活性，难以在模型的准确率与压缩率之间取得最佳平衡。

设计抽象层次发展脉络

从硬件架构角度来看，神经网络的执行效率与底层架构设计息息相关。DNN专用架构的优化主要针对访存，包括（1）数据流优化：通过优化DNN计算通路中的数据流，提高数据的可复用性，减少DDR的访存请求；（2）存储层次结构优化：根据神经网络中数据访问的局部性（尤其是卷积运算深层嵌套的LOOP循环），将加速器中的存储结构分级，提高神经网络的访存速度；（3）存算一体化架构设计：以各种传统工艺（如SRAM、NorFlash）或新型忆阻器工艺（如FeRAM、ReRAM、PCM和MRAM）制作器件构建存储阵列，将神经网络权值参数直接存储在阵列内部，并以模拟信号的形式并行执行大规模矩阵乘法。以典型的存算一体化硬件架构为例，向量以电压形式驱动阵列字线（行），利用电压乘以电导（按照DNN的权值对忆阻器阻值进行编程）等于电流，并且电流在位线（列）自然汇聚相加的电流定律，一次读操作即可完成向量与矩阵的乘加操作。这种方法不但提高了矩阵乘法的并行度，而且避免了反复从DDR读取DNN的权重，进一步提高了架构的能效比。然而，单纯从硬件架构中挖掘并行性和数据可复用性，能效比很快就到达极致，性能提升将会遇到瓶颈。

结构化剪枝算法

软件算法与硬件架构融合，通过更高的灵活性来获取更高的DNN压缩率成为了历史的选择。软硬件协同设计主要从以下几个角度考虑。（1）混合精度量化：使用不同的、混合的数据位宽来表示同一神经网络中的不同数据，并辅以专用加速器架构设计，以获取更高的性能收益；（2）非结构化剪枝：删除DNN中不重要的、冗余的权重（不一定非要按照某种结构删除），最大程度地挖掘DNN的稀疏性，通过专用的跳零架构4加速神经网络的推理过程；（3）硬件导向的DNN架构搜索：分析底层专用架构的特点，设计DNN模型搜索机制，搜索出一个适用于当前架构、执行效率极高的DNN架构（如层数，卷积核大小、通道数及连接，数据位宽等）；（4）基于存算一体架构的稀疏方案：存算一体化架构的执行单元通常以阵列的形式组织，非结构化剪枝产生随机分布的零，难以通过编码压缩部署在阵列上。存储权重的忆阻器件同时参与计算流，这种操作数与运算器的硬件耦合导致无法实现跳零架构。因此我们主要以规则的行、列以及块的规则形状剪枝或量化DNN模型。

存算一体化架构

未来，抽象层次上的软硬件协同设计将向更深更广的方向发展。（1）更广的任务场景，比如删除冗余令牌（token）的Transformer加速架构，面向视频时域上的稀疏性、三维点云空间稀疏性和图神经网络关系稀疏性进行压缩的软硬件协同设计。（2）从单芯片的软硬件协同拓展到异构计算架构和系统的软硬件优化。比如谷歌的万亿参数的语言模型稀疏。（3）基于模拟运算的存算一体化架构和脉冲神经网络加速器架构。

小多多创始人

0 0

宁德时代钠电池雷声大，雨点小？

配图来自Canva可画

小多多
杂谈 2021年12月13日
扫描文档是什么格式（手机扫描文件操作方法）

今天才发现，vivo手机自带”扫描仪”功能，纸质文档3秒电子化我们在平常工作中，经常会收到电子档文件，比如电子版的证书副本，那么这时候我们就需要用到扫描仪…

小多多
2021年12月13日 • 杂谈
轩辕剑之天之痕详细攻略(轩辕剑3外传之天之痕攻略图解)

在《天之痕》里面，法宝是一种非常强大的装备，并且不受等级限制，获得之后就可以一直用到游戏结束。但是法宝是散落在各个地图场景中的，有些所在的位置甚至非常隐蔽，难以让人发现，容易错过。…

小多多
2021年12月13日 • 杂谈
地产大亨王石：为什么要抛妻弃子，娶小他30岁的田朴珺为妻

王石和田朴珺已经结婚3年了，

小多多
2022年2月21日 • 杂谈
自己给空调加氟的方法(长虹空调不制冷原因有哪些)

夏季是使用空调的旺季，很多消费者觉得，家中空调不制冷是缺氟，而花钱加氟以后，为何空调还是制冷不给力？其实，并不是加氟越多越好，而很多不正规军为了赚钱，往往上来就是加10个压吧，可对…

小多多
杂谈 2021年12月13日
一键提取无水印视频(怎么保存抖音视频没有水印)

如今大家都喜欢刷短视频，很多时候我们遇到自己喜欢的视频，想要保存下来却有水印。今天就来教大家两种方法，如何给抖音视频去除水印，方法简单，一学就会。 2.这个去水印工具暂时不要退出，…

小多多
2021年12月13日 • 杂谈
dnf锻造武器在哪里（dnf100级锻造材料获取）

随着611曝光了周年庆站街活动之后，四弹的奖励已经全部爆料出来了!这次的13周年庆奖励非常的给力，光第一弹赠送的100史诗武器特选礼盒，就有+12锻8，并且100%品质的100史诗…

小多多
杂谈 2021年12月13日
3dmax不显示贴图快捷键（解决贴图不显示的问题）

我们在使用3dmax导入模型数据后，偶尔会出现贴图不显示的问题，如下图，这个问题可能让很多小伙伴深受困扰，今天带给大家几个解决办法。 1、先确认贴图路径有没有出现错误。使用快捷键 …

小多多
2021年12月13日 • 杂谈
这将是中国有史以来最昂贵（也最先进的望远镜）

6月17日，神舟12顺利发射升空，中国的第一个自主空间站–天和号，迎来它的第一批客人。 #中国人首次进入自己的空间站# 经过天宫一二号的实验，中国已经具备了独自建设空间…

小多多
2021年12月13日 • 杂谈
分布式id是什么意思（六种分布式ID生成方法）

在分布式系统中，经常需要对大量的数据、消息、http请求等进行唯一标识，例如链路追踪traceId、身份标识号、订单流水号、操作记录流水号、优惠券id等等。这个时候数据库自增主键…

小多多
杂谈 2021年12月13日
高德地图接口调用价格（高德地图api收费标准）

生活中我们最常用到的地图导航软件就是高德地图、百度地图，去某一个地方、找景点、找餐馆、第一次去朋友家找不到路，都需要用到导航软件。在使用的过程中，大家有没有困惑一个点，就是在使用…

小多多
杂谈 2021年12月13日
智慧数字经营服务商，你了解多少？

2020年疫情开始到2022年两年的时间，智慧数字经营发展迅速，越来越多的商家实现了数字化转型。

小多多
2022年2月13日 • 杂谈
游戏鼠标排行榜前十名(达尔优g60鼠标怎么拆)

相对于普通鼠标，游戏鼠标更有针对性，可以给玩家带来非常不错的使用体验。尤其是在游戏战斗中，游戏鼠标可以灵敏反应，让玩家可以快速取胜。达尔优G60牧马人游戏鼠标表面采用了透光的裂纹漆…

小多多
杂谈 2021年12月13日
杂谈

建新股份股票上市价格建新股份300107上市价格多少

建新股份（300107）股票发行价38.00，每股面值1.00，首日开盘价51.20，首日收盘价55.00，上市日期2010年08月20日。建新股份（300107）2010年07…

海淘直接
2022年7月16日
多个excel表格合并数据（excel多表合并汇总工具）

今天跟大家分享一下excel多个表格合并成一个 2.首先点击下图选项 4.选择【合并多表】 6.最后点击【确定】即可完成 7.完成效果如下图

小多多
2021年12月13日 • 杂谈

发表回复

登录后才能评论

神经网络压缩与加速（解析神经网络压缩算法）

相关推荐

发表回复