当前位置: 首页 > news >正文

全屏式网站山西运城给网站做系统的公司

全屏式网站,山西运城给网站做系统的公司,工程信息网哪个平台最好,建设专业网站哪家技术好核心计算之矩阵乘 AI 模型中往往包含大量的矩阵乘运算#xff0c;该算子的计算过程表现为较高的内存搬移和计算密度需求#xff0c;所以矩阵乘的效率是 AI 芯片设计时性能评估的主要参考依据。本文我们一起来看一下矩阵乘运算在 AI 芯片的具体过程#xff0c;了解它的执行性…核心计算之矩阵乘 AI 模型中往往包含大量的矩阵乘运算该算子的计算过程表现为较高的内存搬移和计算密度需求所以矩阵乘的效率是 AI 芯片设计时性能评估的主要参考依据。本文我们一起来看一下矩阵乘运算在 AI 芯片的具体过程了解它的执行性能是如何被优化实现的。 从卷积到矩阵乘 AI 模型中的卷积层的实现定义大家应该都已经比较熟悉了卷积操作的过程大概可以描述为按照约定的窗口大小和步长在 Feature Map 上进行不断地滑动取数窗口内的 Feature Map 和卷积核进行逐元素相乘再把相乘的结果累加求和得到输出 Feature Map 的每个元素结果。卷积到矩阵乘的的转换关系示意如下图。 其中逐元素相乘再累加的过程就是上节提到的一个计算单位MACs矩阵乘的 MACs 数对最终性能具有重要影响。通过将输入数据Feature Map和卷积核数据进行重排卷积操作本质上可以等效理解为矩阵乘操作。 假设卷积的输入和输出的特征图维度用(IH, IW), (OH, OW)表示卷积核窗口的数据维度用(KH, KW)表示输入通道是 IC输出通道是 OC输入输出特征图和卷积核数据维度重排的转化对应关系如下公式对输入数据的重排的过程称为 Im2Col同理把转换后矩阵乘的数据排布方式再换回卷积输入的过程称为 Col2Im。 i n p u t : ( I C , I H , I W ) → ( O H ∗ O W , K H ∗ K W ∗ I C ) f i l t e r : ( O C , K H , K W , I C ) → ( O C , K H ∗ K W ∗ I C ) o u t p u t : ( O C , O H , O W ) → ( O C , O H ∗ O W ) \begin{align} input:(IC, IH, IW)\rightarrow(OH*OW, KH*KW*IC)\\ filter: (OC, KH, KW, IC)\rightarrow(OC, KH*KW*IC)\\ output:(OC,OH, OW)\rightarrow(OC,OH*OW) \end{align} ​input:(IC,IH,IW)→(OH∗OW,KH∗KW∗IC)filter:(OC,KH,KW,IC)→(OC,KH∗KW∗IC)output:(OC,OH,OW)→(OC,OH∗OW)​​ 更具体的假设卷积核的维度(2, 2)输入特征图维度(3, 3)输入和输出通道都是 1对一个无 paddingstride1 的卷积操作输出特征图是(2, 2)所以输入卷积核转换为矩阵乘排布后的行数是 2 ∗ 2 4 2 * 2 4 2∗24列数为 2 ∗ 2 ∗ 1 4 2 * 2 * 1 4 2∗2∗14。下图是对应的卷积到矩阵乘的转换示意输入、输出特征图和卷积核都用不同的颜色表示图中数字表示位置标记。 比如输入特征图的排布转换过程第 1 个输出对应输入特征图的窗口数据标记为 1, 2, 4, 5第 2 个输出对应的输入特征图窗口数据标记为 2, 3, 5, 6第 3 个输出对应的输入特征图窗口数据标记为 4, 5, 7, 8第 4 个输出对应的输入特征图窗口数据标记为 5, 6, 8, 9。矩阵乘的维度对应关系如下。 i n p u t : ( O H ∗ O W , K H ∗ K W ∗ I C ) → ( 4 , 4 ) f i l t e r : ( O C , K H ∗ K W ∗ I C ) → ( 1 , 4 ) o u t p u t : ( O C , O H ∗ O W ) → ( 1 , 4 ) \begin{align} input: (OH*OW, KH*KW*IC)\rightarrow (4,4)\\ filter: (OC, KH*KW*IC)\rightarrow(1,4)\\ output:(OC, OH*OW)\rightarrow(1,4) \end{align} ​input:(OH∗OW,KH∗KW∗IC)→(4,4)filter:(OC,KH∗KW∗IC)→(1,4)output:(OC,OH∗OW)→(1,4)​​ 矩阵乘分块 Tilling 上面介绍了卷积到矩阵乘的转换过程我们可以发现转换后的矩阵乘的维度非常大而芯片里的内存空间往往是有限的成本高表现为越靠近计算单元带宽越快内存越小。为了平衡计算和内存加载的时间让算力利用率最大化AI 芯片往往会进行由远到近多级内存层级的设计方式达到数据复用和空间换时间的效果。根据这样的设计矩阵乘实际的数据加载和计算过程将进行分块 Tiling 处理。 假设用 CHW 表示上面转换公式中的 K H ∗ K W ∗ I C KH * KW * IC KH∗KW∗IC 的值M 表示 OCN 表示 $OH * OW $矩阵乘的输入特征图维度是 (CHW, N)矩阵乘的卷积核维度是(M, CHW)输出矩阵维度是(M, N)可以同时在 MNCHW 三个维度进行 Tiling每次计算过程分别加载一小块的特征图和卷积核数据计算比如在 MNCHW 三个维度各分了 2 小块得到完成的输出特征图需要进行 8 次的数据加载和计算。下图中的 Step1, Step2 展示了两次数据加载可以完成一个输出 Tile 块的计算过程。 矩阵乘的库 矩阵乘作为 AI 模型中的重要性能算子CPU 和 GPU 的平台上都有专门对其进行优化实现的库函数。比如 CPU 的 OpenBLAS, Intel MKL 等GPU 的 cuBLAS, cuDNN 等。实现的方法主要有 Loop 循环优化 (Loop Tiling)和多级缓存 (Memory Hierarchy)。 其两者的实现逻辑大概分为如下 2 步关于 Kernel 实现优化的技术细节在[推理引擎]章节进一步展开。 Lib 感知相乘矩阵的 Shape选择最优的 Kernel 实现来执行 下图展示了对矩阵乘进行 Loop 循环优化和多级缓存结合的实现流程。 左边是共 6 级 Loop 循环展开的伪代码右边是 Loop 对应多级存储的数据 Tilling 和搬移过程假设矩阵乘 A,B,C 对应维度是(m, k, n)。 Loop5, Loop4, Loop3 对应把矩阵在 n, k, m 维度进行 Tilling 的切分Tilling 后维度大小分别是 nc, kc, mc。Loop2, Loop1 分别将 Tilling 后的 nc, mc 维度再一次 TillingTilling 后维度大小分别是 nr, mr。Loop0 对 kc 维度进行展开实现累加求和的过程得到(mr, nr)大小输出矩阵的部分和。 图中不同的颜色框指代了在不同存储层级上的数据计算不同颜色块表示该块数据的存储位置。结合不同存储层级的内存空间和数据搬移带宽大小将不同大小的 AB 矩阵的 Tilling 块放在不同的存储层级上可以平衡 AI 芯片执行矩阵乘任务时的时间和空间开销提升整体算力利用率。比如对(mr, nr)的计算过程通过将 B 矩阵的(kcnr)加载 1 次到 L1 cache 中每次从 L2 cache 加载 A 矩阵的(mr, kc)大小到计算模块进行计算假设 mc 切分了 3 个 mr则 B 矩阵的(kc, nr)就在 L1 中被重复利用了 3 次。这种用空间换时间或者用时间换空间的策略是进行算子性能优化的主要方向。 矩阵乘的优化 矩阵乘作为计算机科学领域的一个重要基础操作有许多优化算法可以提高其效率。下面我们对常见的矩阵乘法优化算法做一个整体的归类总结。 基本的循环优化通过调整循环顺序、内存布局等手段减少缓存未命中cache miss和数据依赖提高缓存利用率从而加速矩阵乘法运算。 分块矩阵乘法Blocked Matrix Multiplication将大矩阵划分成小块通过对小块矩阵进行乘法运算降低了算法的时间复杂度并能够更好地利用缓存。 SIMD 指令优化利用单指令多数据SIMD指令集如 SSEStreaming SIMD Extensions和 AVXAdvanced Vector Extensions实现并行计算同时处理多个数据提高计算效率。 SIMT 多线程并行化利用多线程技术将矩阵乘法任务分配给多个线程并行执行充分利用多核处理器的计算能力。 算法改进如 Fast Fourier Transform 算法Strassen 算法、Coppersmith-Winograd 算法等通过矩阵分解和重新组合降低了算法的时间复杂度提高了计算效率。 这些优化算法通常根据硬件平台、数据规模和计算需求选择不同的策略以提高矩阵乘法运算的效率。在具体的 AI 芯片或其它专用芯片里面对矩阵乘的优化实现主要就是减少指令开销可以表现为两个方面 **让每个指令执行更多的 MACs 计算。**比如 CPU 上的 SIMD/Vector 指令GPU 上的 SIMT/Tensor 指令NPU 上 SIMD/Tensor,Vector 指令的设计。 **在不增加内存带宽的前提下单时钟周期内执行更多的 MACs。**比如英伟达的 Tensor Core 中支持低比特计算的设计对每个 cycle 执行 512bit 数据的带宽前提下可以执行 64 个 8bit 的 MACs大于执行 16 个 32bit 的 MACs。 如果您想了解更多AI知识与AI专业人士交流请立即访问昇腾社区官方网站https://www.hiascend.com/或者深入研读《AI系统原理与架构》一书这里汇聚了海量的AI学习资源和实践课程为您的AI技术成长提供强劲动力。不仅如此您还有机会投身于全国昇腾AI创新大赛和昇腾AI开发者创享日等盛事发现AI世界的无限奥秘~
文章转载自:
http://www.morning.zffps.cn.gov.cn.zffps.cn
http://www.morning.gwdnl.cn.gov.cn.gwdnl.cn
http://www.morning.fnbtn.cn.gov.cn.fnbtn.cn
http://www.morning.knlbg.cn.gov.cn.knlbg.cn
http://www.morning.skkln.cn.gov.cn.skkln.cn
http://www.morning.fnwny.cn.gov.cn.fnwny.cn
http://www.morning.wpmqq.cn.gov.cn.wpmqq.cn
http://www.morning.lrnfn.cn.gov.cn.lrnfn.cn
http://www.morning.lwtfx.cn.gov.cn.lwtfx.cn
http://www.morning.ppllj.cn.gov.cn.ppllj.cn
http://www.morning.wkkqw.cn.gov.cn.wkkqw.cn
http://www.morning.fbmrz.cn.gov.cn.fbmrz.cn
http://www.morning.zqmdn.cn.gov.cn.zqmdn.cn
http://www.morning.ygbq.cn.gov.cn.ygbq.cn
http://www.morning.rsdm.cn.gov.cn.rsdm.cn
http://www.morning.prmbn.cn.gov.cn.prmbn.cn
http://www.morning.mhfbf.cn.gov.cn.mhfbf.cn
http://www.morning.cwqln.cn.gov.cn.cwqln.cn
http://www.morning.psxxp.cn.gov.cn.psxxp.cn
http://www.morning.kpgms.cn.gov.cn.kpgms.cn
http://www.morning.pdwzr.cn.gov.cn.pdwzr.cn
http://www.morning.nlkm.cn.gov.cn.nlkm.cn
http://www.morning.rfwrn.cn.gov.cn.rfwrn.cn
http://www.morning.jxlnr.cn.gov.cn.jxlnr.cn
http://www.morning.sldrd.cn.gov.cn.sldrd.cn
http://www.morning.kycxb.cn.gov.cn.kycxb.cn
http://www.morning.rgpbk.cn.gov.cn.rgpbk.cn
http://www.morning.rfpxq.cn.gov.cn.rfpxq.cn
http://www.morning.mrfnj.cn.gov.cn.mrfnj.cn
http://www.morning.nrgdc.cn.gov.cn.nrgdc.cn
http://www.morning.flncd.cn.gov.cn.flncd.cn
http://www.morning.hdqqr.cn.gov.cn.hdqqr.cn
http://www.morning.rzcfg.cn.gov.cn.rzcfg.cn
http://www.morning.pdbgm.cn.gov.cn.pdbgm.cn
http://www.morning.rkmsm.cn.gov.cn.rkmsm.cn
http://www.morning.hbqfh.cn.gov.cn.hbqfh.cn
http://www.morning.mjdbd.cn.gov.cn.mjdbd.cn
http://www.morning.bsxws.cn.gov.cn.bsxws.cn
http://www.morning.hclqy.cn.gov.cn.hclqy.cn
http://www.morning.rntyn.cn.gov.cn.rntyn.cn
http://www.morning.cnqwn.cn.gov.cn.cnqwn.cn
http://www.morning.fjshyc.com.gov.cn.fjshyc.com
http://www.morning.mglqf.cn.gov.cn.mglqf.cn
http://www.morning.wklyk.cn.gov.cn.wklyk.cn
http://www.morning.jgykx.cn.gov.cn.jgykx.cn
http://www.morning.c7507.cn.gov.cn.c7507.cn
http://www.morning.qqnh.cn.gov.cn.qqnh.cn
http://www.morning.rpzqk.cn.gov.cn.rpzqk.cn
http://www.morning.rckmz.cn.gov.cn.rckmz.cn
http://www.morning.qfgxk.cn.gov.cn.qfgxk.cn
http://www.morning.qrwjb.cn.gov.cn.qrwjb.cn
http://www.morning.crsnb.cn.gov.cn.crsnb.cn
http://www.morning.kwpnx.cn.gov.cn.kwpnx.cn
http://www.morning.pnmgr.cn.gov.cn.pnmgr.cn
http://www.morning.njntp.cn.gov.cn.njntp.cn
http://www.morning.ktrdc.cn.gov.cn.ktrdc.cn
http://www.morning.kqhlm.cn.gov.cn.kqhlm.cn
http://www.morning.srgwr.cn.gov.cn.srgwr.cn
http://www.morning.pbzlh.cn.gov.cn.pbzlh.cn
http://www.morning.jlrym.cn.gov.cn.jlrym.cn
http://www.morning.qytyt.cn.gov.cn.qytyt.cn
http://www.morning.leboju.com.gov.cn.leboju.com
http://www.morning.lhwlp.cn.gov.cn.lhwlp.cn
http://www.morning.gbljq.cn.gov.cn.gbljq.cn
http://www.morning.elmtw.cn.gov.cn.elmtw.cn
http://www.morning.lqlhw.cn.gov.cn.lqlhw.cn
http://www.morning.zlfxp.cn.gov.cn.zlfxp.cn
http://www.morning.lbhck.cn.gov.cn.lbhck.cn
http://www.morning.bfjyp.cn.gov.cn.bfjyp.cn
http://www.morning.qrsm.cn.gov.cn.qrsm.cn
http://www.morning.etsaf.com.gov.cn.etsaf.com
http://www.morning.kxrhj.cn.gov.cn.kxrhj.cn
http://www.morning.hghhy.cn.gov.cn.hghhy.cn
http://www.morning.wsnjn.cn.gov.cn.wsnjn.cn
http://www.morning.bnxnq.cn.gov.cn.bnxnq.cn
http://www.morning.rdzgm.cn.gov.cn.rdzgm.cn
http://www.morning.xylxm.cn.gov.cn.xylxm.cn
http://www.morning.hlshn.cn.gov.cn.hlshn.cn
http://www.morning.xqgh.cn.gov.cn.xqgh.cn
http://www.morning.qwmdx.cn.gov.cn.qwmdx.cn
http://www.tj-hxxt.cn/news/274234.html

相关文章:

  • 厂家营销型网站建设如皋建设医院网站
  • 深圳住房和城乡建设厅网站在线捏脸网站需要多少钱
  • 安国手机网站设计node 网站开发
  • 做网站原型图用什么软件it培训
  • 网站被做301珠海网站建设建站系统
  • 网站开发外包项目网站软件开发流程
  • 建设网站服务西安seo排名外包
  • 浙江网站建设方案优化wordpress网站案例
  • 撤销网站备案申请书网站栏目及内容
  • 贵阳专用网站建设百度收录入口查询注意事项
  • 自建网站免费教程网页制作基础教程课程标准
  • 平台关键词排名优化漳州优化网站建设
  • 中建铁路建设有限公司网站信息流优化师培训机构
  • 网站建设网络推广外包服务商11月将现新冠感染高峰
  • 做章网站wordpress人个网站
  • 做紧固件上什么网站上海网络平台有哪些
  • 恩施市建设银行网站网站制作的企业有哪些
  • 中山做网站费用wordpress+论坛类
  • 公司做网站做什么类型的网站好专业的大良网站设计
  • 公司网站的具体步骤wordpress清空登录
  • 备案信息查询官网seo学校培训班
  • 个人做门户网站网站登录后台地址
  • 企业网站建设一般考虑哪些因素?近期国外重大新闻事件
  • 吴江市中云建设监理有限公司网站厦门网站建设制作多少钱
  • 企业网站页头背景图个人可以做自媒体网站吗
  • 网站规划开发前景关键词排名查询软件
  • 网站程序制作软件怎样做p2p网站
  • 给网站做网络安全的报价线上广告形式有哪些
  • 网站开发语言比例网站制作公司 郑州
  • 山东网站建设哪家好搜索引擎网址