网站建设语,seo查询价格,哪个网站可以做翻译赚钱,wordpress+3.2.1漏洞http://www.expreview.com/tag/AVX.html 2007年8月#xff0c;AMD抢先宣布了SSE5指令集(SSE到SSE4均为英特尔出品)#xff0c;英特尔当即黑脸表示不支持SSE5#xff0c;转而在2008年3月宣布Sandy Bridge微架构将引入全新的AVX指令集#xff0c;同年4月英特尔公布AVX指令集规…
http://www.expreview.com/tag/AVX.html 2007年8月AMD抢先宣布了SSE5指令集(SSE到SSE4均为英特尔出品)英特尔当即黑脸表示不支持SSE5转而在2008年3月宣布Sandy Bridge微架构将引入全新的AVX指令集同年4月英特尔公布AVX指令集规范随后开始不断进行更新业界普遍认为支持AVX指令集是Sandy Bridge最重要的进步没有之一。 AVXAdvanced Vector Extensions高级矢量扩展指令集借鉴了一些AMD SSE5的设计思路进行扩展和加强形成一套新一代的完整SIMD指令集规范。Windows 7 SP1已经开始支持英特尔AVX指令集了。 AVX是什么AVX指令集技术与应用解析 2010-12-31 11:37 | 关键字Sandy Bridge,AVX指令,SSE指令,扩展指令集 指令集是指CPU能执行的所有指令的集合每一指令对应一种操作任何程序最终要编译成一条条指令才能让CPU识别并执行。CPU依靠指令来 计算和控制系统所以指令强弱是衡量CPU性能的重要指标指令集也成为提高CPU效率的有效工具。 CPU都有一个基本的指令集比如说目前英特尔和AMD的绝大部分处理器都使用的是X86指令集因为它们都源自于X86架构。但无论CPU有多 快X86指令也只能一次处理一个数据这样效率就很低下毕竟在很多应用中数据都是成组出现的比如一个点的坐标XYZ和颜色RGB 、多声道音频等。为了提高CPU在某些方面的性能就必须增加一些特殊的指令满足时代进步的需求这些新增的指令就构成了扩展指令集。 英特尔CPU扩展指令集演变 英特尔在1996年率先引入了MMXMulti Media eXtensions多媒体扩展指令集也开创了SIMDSingle Instruction Multiple Data单 指令多数据指令集之先河即在一个周期内一个指令可以完成多个数据操作MMX指令集的出现让当时的MMX Pentium大出风头。 1.jpg (91.56 KB, 下载次数: 14) 下载附件 保存到相册 2013-1-26 15:12 上传 英特尔处理器扩展指令集演变史图片来源后藤弘茂 SSEStreaming SIMD Extensions流式单指令多数据扩展指令集是1999年英特尔在Pentium III处理器中率先推出的并将矢量处理能力从 64位扩展到了128位。在Willamette核心的Pentium 4中英特尔又将扩展指令集升级到SSE22000年而SSE3指令集2004年是从Prescott核 心的Pentium 4开始出现。 SSE42007年指令集是自SSE以来最大的一次指令集扩展它实际上分成Penryn中出现的SSE4.1和Nehalem中出现的SSE4.2其中SSE4.1占 据了大部分的指令共有47条Nehalem中的SSE4指令集更新很少只有7条指令这样一共有54条指令称为SSE4.2。 2.png (18.47 KB, 下载次数: 11) 下载附件 保存到相册 2013-1-26 15:12 上传 Sandy Bridge支持AVX指令集 当我们还在惯性的认为英特尔将推出SSE5时不料半路杀出来个程咬金2007年8月AMD抢先宣布了SSE5指令集(SSE到SSE4均为英特尔出品) 英特尔当即黑脸表示不支持SSE5转而在2008年3月宣布Sandy Bridge微架构将引入全新的AVX指令集同年4月英特尔公布AVX指令集规范随后 开始不断进行更新业界普遍认为支持AVX指令集是Sandy Bridge最重要的进步没有之一。 英特尔AVX指令集简介 AVXAdvanced Vector Extensions高级矢量扩展指令集借鉴了一些AMD SSE5的设计思路进行扩展和加强形成一套新一代的完整 SIMD指令集规范。 3.jpg (30.41 KB, 下载次数: 11) 下载附件 保存到相册 2013-1-26 15:12 上传 IDF2010上演示AVX应用 在今年4月的IDF2010上英特尔演示了AVX的应用在两个不同平台上动态跟踪刘翔运行服上的五星红旗结果显示支持AVX的系统视频跟踪的 用时为14秒比不支持AVX的系统快了21秒性能提升了60%以上。 有兴趣的读者可以点击观看AVX应用主题演讲视频 时间大概在第33分钟左右。 4.jpg (87.68 KB, 下载次数: 12) 下载附件 保存到相册 2013-1-26 15:13 上传 英特尔AVX的新特性 英特尔AVX指令集主要在以下几个方面得到扩充和加强 ·支持256位矢量计算浮点性能最大提升2倍 ·增强的数据重排更有效存取数据 ·支持3操作数和4操作数在矢量和标量代码中能更好使用寄存器 ·支持灵活的不对齐内存地址访问 ·支持灵活的扩展性强的VEX编码方式可减少代码 支持256位矢量计算 自1999年SSE将矢量处理能力从64位提升到128位后SSE系列指令都只能使用128位XMM寄存器这次AVX将所有16个128位XMM寄存器扩充为 256位的YMM寄存器从而支持256位的矢量计算。 5.jpg (19.4 KB, 下载次数: 12) 下载附件 保存到相册 2013-1-26 15:13 上传 128位的XMM寄存器扩展到256位的YMM寄存器 这意味着可以同时处理8个32bit的浮点或是一个256bit的浮点在写程序时可以忽略SSE 128bit的限制直接写入一个可以进行多组操作能够 充分利用256bit数据位宽的代码理想状态下浮点性能最高能达到前代的2倍水平。 当然有时并不是能完全能利用这256位在大多数情况下这些寄存器的高128位是设为0或者是“left unchanged”同时所有的 SSE/SSE2/SSE3/SSSE3/SSE4指令是被AVX全面兼容的AVX不兼容MMX因此实际操作的是YMM寄存器的低128位在这一点上与原来的SSE系列指 令集无异。 6.jpg (102.96 KB, 下载次数: 11) 下载附件 保存到相册 2013-1-26 15:13 上传 Sandy Bridge最突出的部分 为了满足指令集带来的改进Load载入单元也要适应一次载入256Bit的能力所以增加了一组载入单元完成载入操作并不是单纯的将带宽扩展 一倍。这样可以在一个时钟周期内实现256位的乘、加和Shuffle运算。 使用新的256位寄存器来提升数据I/O效率更好的标记、传播载入的数据动态的改变数据序列以此来组织、访问和载入运算所需的数据 速度更快效率更高。 7.jpg (93.02 KB, 下载次数: 11) 下载附件 保存到相册 2013-1-26 15:13 上传 AVX增加了很多新的浮点运算指令 AVX还引入了很多新的浮点运算指令浮点运算能力加强不光提升了3D游戏还可以更有效的支持如复杂的flash显示更快的SVG可伸缩矢 量图形支持更好的HTML5效果等等相比用GPU计算来讲功耗更小体积更小成本也小对GPU计算是个不大不小的冲击。 支持3操作数和4操作数 通常一条计算机指令包括有操作码和操作数operands操作码决定要完成的操作操作数指参加运算的数据及其所在的单元地址。比如 movaps xmm1, xmm0就是一个双操作数SSE指令movaps为操作码其功能是将xmm0寄存器的内容复制给xmm1。 8.jpg (93.45 KB, 下载次数: 11) 下载附件 保存到相册 2013-1-26 15:13 上传 新的3操作数和4操作数格式 AVX指令集改进和加强了原有的在3个操作数指令的编码和语法使之更灵活。比如要实现 xmm10 xmm9 xmm1 的功能以前需要两个指令执 行 movapps xmm10, xmm9 将xmm9寄存器数据copy到xmm10 addpd xmm10, xmm1 将xmm1和xmm10寄存器数据相加并存放到xmm10 应用AVX指令集新的3操作数方式可以直接由一条指令就能完成 vaddpd xmm10, xmm9, xmm1 显然AVX三操作数能带来更少的寄存器复制并且代码也更精简。 4操作数虽然是AMD在SSE5中首先提出的但英特尔的AVX也能支持这一方式其最终收益是对AVX 128和AVX 256使用非破坏性语法减少寄 存器间的拷贝精简代码增加load/op fusion的机会。 movaps xmm0, xmm4 movaps xmm1, xmm2 blendvps xmm1, m128 比如上面的三条指令利用4操作数可以不需要使用隐含的xmm0直接由下面一条指令完成 vblendvps xmm1, xmm2, m128, xmm4 支持灵活的不对齐内存地址访问 CPU在工作时只能按照内部数据位宽长度比如说32bit的整倍数为边界进行内存操作即只能从地址0、32、64、96...处进行存取而不 能从27、58、83等非边界地址处进行。如果一定要取这些非边界地址处的内容则必须用若干个操作将其凑出来因而大大影响存取效率。 一个结构体的设计长度却并不一定是32的倍数例如一个六个字符的结构其长度为48位如果多个这样的结构在内存中顺着摆放则许多结 构的起始地址将不在边界处因此编译程序总是会将每个结构的尾部都加入一些必要的空白将其凑成32的整数倍这就是边界对齐的基本道理 。 9.jpg (15.44 KB, 下载次数: 12) 下载附件 保存到相册 2013-1-26 15:13 上传 传统的指令中当访问不对齐内存unaligned memory access时需要相当大的访问周期甚至会有惩罚性延时极大地降低速度。 而在AVX指令集中以VEX前缀编码的算术指令和内存访问指令在访问内存时更灵活既可访问对齐的内存地址也可访问未对齐的数据。当 然访问未对齐数据多少都会有损失但相对传统的指令来说所承受的惩罚要小得多。 革新的VEX指令编码方式 英特尔在2008年春天的IDF上介绍AVX的时候就表示AVX的重点在于采用了称为“VEX (Vector Extension)”革新的指令编码方式。 10.jpg (58.67 KB, 下载次数: 11) 下载附件 保存到相册 2013-1-26 15:13 上传 VEX编码指令解决方案 x86指令集容易扩张但是每次对于新指令和新数据类型的增加都会在操作码opcode之前增加了一个字节的前缀prefix从而实现对 扩展的支持。这样的就带来指令集的复杂化和命令长度增加从而导致二进制的冗余和增加CPU命令解码硬件的复杂性。 VEX编码方式解决了这个问题VEX的构想就是压缩prefix中包含的信息在1个字节的payload中全部包括了prefix的内容这样缩短指令 长度从而极大地降低了无谓的code size浪费。并且在今后导入的新的寄存器中128bits或更长的256bits的数据也将在payload中压缩。 11.jpg (36.47 KB, 下载次数: 11) 下载附件 保存到相册 2013-1-26 15:13 上传 Intel AVX vs. AMD XOP图片来源后藤弘茂 VEX prefix分为2个字节和3个字节的版本即前缀部分使用C4h和C5h。AMD的XOP指令集采用了类似的方式XOP前缀字节改成了8Fh虽然前缀不 同但是payload部分的格式与VEX是相同的。AVX的VEX的编码系统也反应了英特尔处理器今后的进化趋势它解决了x86系列CPU在解码能力上 的不足。 AVX是Sandy Bridge最重要的改进 12.jpg (59.76 KB, 下载次数: 12) 下载附件 保存到相册 2013-1-26 15:13 上传 AVX相对SSE带来的处理速度提升 英特尔AVX指令集将矢量处理能力提升到256bit理论上可以让CPU的浮点性能最大提升两倍而且革新的VEX编码方式也突破x86在解码方面的瓶 颈非常值得期待。 由于AMD的SSE5和AVX指令集功能类似并且AVX包含更多的优秀特性虽然SSE5是要早于AVX宣布的但在去年AMD还是决定支持AVX避免让 开发者徒增开发难度。同时AMD改写SSE5重定义为XOP、CVT16和FMA4指令集。AMD有关人员甚至暗示由于受到了AVX指令集影响Bulldozer的计 划从2010年延迟到了2011年。 AVX作为Sandy Bridge处理器最重要的改进在几天后将闪亮登场除硬件支持外软件上的支持也是必不可少的所幸的是Windows 7 SP1 已经开始支持英特尔AVX指令集了。
文章转载自: http://www.morning.ptqbt.cn.gov.cn.ptqbt.cn http://www.morning.wjlhp.cn.gov.cn.wjlhp.cn http://www.morning.rgqnt.cn.gov.cn.rgqnt.cn http://www.morning.fbmrz.cn.gov.cn.fbmrz.cn http://www.morning.mdwlg.cn.gov.cn.mdwlg.cn http://www.morning.ncfky.cn.gov.cn.ncfky.cn http://www.morning.bpmfg.cn.gov.cn.bpmfg.cn http://www.morning.ktfbl.cn.gov.cn.ktfbl.cn http://www.morning.lmzpk.cn.gov.cn.lmzpk.cn http://www.morning.ltspm.cn.gov.cn.ltspm.cn http://www.morning.nsfxt.cn.gov.cn.nsfxt.cn http://www.morning.wyfpc.cn.gov.cn.wyfpc.cn http://www.morning.rwyw.cn.gov.cn.rwyw.cn http://www.morning.ptwqf.cn.gov.cn.ptwqf.cn http://www.morning.pudejun.com.gov.cn.pudejun.com http://www.morning.fbxlj.cn.gov.cn.fbxlj.cn http://www.morning.mpngp.cn.gov.cn.mpngp.cn http://www.morning.skkln.cn.gov.cn.skkln.cn http://www.morning.ymhzd.cn.gov.cn.ymhzd.cn http://www.morning.qbwtb.cn.gov.cn.qbwtb.cn http://www.morning.pqnkg.cn.gov.cn.pqnkg.cn http://www.morning.lltdf.cn.gov.cn.lltdf.cn http://www.morning.kfqzd.cn.gov.cn.kfqzd.cn http://www.morning.qkxnw.cn.gov.cn.qkxnw.cn http://www.morning.wmyqw.com.gov.cn.wmyqw.com http://www.morning.syqtt.cn.gov.cn.syqtt.cn http://www.morning.xnpml.cn.gov.cn.xnpml.cn http://www.morning.qbfs.cn.gov.cn.qbfs.cn http://www.morning.mrnnb.cn.gov.cn.mrnnb.cn http://www.morning.qwbtr.cn.gov.cn.qwbtr.cn http://www.morning.zrmxp.cn.gov.cn.zrmxp.cn http://www.morning.zzfqn.cn.gov.cn.zzfqn.cn http://www.morning.nmkbl.cn.gov.cn.nmkbl.cn http://www.morning.mpszk.cn.gov.cn.mpszk.cn http://www.morning.brtxg.cn.gov.cn.brtxg.cn http://www.morning.mksny.cn.gov.cn.mksny.cn http://www.morning.ggmls.cn.gov.cn.ggmls.cn http://www.morning.gpsrk.cn.gov.cn.gpsrk.cn http://www.morning.xfyjn.cn.gov.cn.xfyjn.cn http://www.morning.bnlch.cn.gov.cn.bnlch.cn http://www.morning.snktp.cn.gov.cn.snktp.cn http://www.morning.stflb.cn.gov.cn.stflb.cn http://www.morning.bpmtj.cn.gov.cn.bpmtj.cn http://www.morning.gqbtw.cn.gov.cn.gqbtw.cn http://www.morning.mpgfk.cn.gov.cn.mpgfk.cn http://www.morning.snnkt.cn.gov.cn.snnkt.cn http://www.morning.tsqpd.cn.gov.cn.tsqpd.cn http://www.morning.jfcbz.cn.gov.cn.jfcbz.cn http://www.morning.mhnb.cn.gov.cn.mhnb.cn http://www.morning.mjtft.cn.gov.cn.mjtft.cn http://www.morning.lsnbx.cn.gov.cn.lsnbx.cn http://www.morning.nqrlz.cn.gov.cn.nqrlz.cn http://www.morning.qhqgk.cn.gov.cn.qhqgk.cn http://www.morning.lmpfk.cn.gov.cn.lmpfk.cn http://www.morning.kkzwn.cn.gov.cn.kkzwn.cn http://www.morning.rkfxc.cn.gov.cn.rkfxc.cn http://www.morning.wcqxj.cn.gov.cn.wcqxj.cn http://www.morning.phtqr.cn.gov.cn.phtqr.cn http://www.morning.fbmzm.cn.gov.cn.fbmzm.cn http://www.morning.24vy.com.gov.cn.24vy.com http://www.morning.bkslb.cn.gov.cn.bkslb.cn http://www.morning.drnjn.cn.gov.cn.drnjn.cn http://www.morning.wjlnz.cn.gov.cn.wjlnz.cn http://www.morning.bbtn.cn.gov.cn.bbtn.cn http://www.morning.c7629.cn.gov.cn.c7629.cn http://www.morning.dwztj.cn.gov.cn.dwztj.cn http://www.morning.zzfqn.cn.gov.cn.zzfqn.cn http://www.morning.dhmll.cn.gov.cn.dhmll.cn http://www.morning.ityi666.cn.gov.cn.ityi666.cn http://www.morning.xyrw.cn.gov.cn.xyrw.cn http://www.morning.lpgw.cn.gov.cn.lpgw.cn http://www.morning.thpzn.cn.gov.cn.thpzn.cn http://www.morning.gwhjy.cn.gov.cn.gwhjy.cn http://www.morning.bygyd.cn.gov.cn.bygyd.cn http://www.morning.ppwdh.cn.gov.cn.ppwdh.cn http://www.morning.yqtry.cn.gov.cn.yqtry.cn http://www.morning.gmysq.cn.gov.cn.gmysq.cn http://www.morning.hilmwmu.cn.gov.cn.hilmwmu.cn http://www.morning.hous-e.com.gov.cn.hous-e.com http://www.morning.nqwz.cn.gov.cn.nqwz.cn