网站特色,欧米茄女士手表网站,手机网站制作工具,莱芜在线最新消息并行处理系统概述
并行处理的主要技术问题#xff1a; 互连#xff1a;如何实现将多个计算模块和多个存储模块进行互连#xff0c;并通过控制这些模块的并行工作来提高处理速度数据一致性#xff1a;为加快数据处理的速度#xff0c;通常利用程序访问的局部性特性#x…并行处理系统概述
并行处理的主要技术问题 互连如何实现将多个计算模块和多个存储模块进行互连并通过控制这些模块的并行工作来提高处理速度数据一致性为加快数据处理的速度通常利用程序访问的局部性特性在不同计算模块中设置高速缓存且这些不同的计算模块还可能设置共享的高速缓存和共享的主存储器。因此在并行处理系统中存在复杂的数据一致性问题同步控制需要对各个计算模块进行同步控制任务划分并行程序设计需说明哪些处理逻辑段可以并行执行哪些处理逻辑段之间有先后顺序关系等资源调度和管理容错性和安全性 并行处理系统的分类 按指令和数据的处理方式划分 SISDSIMDMIMD 按主存地址空间的访问方式划分 多计算机系统具有多个私有地址空间的并行处理系统。每个计算节点具有各自私有的存储器并各自有独立的主存地址空间多处理器系统即共享存储多处理器系统。每个处理器都可以通过load和store指令访问系统中的存储器也称为共享存储系统 按存储访问时间是否一致划分 一致性内存访问UMA结构非一致性内存访问NUMA结构处理器对不同存储单元的访问时间可能不一致访问时间与存储单元的位置有关若是本地存储器访问时间就短若是其他处理器所连接的存储器则访问时间就长 按处理单元的位置及其互连方式划分 多核芯片片级多处理器CMP一个CPU芯片中包含多个处理单元多个核通常多核CPU芯片的核数为2、4、8等几种众核芯片在一个面向三维图形、视频和可视化处理的GPU芯片中包含几百上千个简单核。众核GPU芯片着力于在众多的简单核上有效执行众多的并行线程并在线程组之间对数据的并行处理进行优化对称多处理器SMP将多个同类型的CPU通过总线互连并等同地位地共享系统所有资源。即多个CPU对称工作无主次或从属关系是一种UMA结构处理器因为每个CPU访问内存中的任何地址所需时间相同。多核处理器系统、高档微机、工作站或服务器多用SMP结构大规模并行处理机MPP以专用内联网络连接数量众多处理单元而构成的一种并行计算系统。如可通过专用互连网络将几百上千个对称多处理器连接成大规模并行处理机众多SMP服务器协同工作完成相同的任务每个SMP服务器称为节点每个节点只能直接访问自己的本地资源内存、磁盘等。集群指通过高性能网卡将若干普通PC或SMP服务器或工作站连接而成的并行处理系统。集群中的每个计算节点PC、SMP或工作站都有各自的内存储器和磁盘主存地址空间都是计算节点各自私有的。因此集群是一种典型的紧密耦合的同构多计算机系统网格是指用因特网等广域网络连接起来的远距离分布的一组异构计算机系统构成的分布式并行处理系统。是一种松散耦合的异构多计算机系统。云计算服务器就是由网格发展而来的
多处理器系统
即共享存储多处理器系统。每个处理器都访问一个全局的主存储器因而每个处理器在执行指令时所产生的物理地址都属于同一个物理地址空间。 多处理器系统的硬件结构有三种一致性内存访问UMA、非一致性内存访问NUMA和高速缓存一致的非一致性内存访问CC-NUMA
UMANUMACC-NUMA多核处理器 基本思路在一个CPU芯片中设计多个简单的处理器核通过多个核的并行计算来提高计算性能。因此基于一个CPU芯片可以实现一个多处理器系统基于多核芯片的处理器被称为片级多处理器CMP 硬件多线程技术是一种共享单个处理器核内功能部件的技术。每个线程相当于一个指令序列用于指令执行的功能部件和高速缓存在每个核内仅有一套。为了支持多线程并发执行必须为每个线程提供单独的通用寄存器组和程序计数器等用于存放现场信息的资源并提供快速的线程切换机制 有三种多线程实现方式 细粒度多线程处理器核能在每个时钟周期切换线程粗粒度多线程仅在某个线程出现较大开销的阻塞时才切换线程如cache不命中同时多线程SMT能在同一个时钟周期中在不同的发射槽中发射不同线程中的指令。超线程Intel即为同时多线程 使用多核处理器或硬件多线程可能会带来新的性能干扰问题。同一个核心上的多个硬件线程之间会共享超标量处理 器中包括发射队列、ROB、访存队列、分支预测器核L1 cache等资源。当处理器核或线程的负载较高时会在这些资源上产生竞争现象竞争不到资源的处理器核或线程就会被阻塞而性能下降。 如对性能稳定性要求较高的场合如双11阿里在线购物的数据中心会面临巨大交易负载为保证用户的交易体验系统管理员都会提前制定严格的任务调度策略避免将多个交易线程调度到同一个处理器核上从而带来干扰。