当前位置: 首页 > news >正文

网站建设方案word成品短视频app下载有哪些软件

网站建设方案word,成品短视频app下载有哪些软件,营销型网站效果不好,网站建设参考文献2017目录一、线程、块、网格概念二、代码分析2.1 打印第一个线程块的第一线程2.2 打印当前线程块的当前线程2.3 获取当前是第几个线程一、线程、块、网格概念 CUDA的软件架构由网格(Grid)、线程块(Block)和线程(Thread&am…

目录

  • 一、线程、块、网格概念
  • 二、代码分析
    • 2.1 打印第一个线程块的第一线程
    • 2.2 打印当前线程块的当前线程
    • 2.3 获取当前是第几个线程

一、线程、块、网格概念

CUDA的软件架构由网格(Grid)、线程块(Block)和线程(Thread)组成,相当于把GPU上的计算单元分为若干(2~3)个网格,每个网格内包含若干(65535)个线程块,每个线程块包含若干(512)个线程,三者的关系如下图:
在这里插入图片描述
thread:一个CUDA的并行程序会被以许多个threads来执行。
block:数个threads会被群组成一个block,同一个block中的threads可以同步,也可以通过shared memory通信。
grid:多个blocks则会再构成grid。
在这里插入图片描述
如图,1个网格有9个线程块,每个线程块有4个线程
4*9=36个线程同时运行

而block如果有1024个线程,block可以很大,所以有可能百万线程并发
开普勒架构:最大线程块1024,最大网格2^31-1,两万亿个线程

gridDim.x :该变量的数值等与执行配置中变量grid_size的数值。网格块数
blockDim.x: 该变量的数值等与执行配置中变量block_size的数值。当前块的线程数。
在核函数中预定义了如下标识线程的内建变量:
blockIdx.x :该变量指定一个线程在一个网格中的线程块指标。其取值范围是从0到gridDim.x-1。当前块索引
threadIdx.x:该变量指定一个线程在一个线程块中的线程指标,其取值范围是从0到blockDim.x-1。当前块中线程的索引

在这里插入图片描述
若gpu<<<2,2>>>();
则打印四次
在这里插入图片描述

二、代码分析

2.1 打印第一个线程块的第一线程

#include <stdio.h>void cpu()
{printf("hello cpu!\n");
}__global__ void gpu()
{//if (blockIdx.x == 2 && threadIdx.x == 0)  //若线程块2,则不打印,因为只分配了0和1if (blockIdx.x == 0 && threadIdx.x == 0)    //打印第一个线程块的第一线程{printf("hello gpu!\n");}}int main()
{cpu();gpu<<<2,2>>>();cudaDeviceSynchronize();
}

在这里插入图片描述

2.2 打印当前线程块的当前线程

一个核函数可以指派多个线程,而这些线程的组织结构是由执行配置(<<<网格大小,线程块大小 >>>)来决定的,这是的网格大小和线程块大小一般来说是一个结构体类型的变量,也可以是一个普通的整形变量。

一个核函数允许指派的线程数是巨大的,能够满足几乎所有应用程序的要求。但是一个核函数中虽然可以指派如此巨大数目的线程数,但在执行时能够同时活跃(不活跃的线程处于等待状态)的线程数是由硬件(主要是CUDA核心数)和软件(核函数的函数体)决定的。
每个线程在核函数中都有一个唯一的身份标识。由于我们在三括号中使用了两个参数制定了线程的数目,所以线程的身份可以由两个参数确定。在程序内部,程序是知道执行配置参数grid_size和block_size的值的,这两个值分别保存在内建变量(built-in variable)中。

#include<stdio.h>
__global__ void hello_from_gpu()
{const int bid = blockIdx.x;const int tid = threadIdx.x;printf("hello word from block %d and thread %d\n",bid,tid);
}
int main()
{hello_from_gpu<<<2,4>>>();cudaDeviceSynchronize(); printf("helloword\n");return 0;
}

在这里插入图片描述
有时候线程块的顺序会发生改变,有时候是第1个先执行有时候是第0个先执行,这说明了cuda程序执行时每个线程块的计算都是相互独立的,不管完成计算的次序如何,每个线程块中间的每个线程都进行一次计算。

在这里插入图片描述

2.3 获取当前是第几个线程

int threadi = blockIdx.x * blockDim.x + threadIdx.x; //计算出当前是第几个线程

参考:
https://blog.csdn.net/qq_32159463/article/details/124196351
B站 爱学习的阿噜

http://www.tj-hxxt.cn/news/46764.html

相关文章:

  • 档案馆网站建设现状网络营销模式下品牌推广研究
  • 光谷网站建设策划营销推广方案
  • 网站功能需求列表神童预言新冠2023结束
  • 福州做网站多少钱百度关键词搜索量排行
  • 十大必做调查网站百度站长工具数据提交
  • 传媒公司宣传片网站优化师
  • 房产网站开发公司站长之家字体
  • 做网站赚钱的QQ群无锡seo网站管理
  • 律所网站建设大丰seo排名
  • 软件如何推广seo5
  • 公司网站一般找哪个公司做搜狗快速收录方法
  • 静态网站建设的PPT千锋教育学费
  • 山东青岛网站设计公司说到很多seo人员都转行了
  • 做深度游网站 知乎深圳seo推广培训
  • 从代码角度分析网站怎么做2345网址导航应用
  • 专业培训惠州seo代理计费
  • 海口住房与城乡建设官网点石关键词排名优化软件
  • wordpress多文章开源seo软件
  • 沈阳微信网站开发二十条优化措施
  • 中小型网站建设价位百度软件中心下载安装
  • 网站建设中 动态图片掌门一对一辅导官网
  • 怎么推广品牌seo技巧是什么
  • 虚拟机怎么做网站企业查询
  • 办公室设计风格seo技术教学视频
  • 专业做鞋子的网站杭州seo关键字优化
  • 网站问卷调查怎么做重庆百度关键词推广
  • 网站建设分金手指排名二八重庆的seo服务公司
  • 昆明手机网站建设湖南seo优化哪家好
  • 微信公众商城网站开发日照网络推广公司
  • 自己做网站模版一手app推广接单平台