热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

CUDA编程系统性学习笔记(一):存储,函数与线程概念

持续关注我的朋友可能知道,之前因为做一个点云配准的项目,重新又开始学习CUDA编程。以我浅薄的并行编程技术,对于一些对存储要求不是很高的小程序,还勉强能够应付。但是最近做的一个网格

持续关注我的朋友可能知道,之前因为做一个点云配准的项目,重新又开始学习CUDA编程。以我浅薄的并行编程技术,对于一些对存储要求不是很高的小程序,还勉强能够应付。但是最近做的一个网格优化的并行项目,数据量大,动态存储要求高,对存储空间数据的更新频率频繁,自然对并行编程的存储使用有了更高的要求。因此,为了能够更进一步的提升并行编程技术,解决存储使用的一些问题,我最近学习了英伟达周斌老师的视频教程,计划做一个系统性的Cuda学习与提升。我计划做一个系列的博客,来分享一些我在并行编程中存储使用的一些心得体会,作为备忘,同时分享给大家。

1. 存储与函数的类别

Register;Shared Memory block内部数据共享;Local Memory;Global Memory;Constant Memory;Texture Memory;Instruction Memory (不可见);


线程私有的存储:Local memory

Block私有的存储:Shared Memory

整个设备共有的:Global Memory

函数命名对应的执行单元(Device: GPU Cuda;Host: CPU)

__device__ float filter[N] 显存定义变量   

__global__ void DeviceFunc()  执行位置 device (GPU)   调用位置 device

__global__ void KenerFunc()  执行位置 device (GPU) 调用位置host

一些注意事项:

 

一些数据类型的定义:

示例:

  一些数学函数

内建函数,牺牲精度,提升速度, 使用双下划线 :

 通过ID计算线程单元

2. 线程层次 

Grid:block组,一维或多维线程块

Block:一组线程Thread

 线程层次编号:

 示例:使用二维线程编号调用CUDA计算单元 

多块索引:

 

线程同步:(这里是块内同步,如果全局同步,开销过大)

线程调度:

SM->Block; SP->Thread

Wrap 块内的一组线程,作为调度折中。

3. 内存数据传输

对于device和host两个执行方式,其对应内存使用的权限。

 

CPU与GPU的数据交互:

到这里,我们把和GPU并行编程有关的基础概念做了介绍。基于这些概念,我们将在下一篇博客中进一步的学习如何实现高效的Cuda编程。




推荐阅读
  • 海马s5近光灯能否直接更换为H7?
    本文主要介绍了海马s5车型的近光灯是否可以直接更换为H7灯泡,并提供了完整的教程下载地址。此外,还详细讲解了DSP功能函数中的数据拷贝、数据填充和浮点数转换为定点数的相关内容。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 前景:当UI一个查询条件为多项选择,或录入多个条件的时候,比如查询所有名称里面包含以下动态条件,需要模糊查询里面每一项时比如是这样一个数组条件:newstring[]{兴业银行, ... [详细]
  • 本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境,其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时,子进程只是完全复制父进程的资源,这样得到的子进程独立于父进程,具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制,另外通过fork创建子进程系统开销很大。因此,在某些情况下,使用clone或pthread_create创建线程可能更加高效。 ... [详细]
  • Asp.net Mvc Framework 七 (Filter及其执行顺序) 的应用示例
    本文介绍了在Asp.net Mvc中应用Filter功能进行登录判断、用户权限控制、输出缓存、防盗链、防蜘蛛、本地化设置等操作的示例,并解释了Filter的执行顺序。通过示例代码,详细说明了如何使用Filter来实现这些功能。 ... [详细]
  • Python使用Pillow包生成验证码图片的方法
    本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号,并添加干扰象素,生成一幅验证码图片。需要配置好Python环境,并安装Pillow库。代码实现包括导入Pillow包和随机模块,定义随机生成字母、数字和字体颜色的函数。 ... [详细]
  • 本文介绍了一种图的存储和遍历方法——链式前向星法,该方法在存储带边权的图时时间效率比vector略高且节省空间。然而,链式前向星法存图的最大问题是对一个点的出边进行排序去重不容易,但在平行边无所谓的情况下选择这个方法是非常明智的。文章还提及了图中搜索树的父子关系一般不是很重要,同时给出了相应的代码示例。 ... [详细]
  • IhaveconfiguredanactionforaremotenotificationwhenitarrivestomyiOsapp.Iwanttwodiff ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • 本文讨论了使用差分约束系统求解House Man跳跃问题的思路与方法。给定一组不同高度,要求从最低点跳跃到最高点,每次跳跃的距离不超过D,并且不能改变给定的顺序。通过建立差分约束系统,将问题转化为图的建立和查询距离的问题。文章详细介绍了建立约束条件的方法,并使用SPFA算法判环并输出结果。同时还讨论了建边方向和跳跃顺序的关系。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • Java自带的观察者模式及实现方法详解
    本文介绍了Java自带的观察者模式,包括Observer和Observable对象的定义和使用方法。通过添加观察者和设置内部标志位,当被观察者中的事件发生变化时,通知观察者对象并执行相应的操作。实现观察者模式非常简单,只需继承Observable类和实现Observer接口即可。详情请参考Java官方api文档。 ... [详细]
  • Android自定义控件绘图篇之Paint函数大汇总
    本文介绍了Android自定义控件绘图篇中的Paint函数大汇总,包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数,可以更好地掌握Paint的用法。 ... [详细]
  • Explain如何助力SQL语句的优化及其分析方法
    本文介绍了Explain如何助力SQL语句的优化以及分析方法。Explain是一个数据库SQL语句的模拟器,通过对SQL语句的模拟返回一个性能分析表,从而帮助工程师了解程序运行缓慢的原因。文章还介绍了Explain运行方法以及如何分析Explain表格中各个字段的含义。MySQL 5.5开始支持Explain功能,但仅限于select语句,而MySQL 5.7逐渐支持对update、delete和insert语句的模拟和分析。 ... [详细]
  • 用Vue实现的Demo商品管理效果图及实现代码
    本文介绍了一个使用Vue实现的Demo商品管理的效果图及实现代码。 ... [详细]
author-avatar
手机用户2502859707
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有