找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 54|回复: 2

求助:每个线程块都输出同样的数据,如何对其求和

[复制链接]
发表于 2018-9-4 08:45:41 | 显示全部楼层 |阅读模式
ESC4000G3
每个线程块都输出同样的数据矩阵(大小n*1),如何对其求和.
回复

使用道具 举报

发表于 2018-9-10 15:09:37 | 显示全部楼层
Jetson TX2
Paullee:

对于对多个N元素的向量(姑且将这里的N*1的矩阵看成向量好了)中的元素求和。目前有多种方式。

其中流行的是Log2的规约求和,这点在手册上也有源代码。这种并行的规约求和往往是在性能和延迟上的折中。

当向量的总数较多的时候,或者N较小的时候,你也可以选择一个线程只负责一个向量(没错,这就像是CPU那样的串行对每个向量的元素进行求和,例如一个for即可)。这种方式如果注意了访存(例如可以通过shared memory中转一次以进行合并),那么效率还是很不错的(比并行log2规约求和的效率高),但需要注意,精度可能会下降到类似CPU的水平。

屠戮人神
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

快速回复 返回顶部 返回列表