列出帖子

该操作将允许你查看该会员所有的帖子,注意你只能看到你有权限看到的板块的帖子。


显示所有帖子 - rainhard

页: [1]
1
CUDA / Re: 多线程调用GPU问题
« 于: 九月 11, 2019, 02:48:46 pm »
下图里4个host线程,每个线程里创建一个stream,期望是每个线程的内存拷贝顺序执行,和kernel可以overlap。
但从nvvp图上看,各线程的memcpy和launchKernel相互影响,虽然stream1的拷贝完成了,但kernel并没能跟着执行。
我猜测是cuda的调用内部有锁机制,一个context里的cuda调用还是顺序执行的,这样的话多个host线程的意义不大。
[/size]测试总体时间基本是4倍的单线程时间。

2
CUDA / 多线程调用GPU问题
« 于: 九月 10, 2019, 08:44:26 am »
目的是将GPU上的实现的功能封装成库对外调用,用多线程时发现时间反而变长,更像是顺序执行的,用nvvp查看,多线程调用的cuda函数耗时比较长。感觉一个context上的调用都是顺序执行。
先请教前辈这方面的经验,是不是不支持多线程调用。

页: [1]