1
CUDA / 求助!python中如何调用cudart64.dll并执行里面的cudaSetDeviceFlags函数?或者有其他方法调用这个函数?
« 于: 六月 28, 2021, 07:42:22 pm »
https://bbs.gpuworld.cn/index.php?topic=58836.0,如这篇文章所说,我想设定BlockingSync的设备标志,来阻塞host线程以获取更高的性能,否则CPU总是处于100%的自旋轮询。但是Pytorch没有这个选项,所以我考虑通过用ctypes调用cudaSetDeviceFlags,但是应该是失败,总之没有效果。pyqt的线程依然是busy polling的状态。这个问题困扰了我很久,有什么解决办法吗?不胜感激!盼回复。