如何查看cuda程序瓶颈

  • 1 replies
  • 304 views
如何查看cuda程序瓶颈
« 于: 五月 16, 2019, 10:22:18 am »
其实简单的cuda程序写起来并不是特别困难,而难在如何去优化,而这优化的前提是要知道哪个地方耗时多,所以如何查看cuda程序的瓶颈是很重要的技能,我有下两点疑惑
a.对于visual profiler软件的使用,目前我只会用它查看各个kernel的执行时间,它有没有更高阶的应用,比方说查看内存读取时间等
b.对于vs2017中的nsight我尝试使用,但是还是不会用,网上的中文文档也比较老,有没有新一点的教程
c.大家在写cuda程序时是如何进行优化的,最好说一下详细优化过程

Re: 如何查看cuda程序瓶颈
« 回复 #1 于: 五月 16, 2019, 12:53:57 pm »
其实简单的cuda程序写起来并不是特别困难,而难在如何去优化,而这优化的前提是要知道哪个地方耗时多,所以如何查看cuda程序的瓶颈是很重要的技能,我有下两点疑惑
a.对于visual profiler软件的使用,目前我只会用它查看各个kernel的执行时间,它有没有更高阶的应用,比方说查看内存读取时间等
b.对于vs2017中的nsight我尝试使用,但是还是不会用,网上的中文文档也比较老,有没有新一点的教程
c.大家在写cuda程序时是如何进行优化的,最好说一下详细优化过程

无论是NSight(作为插件)还是Visual Profiler, 均自带有文档手册,你得先看一下手册。或者你也可以看一下之前本论坛lady录制过的视频。但无法直接就地教学,话题太大了。