列出帖子

该操作将允许你查看该会员所有的帖子,注意你只能看到你有权限看到的板块的帖子。


只显示主题 - 塬上的卡夫卡

页: [1]
1
CUDA / cuda 矩阵计算思路求教!!!
« 于: 六月 08, 2021, 05:49:10 pm »
问题:计算一个960*960的图像矩阵,矩阵的每个元素是一个向量A(1*64)、矩阵M(64*64)和向量A的转置(64*1)这三者的乘积运算得来的,其中图像矩阵的每个元素对应一个向量A,根据其他输入参数得到,矩阵M为固定输入参数。
我目前的方法:一次分配对应960*960个线程,每个线程做 向量*矩阵*向量 这样的运算,然后得到结果,这样这个核函数要耗时8~9ms之久,非常不高效,
不知道大家有什么好的求解思路,感谢留言交流!

2
如题,求教如下:
 
    float* d_x;
    float* d_y;
    float* d_px;
    float* d_py;
    float* d_input;
    float* d_output;

    Kernel << <BlocksPerGrid, ThreadsPerBlock>> > (d_x, d_y,d_px, d_py,d_input, d_output);

该核函数中的前四个数据传递到核函数中,其数值都发生了改变,而第五个参数d_input很正确的传递了进去,请问这是什么原因,有朋友遇到过吗?


页: [1]