问题描述: kernel核函数内,我将数据保存在本地内存或者共享内存中,请问cuda中是否有类似与memcpy函数可以将本地内存和共享内存中的数据一次性搬运至全局内存中呢?还是只能for遍历,一个个数据搬运?