首页
帮助
搜索
日历
登录
注册
列出帖子 - wcuder
GPU世界论坛
wcuder的资料
列出帖子
显示所有帖子
个人资料
常规信息
列出统计资料
列出帖子
显示所有帖子
只显示主题
显示附件
列出帖子
该操作将允许你查看该会员所有的帖子,注意你只能看到你有权限看到的板块的帖子。
显示所有帖子
只显示主题
显示附件
显示所有帖子 - wcuder
页: [
1
]
2
3
1
CUDA
/
Re: mpi+openmp+cuda混合怎么用,求提供个指导或者参考
«
于:
十二月 27, 2019, 09:33:54 am »
感谢分享
2
CUDA
/
mpi+openmp+cuda混合怎么用,求提供个指导或者参考
«
于:
十二月 24, 2019, 07:57:10 pm »
要用到这三者的混合编程来扩大并行计算,比如对大规模流体问题的模拟,但不知道怎么下手,求论坛里的高手们给个帮助。
谢谢!
3
CUDA
/
cuda程序中怎么实现数组的动态管理(删除、添加等等)
«
于:
十月 25, 2019, 02:42:15 pm »
想在程序中对一维数组进行动态管理,能够对数组大小进行增减,有什么方法能够做到的,好困扰???
4
CUDA
/
Re: 适合台式工作站的显卡
«
于:
四月 10, 2019, 02:18:00 pm »
明白了,有人说这个titanV卡对编程和计算都会出现错误,有较大的偏差,会是这样吗?
另外,这个卡装在NVIDIA的quadro系列的台式工作站中应该没问题,可以正常使用吧
5
CUDA
/
适合台式工作站的显卡
«
于:
四月 10, 2019, 11:32:06 am »
想要实现大规模流体模拟,在双精度计算下,选择titanV卡适合吗,因为要多卡实现,但貌似不支持nvlink和SLI?有影响吗
6
CUDA
/
Re: 求助,下面这段计算怎么组织使得结果正确
«
于:
三月 23, 2019, 03:51:43 pm »
好的,可以在尝试如您的建议去修改计算。
再有点疑问的是,运行完发现double所用时间比float少,但float计算性能不是更好些吗怎么反而时间耗费更多?
另外,版主能否推荐几款double计算好的卡?供参考下 ,多谢!
7
CUDA
/
Re: 求助,下面这段计算怎么组织使得结果正确
«
于:
三月 22, 2019, 03:02:17 pm »
已解决了,把所有的数据类型换成double型就不存在该问题了,纠结了好长时间,原来是存储类型出现问题。(ps:进行小量数据计算无误,一旦计算数据量变大便无可挽救似的,最后还是先对double妥协了
),多谢版主的建议和分析。(/抱拳/抱拳/抱拳)
8
CUDA
/
Re: 求助,下面这段计算怎么组织使得结果正确
«
于:
三月 22, 2019, 01:25:42 am »
好的,我接着改改试一下,发现问题在来发帖说明。
祝您晚安!
9
CUDA
/
Re: 求助,下面这段计算怎么组织使得结果正确
«
于:
三月 22, 2019, 01:15:36 am »
很遗憾,那个中间过程转换成double也没能改变,
,这个真是无从下手。
10
CUDA
/
Re: 求助,下面这段计算怎么组织使得结果正确
«
于:
三月 22, 2019, 12:53:38 am »
好的,可能存在您分析的情况,是float表示达到极限了,因为这个vt计算过程结果就很小(举个例子,v=1.72958,t=10-4),才可能这样。
假如出现这种情况,除了那个中间变量转换成double类型外,在不改变其数据存储类型的情况,还有其他的方法避免这种精度缺失问题吗?
11
CUDA
/
Re: 求助,下面这段计算怎么组织使得结果正确
«
于:
三月 22, 2019, 12:28:34 am »
首先,公式没有错误,这个是准确无误的;
其次,这个计算过程是好几万次的循环进行的,而且中间结果没有偏差,就是在后三分之一的循环后开始有问题(根据输出结果大概估算了一下)。因此,就如您说建议的调试方法一样,我用matlab画出每一步的结果才发现其中的问题。
此外,我稍微改变下式子的计算组织形式结果便会出现很大偏差,因此才怀疑我的这些式子计算有问题,但实在没法获知其中问题出在哪,甚是郁闷。。
ps:附加一张结果图,图中红圈内的结果就是错误的(因为x和y错乱导致),旁边的才是正确的。
12
CUDA
/
Re: 求助,下面这段计算怎么组织使得结果正确
«
于:
三月 22, 2019, 12:05:44 am »
你好,非常感谢这么晚还耐心地回复,真的谢谢!(/抱拳/抱拳)
因为问题实在调不下去了,没办法,所以深夜打扰了。
这个代码上的xy是已经存在的值(开始计算前已经获取了,这里没带上而已),上述代码就是要对其进行更新,重新计算新值(就是nx和ny,计算后有问题),此外,这些左边量没有被引用或者改变,都主要是用于x和y的计算,没有其他的改动。(补充一下:往后的代码都是在新值x和y更新后进行的,因此跟后面代码无关)
13
CUDA
/
求助,下面这段计算怎么组织使得结果正确
«
于:
三月 21, 2019, 10:59:09 pm »
数据都是float类型,在内核函数上计算这段代码(代码如下图),最后的结果总是出错(导致x和y偏离正常值),调试很多很多遍最后就出现这计算上,实在不知原因,求帮忙分析下???
14
CUDA
/
Re: 内核函数中定义的变量增多会影响计算结果的正确性吗
«
于:
三月 19, 2019, 11:28:24 pm »
多说一句,计算过程前面大部分都是正确的,就是到最后一点点时候计算开始不对,进而影响了整个结果,故此才困惑。。。
15
CUDA
/
Re: 内核函数中定义的变量增多会影响计算结果的正确性吗
«
于:
三月 19, 2019, 10:52:52 pm »
是的,赞同您的说法,我也觉得自己想的有误,但方法计算是可行的,就是让线程数量增多结果便出现错误,暂时还未找到原因,所以存在着一些疑惑,应该是线程分配或者资源限制等方面问题
页: [
1
]
2
3
登录
注册
Remember me?
忘了您的密码吗?
新帖
Re: 我的GPU过程没进入计算
作者
2017012835
(
CUDA
)
Re: Warp 分歧
作者
2017012835
(
CUDA
)
我的GPU过程没进入计算
作者
17638737569
(
CUDA
)
cuda fortran怎么实现和openmp的混合编程
作者
17638737569
(
CUDA
)
GTC 征文活动——GTC讲座认领清单
作者
sisiy
(
培训信息
)
Popular Topics
《如何用NVIDIA Nsight调试GPU程序》在线培训
47469 views 25 replies
float类型数据计算问题
35657 views 11 replies
运行我的程序时,英伟达板卡Jetson TX2比Jetson Tx1速度更慢可能是什么原因??求解答
33544 views 4 replies
怎么让线程互斥修改常量存储的值
33065 views 6 replies
NVIDIA TensorRT推理服务器支持深度学习推理
31823 views 2 replies
【转载】我在深度学习上用GPU的经验
29559 views 3 replies