首页
帮助
搜索
日历
登录
注册
CUDA中FAM指令问题
GPU世界论坛
GPU开发园地(Developers)
CUDA
CUDA中FAM指令问题
« 上一篇主题
下一篇主题 »
打印
页: [
1
]
CUDA中FAM指令问题
1 replies
995 views
jinyer
14
CUDA中FAM指令问题
«
于:
一月 13, 2022, 11:01:31 am »
请教大家:CUDA中编译器会自动优化a*b+c为FMA单指令吗?还是只有使用fma(a,b,c)才会融合乘加为单指令
已记录
屠戮人神
399
Re: CUDA中FAM指令问题
«
回复 #1 于:
一月 21, 2022, 12:58:49 pm »
引用自: jinyer 于 一月 13, 2022, 11:01:31 am
请教大家:CUDA中编译器会自动优化a*b+c为FMA单指令吗?还是只有使用fma(a,b,c)才会融合乘加为单指令
当你的a,b,c都是float或者double类型的时候,会自动编译成单条的FFMA或者DFMA的,无需手工。
已记录
打印
页: [
1
]
« 上一篇主题
下一篇主题 »
登录
注册
Remember me?
忘了您的密码吗?
新帖
Re: 访问texture和global memory的区别
作者
屠戮人神
(
CUDA
)
Re: SM、block、warp
作者
屠戮人神
(
CUDA
)
Re: 线程分化-以warp为分支单位
作者
屠戮人神
(
CUDA
)
Re: 线程分化-以warp为分支单位
作者
jinyer
(
CUDA
)
线程分化-以warp为分支单位
作者
jinyer
(
CUDA
)
Popular Topics
《如何用NVIDIA Nsight调试GPU程序》在线培训
37922 views 25 replies
float类型数据计算问题
28982 views 11 replies
运行我的程序时,英伟达板卡Jetson TX2比Jetson Tx1速度更慢可能是什么原因??求解答
28304 views 4 replies
怎么让线程互斥修改常量存储的值
27328 views 6 replies
NVIDIA TensorRT推理服务器支持深度学习推理
26452 views 2 replies
【转载】我在深度学习上用GPU的经验
23893 views 3 replies