CUDA中FAM指令问题

  • 1 replies
  • 994 views
CUDA中FAM指令问题
« 于: 一月 13, 2022, 11:01:31 am »
请教大家:CUDA中编译器会自动优化a*b+c为FMA单指令吗?还是只有使用fma(a,b,c)才会融合乘加为单指令

Re: CUDA中FAM指令问题
« 回复 #1 于: 一月 21, 2022, 12:58:49 pm »
请教大家:CUDA中编译器会自动优化a*b+c为FMA单指令吗?还是只有使用fma(a,b,c)才会融合乘加为单指令

当你的a,b,c都是float或者double类型的时候,会自动编译成单条的FFMA或者DFMA的,无需手工。