DAY6:优化CUDA应用程序

  • 0 replies
  • 488 views
*

sisiy

  • *****
  • 234
    • 查看个人资料
DAY6:优化CUDA应用程序
« 于: 十二月 21, 2020, 01:58:05 pm »
7.优化CUDA应用程序
在完成每一轮应用程序并行化之后,开发人员可以着手优化实现以提高性能。由于可以考虑许多可能的优化,因此充分了解应用程序的需求可以帮助使过程尽可能地流畅。但是,与整个APOD一样,程序优化是一个反复的过程(确定优化机会,应用和测试优化,验证所实现的加速并重复),这意味着程序员不必花费大量资金。在看到良好的加速效果之前,先记住所有可能的优化策略。相反,可以在学习策略时逐步应用它们。

从重叠的数据传输一直到计算一直到微调浮点运算序列,优化可以应用于各种级别。可用的概要分析工具对于指导该过程非常有用,因为它们可以帮助建议开发人员进行优化工作的最佳方案,并为该指南的优化部分的相关部分提供参考。