《OpenCL异构计算》

  • 12 replies
  • 5732 views
*

sisiy

  • *****
  • 246
    • 查看个人资料
《OpenCL异构计算》
« 于: 八月 01, 2013, 11:11:00 pm »

编辑推荐
《OpenCL异构计算》可帮助学生和研究人员更好地理解通用异构计算(尤其是OpenCL提供的解决方案),尤其是适合不同经验水平的学生,可以作为OpenCL课程的教材或其他课程的参考,例如并行编程课程和高级课程。
作者简介
作者:(美国)贾斯特(Benedict R.Gaster) (美国)Lee Howes (美国)David Kaeli 等 译者:张云泉 张先轶 姚继锋 龙国平

Benedict R.Gaster是一位致力于研究下一代异构处理器编程模型的软件架构师,具体研究新一代处理器(同时包含CPU和GPU加速器)进行并行编程的高层次抽象。他对OpenCL的设计做出了广泛的贡献,并在Khronos Group(科纳斯组织)的开放标准联盟中代表AMD。他因为类型系统的可扩展标记和变量的研究成果而获得计算机科学博士学位。
Lee Howes已经在AMD工作两年多,目前的研究集中于未来异构计算的编程模型。他的研究举在于如何以声明方式表示迭代域到数据的映射,用通俗易懂的方式向开发人员说明复杂的架构概念和优化技术,这两者都通过编程模型的改进和教育来实现。他因为这一领域的研究成果而获得伦敦帝国学院计算机科学的博士学位。
David Kaeli获得罗格斯大学电气工程专业的学士和博士学位,雪城大学计算机工程专业的硕士学位。他是东北大学工程学院本科课程的副院长兼欧洲经委会学院的全职教授,东北大学计算机系统结构研究实验室主管(NUCAR负责人)。在1993年加入东北大学之前,他曾在IBM工作12年。在这12年当中,后7年在T.J.Watson研究中心(位于纽约市Yorktown Heights)工作。作为合著者发表了200多篇经过严格评审的文献。他的研究范围很广,包括微架构到后端编译器和软件工程。他指导了GPU计算领域方面的很多研究项目。目前,他担任计算机系统结构IEEE技术委员会主席。他是IEEE会士和ACM成员。
Perhaad Mistry目前在东北大学攻读博士学位。他获得孟买大学电子工程专业学士学位和东北大学计算机工程专业硕士学位。他目前是东北大学计算机系统结构实验室的一员,导师是David Kaeli。他做过很多并行计算项目。他曾为GPGPU平台的物理模拟设计了可扩展数据结构,还针对异构设备实施了医疗重建算法。目前的研究重点在于异构计算分析工具的设计。他正在研究采用诸如OpenCL之类的标准是否能够用于构建出合适的工具来简化当下跨大量异构设备运行的并行编程和性能分析。
张云泉博士,中国科学院软件研究所并行软件与计算科学实验室执行主任,中科院计算机科学国家重点实验室研究员,博士生导师。
1995年北京理工大学计算机科学与技术系计算机应用专业,获工学学士学位;2000年中国科学院软件研究所计算机软件与理论专业硕博连读,获工学博士学位。主要研究方向为大型并行数值软件、并行程序设计和性能评价、并行计算和并行编程模型,等。已在国内外学术刊物上发表论文一百余篇,出版译著一本,论著章节三章,申请专利两项,软件著作权三项。获得中科院软件所首批杰出青年人才专项计划支持。曾获国家科技进步奖二等奖一项,获中科院科技进步二等奖一项,获2000年度中科院院长奖学金优秀奖。连读七年(2004—2010)获中国软件行业协会全国先进个人。兼任中国计算机学会YOCSEF学术委员会主席(2010.5—2011.5),中国软件行业协会常务理事/数学软件分会秘书长,中国计算机学会理事/高性能计算专业委员会秘书长,国家863“高性能计算机评测中心”技术委员会委员,CCF《计算机学会通讯》、《计算机科学》和中国科学院《科研信息化技术及应用》编委。中国高性能计算机TOP100排行榜的主要组织者和发布者。2008年—2011年HPC China程序委员会共同副主席。IEEE IWPAPS08和IWPAPS09程序委员会共同主席,IEEE ICPADS2008、PAAP09、FCST09、FutureTech 2010、ACM ICS 2010、IEEE IPDPS2012、IEEE CCGrid 2012、FutureTech 2012程序委员会委员。IEEE CSE 2010程序委员会共同主席。ISC 2012 Steering Committee成员;SC 2012程序委员会委员。中国软件行业协会常务理事,中国计算机学会理事。
张先轶,中国科学院软件研究所并行软件与计算科学实验室助理研究员。2007年硕士毕业于北京理工大学计算机学院,2005年本科毕业于北京理工大学计算机科学与工程系。主要研究兴趣包括,面向GPU等异构系统的并行算法与软件性能优化,自适应性能调优等。
姚继锋博士,1998年清华大学应用数学系获学士学位,2004年中国科学院软件研究所获计算机软件与理论专业博士学位。曾担任上海超级计算中心研发部经理,高性能计算技术总监,现担任中科院软件所高级工程师,硕士生导师,并行软件与计算科学实验室主任助理,中科嘉速(北京)并行软件有限公司总经理。主要研究方向并行软件与算法、大规模数值计算方法、海量数据处理和可视化技术。先后主持和参与了多个国家和地方重大科研和软件研发项目,其中包括国家863重大项目《天体大规模并行数值计算软件平台的研制》(课题副组长)、863重点项目《新概念高效能计算机体系结构及系统研究开发》(总体组成员,子课题负责人)、上海市信息化专项资金项目《并行程序集成开发环境》、 《基于网格技术的企业虚拟计算平台》、 《材料模拟高性能集成平台》(均为课题负责人)。
龙国平博士,2000年9月到2004年6月,中南大学计算机科学与技术专业毕业,获工学学士学位;2004年9月到2010年6月,中国科学院计算技术研究所体系结构方向硕博连读,获工学博士学位。博士论文题目《局部性制导的多核/多线程处理器片上资源共享研究》,获2011年CCF博士论文提名奖。现为中科院软件研究所助理研究员。2011年6月到2012年7月,美国加州大学圣巴巴拉分校系统结构实验室访问研究。主要研究方向为计算机体系结构、并行计算以及大规模数据处理,发表论文14篇,授权专利2项。
第1章 并行编程入门
引言
OpenCL
本书目标
并行思维
并发编程模型和并行编程模型
线程和共享内存
消息传递通信
不同的并行粒度
数据共享和同步
本书结构
参考文献
扩展阅读和相关网站
第2章 OpenCL简介
引言
OpenCL标准
OpenCL规范
kernel和OpenCL执行模型
平台和设备
主机—设备交互
执行环境
上下文
命令队列
事件
内存对象
flush命令和finish命令
新建一个OpenCL程序对象
OpenCL的kernel
内存模型
编写kernel
向量相加实例的完整代码
小结
参考文献
第3章OpenCL设备架构
引言
硬件权衡
性能随频率的提升及其限制
超标量执行
VLIW
SIMD和向量处理
硬件多线程
多核架构
集成:片上系统和APU
高速缓存层次和内存系统
架构设计空间
CPU设计
GPU体系结构
APU和类APU的设计
小结
参考文献
第4章OpenCL基本实例
引言
应用实例
简单的矩阵相乘
图像卷积实例
小结
第5章OpenCL的并发与执行模型
引言
kernel,work—item,workgroup和执行域
OpenCL同步:kemel,fence和barrier
队列与全局同步
OpenCL内存一致性
事件
命令barrier与marker
主机端内存模型
buffer对象
image对象
设备端内存模型
设备端宽松的内存一致性
全局内存
本地内存
常量内存
私有内存
小结
第6章OpenCL在CPU/GPU
平台上的实现
引言
OpenCL在AMD PHENOM Ⅱ X6上的实现
OpenCL在AMD RADEON HD6970
GPU上的实现
多线程和内存系统
基于clause的SIMD执行
资源分配
OpenCL的内存性能
OpenCL全局内存
本地内存——软件管理的cache
小结
参考文献
第7章OpenCL案例学习1:卷积
引言
计算卷积的kernel
选择合适的workgroup大小
将数据缓存到本地内存
执行卷积
小结
代码清单
主机端代码
kernel代码
参考文献
第8章OpenCL案例学习2:视频处理
引言
获得视频帧
CPU上的解码
在GPU上解码视频
在OpenCL中处理一个视频
在多个视频上处理多个不同effect
事件链
最终输出显示到屏幕
OpenCL/OpenGL协同工作能力
小结
第9章OpenCL案例学习3:
直方图
引言
选择适量的work—group
选择最优的work—group大小
全局内存访存优化
使用原子操作计算局部直方图
本地内存访存优化
局部直方图的规约
全局规约
完整的kernel代码
性能和小结
第10章OpenCL案例学习4:
混合粒子模拟
引言
计算概览
GPU实现
创建buffer
构造加速结构
计算碰撞
合成
CPU实现
负载均衡
性能和小结
生成均匀网格的kernel代码
粒子模拟的kernel代码
第11章OpenCL扩展
引言
扩展机制概览
设备拆分
双精度
参考文献
第12章OpenCL的性能剖析和
调试
引言
基于事件的剖析
AMD APP Profiler
收集OpenCL程序轨迹
收集OpenCL GPU Kernel性能
计数器
AMD APP KernelAnalyzer
演示AMD APP Profiler
启动AMD APP Profiler
使用应用程序的轨迹数据以发现性能瓶颈
使用GPU性能计数器发现kernel的性能瓶颈
调试OpenCL应用程序
gDEBugger概览
使用gDEBugger调试并行OpenCL应用程序
AMD printf扩展
小结
第13章 WebCL
引言
框架设计
WebCL实验性实现
Firefox扩展
连接JavaScript和OpenCL
WebCL动手练习
Web照片编辑器
讨论
小结
参考文献
扩展阅读和相关网站
索引

电子书下载地址:[hide]http://pan.baidu.com/share/link?shareid=1628691891&uk=4027385709[/hide]

(很厚一本书,你确定要看电子书吗?还是自己去买本书看看?)


(无标题)
« 回复 #1 于: 九月 21, 2013, 12:47:26 pm »
谢谢 楼主分享,Opencl才开始学习,目前主要用GPU加速SPH计算,您提供的资料对我很有用,再次感谢

(无标题)
« 回复 #2 于: 十一月 22, 2013, 08:51:40 pm »
挺好的资料 果断顶起

(无标题)
« 回复 #3 于: 十一月 23, 2013, 01:45:15 pm »
学习看看:)

(无标题)
« 回复 #4 于: 十一月 26, 2013, 08:20:31 pm »
求地址
谢谢了

(无标题)
« 回复 #5 于: 十二月 19, 2013, 10:15:53 am »
学习异构运算新人报道,求资料,谢谢!

(无标题)
« 回复 #6 于: 十二月 24, 2013, 12:58:37 pm »
感谢分享,下载学习!

(无标题)
« 回复 #7 于: 三月 21, 2014, 01:43:51 pm »
先看电子书

RE: 《OpenCL异构计算》
« 回复 #8 于: 八月 22, 2014, 06:53:45 pm »
我要电子书

(无标题)
« 回复 #9 于: 四月 27, 2015, 02:00:43 pm »
谢谢,下载来看看。

(无标题)
« 回复 #10 于: 八月 24, 2015, 11:49:44 am »
谢分享~

(无标题)
« 回复 #11 于: 七月 31, 2016, 09:56:40 pm »
不错哦~

(无标题)
« 回复 #12 于: 七月 05, 2017, 10:10:52 am »
看点例子