留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

简化球谐近似模型的图形处理器加速求解

贺小伟 陈政 侯榆青 郭红波

贺小伟, 陈政, 侯榆青, 郭红波. 简化球谐近似模型的图形处理器加速求解[J]. 红外与激光工程, 2016, 45(6): 624002-0624002(7). doi: 10.3788/IRLA201645.0624002
引用本文: 贺小伟, 陈政, 侯榆青, 郭红波. 简化球谐近似模型的图形处理器加速求解[J]. 红外与激光工程, 2016, 45(6): 624002-0624002(7). doi: 10.3788/IRLA201645.0624002
He Xiaowei, Chen Zheng, Hou Yuqing, Guo Hongbo. Graphics processing units-accelerated solving for simplify spherical harmonic approximation model[J]. Infrared and Laser Engineering, 2016, 45(6): 624002-0624002(7). doi: 10.3788/IRLA201645.0624002
Citation: He Xiaowei, Chen Zheng, Hou Yuqing, Guo Hongbo. Graphics processing units-accelerated solving for simplify spherical harmonic approximation model[J]. Infrared and Laser Engineering, 2016, 45(6): 624002-0624002(7). doi: 10.3788/IRLA201645.0624002

简化球谐近似模型的图形处理器加速求解

doi: 10.3788/IRLA201645.0624002
基金项目: 

国家自然科学基金(61372046);陕西省科技计划项目(2012KJXX-29,2013K12-20-12)

详细信息
    作者简介:

    贺小伟(1977-),男,副教授,博士生导师,主要从事医学图像处理及可视化方面的研究工作。Email:hexw@nwu.edu.cn

  • 中图分类号: TP391

Graphics processing units-accelerated solving for simplify spherical harmonic approximation model

  • 摘要: 作为辐射传输方程的高阶近似,简化球谐近似模型成为近年光学分子成像研究的重点,但计算效率低限制了它的广泛应用,为此提出一种基于图形处理器的并行加速策略,采用NVIDIA公司推出的统一计算设备架构,对求解过程中耗时最多的两个模块有限元刚度矩阵的生成和线性方程组的求解进行基于图形处理器的并行加速;根据统一计算设备架构的特点,进行计算任务的分配、存储器的合理使用以及数据的预处理三方面的优化;仿体及数字鼠仿真实验对比刚度矩阵生成时间以及平均迭代时间,以评价所提出方法的加速效果。实验结果表明,该方法可使求解速度提高30倍左右,展示了该方法在光学分子成像中的优势及潜力。
  • [1] Weissleder R. Molecular imaging: exploring the next frontier[J]. Radiology, 1999, 212(3): 609-614.
    [2] Massoud T F. Molecular imaging in living subjects: seeing fundamental biological processes in a new light[J]. Genes Development, 2003, 17(5): 545-580.
    [3] Ishimaru A. Diffusion of light in turbid material[J]. Applied Optics, 1989, 28(12): 2210-2215.
    [4] Liu Yongchuan, Song Enmin, Jin Renchao, et al. A tomographic reconstruction model for highly scattering media[J]. Infrared and Laser Engineering, 2014, 43(9): 3094-3098. (in Chinese)
    [5] Klose A D, Larsen E W. Light transport in biological tissue based on the simplified spherical harmonics equations[J]. Journal of Computational Physics, 2006, 220(1): 441-470.
    [6] Liemert A, Kienle A. Analytical solutions of the simplified spherical harmonics equations[J]. Optics Letters, 2010, 35(20): 3507-3509.
    [7] Klose AD, Poschinger T. Excitation-resolved fluorescence tomography with simplified spherical harmonics equations[J]. Physics in Medicine and Biology, 2011, 56(5): 1443-1469.
    [8] Guo Hongbo, Hou Yuqing, He Xiaowei, et al. Adaptive hp finite element method for fluorescence molecular tomography with simplified spherical harmonics approximation[J]. Journal of Innovative Optical Health Sciences, 2014, 7(2): 342-345.
    [9] Chen Xi, Qiu Yuehong, Yi Hongwei. Parallel programming design of star image registration based on GPU[J]. Infrared and Laser Engineering, 2014, 43(11): 3756-3761. (in Chinese)
    [10] Li Dayu, Hu Lifa, Mu Quanquan, et al. Wavefront calculation of liquid crystal adaptive optics based on CUDA[J]. Optics and Precision Engineering, 2010, 18(4): 848-854. (in Chinese)
    [11] Wang Maozhi, Guo Ke, Xu Wenxi. Hyperspectral remote sensing image parallel processing based on cluster and GPU[J]. Infrared and Laser Engineering, 2013, 42(11): 3070-3075. (in Chinese)
    [12] Meng Xiaolin, Qin An, Xu Jian, et al. Fist 3D medical image segmentation based on CUDA[J]. Chinese Journal of Medical Physics, 2010, 27(2): 1716-1720. (in Chinese)
    [13] Bolz J, Farmer I, Grinspun E, et al. Sparse matrix solvers on the GPU:conjugate gradients and multigrid[J]. ACM Transactions on Graphics (TOG), 2003, 22(3): 917-924.
    [14] Wang Xin, Zang Bin, Cao Xu, et al. Acceleration of early-photon fluorescence molecular tomography with graphics processing units[J]. Computational Mathematical Methods in Medicine, 2013, 9(1): 84-104.
    [15] Peng Kuan, Gao Xinbo, Qu Xiaochao, et al. Graphics processing unit parallelaccelerated solution of the discrete ordinates for photon transport in biological tissues.[J]. Applied Optics, 2011, 50(21): 3808-3823.
  • [1] 赵丽娟, 吴雨静, 徐志钮.  高阶轨道角动量传输光纤设计及传输特性研究(内封底文章) . 红外与激光工程, 2024, 53(3): 20240007-1-20240007-13. doi: 10.3788/IRLA20240007
    [2] 陈颖, 任登凤, 韩玉阁.  一种基于有限测点数据的地面目标瞬态温度场快速预测方法 . 红外与激光工程, 2023, 52(11): 20230103-1-20230103-16. doi: 10.3788/IRLA20230103
    [3] 赵丽娟, 尹丽星, 徐志钮.  基于布里渊动态光栅的横向压力传感器设计 . 红外与激光工程, 2023, 52(11): 20230137-1-20230137-9. doi: 10.3788/IRLA20230137
    [4] 张鹏辉, 赵扬, 李鹏, 周志权, 白雪, 马健.  基于有限元法的激光声磁检测系统优化研究 . 红外与激光工程, 2022, 51(7): 20210533-1-20210533-9. doi: 10.3788/IRLA20210533
    [5] 刘连伟, 董士奎, 陈前荣, 邹前进, 樊宏杰, 屈东胜.  基于CUDA并行计算的空中目标红外辐射成像计算 . 红外与激光工程, 2020, 49(4): 0404003-0404003-7. doi: 10.3788/IRLA202049.0404003
    [6] 刘全喜, 任钢, 李轶国, 岳通, 王莉, 肖星, 邓翠, 李佳玲.  激光二极管端面抽运梯度浓度掺杂介质激光器热效应的有限元法分析 . 红外与激光工程, 2019, 48(11): 1105004-1105004(11). doi: 10.3788/IRLA201948.1105004
    [7] 姬一鸣, 庄茂录, 张贵新, 陈爱萍, 王丽, 李文强.  有限探测死时间的高速测量设备无关-量子密钥分配 . 红外与激光工程, 2018, 47(S1): 55-59. doi: 10.3788/IRLA201847.S122001
    [8] 祁云平, 张雪伟, 胡月, 胡兵兵, 王向贤.  内嵌矩形腔楔形金属狭缝阵列的宽频异常透射 . 红外与激光工程, 2018, 47(S1): 213-218. doi: 10.3788/IRLA201847.S107001
    [9] 李志全, 刘同磊, 白兰迪, 谢锐杰, 岳中, 冯丹丹, 顾而丹.  纳米光栅的表面等离激元增强型GaN-LED . 红外与激光工程, 2018, 47(9): 920005-0920005(8). doi: 10.3788/IRLA201847.0920005
    [10] 赵敏, 熊召龙, 邢妍, 李小伟, 王琼华.  采用双目立体相机的实时集成成像拍摄系统 . 红外与激光工程, 2017, 46(11): 1103007-1103007(5). doi: 10.3788/IRLA201746.1103007
    [11] Sekou Singare, 陈盛贵, 钟欢欢.  激光透射焊接聚碳酸酯的有限元分析 . 红外与激光工程, 2016, 45(2): 206005-0206005(6). doi: 10.3788/IRLA201645.0206005
    [12] 张耀平, 樊峻棋, 龙国云.  变形镜在激光辐照下热畸变有限元模拟 . 红外与激光工程, 2016, 45(11): 1136002-1136002(5). doi: 10.3788/IRLA201645.1136002
    [13] 程勇, 朱孟真, 马云峰, 魏靖松, 刘旭, 丁方正, 谭朝勇, 陈霞, 郭延龙, 初华.  激光复合损伤机理与效应研究 . 红外与激光工程, 2016, 45(11): 1105005-1105005(7). doi: 10.3788/IRLA201645.1105005
    [14] 许兆美, 汪通悦, 裴旭, 蒋素琴, 李伯奎, 王庆安, 洪宗海.  Al2O3陶瓷激光多道铣削温度场有限元模拟 . 红外与激光工程, 2015, 44(2): 477-481.
    [15] 肖冬明, 何宽芳, 王迪.  基于多层有限元模型的激光选区熔化多层瞬态温度场演化规律研究 . 红外与激光工程, 2015, 44(9): 2672-2678.
    [16] 丁玲, 王涛, 杨洪波, 贾宏光.  高精度标准镜支撑结构的研究与设计 . 红外与激光工程, 2014, 43(4): 1172-1175.
    [17] 田立, 周付根, 孟偲.  基于嵌入式多核DSP 系统的并行粒子滤波目标跟踪 . 红外与激光工程, 2014, 43(7): 2354-2361.
    [18] 王为清, 杨立, 范春利, 吕事桂, 石宏臣.  Q235钢拉伸过程热塑性效应试验研究及有限元分析 . 红外与激光工程, 2013, 42(5): 1153-1160.
    [19] 朱敏, 陈宇, 杨春玲.  红外诱饵弹干扰特性有限元建模 . 红外与激光工程, 2013, 42(8): 1979-1986.
    [20] 马依拉木·木斯得克, 姚建铨, 陆颖, 吴宝群, 郝丛静, 段亮成.  高双折射高非线性低损耗八边形光子晶体光纤特性 . 红外与激光工程, 2013, 42(12): 3373-3378.
  • 加载中
计量
  • 文章访问数:  459
  • HTML全文浏览量:  92
  • PDF下载量:  123
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-10-08
  • 修回日期:  2015-11-08
  • 刊出日期:  2016-06-25

简化球谐近似模型的图形处理器加速求解

doi: 10.3788/IRLA201645.0624002
    作者简介:

    贺小伟(1977-),男,副教授,博士生导师,主要从事医学图像处理及可视化方面的研究工作。Email:hexw@nwu.edu.cn

基金项目:

国家自然科学基金(61372046);陕西省科技计划项目(2012KJXX-29,2013K12-20-12)

  • 中图分类号: TP391

摘要: 作为辐射传输方程的高阶近似,简化球谐近似模型成为近年光学分子成像研究的重点,但计算效率低限制了它的广泛应用,为此提出一种基于图形处理器的并行加速策略,采用NVIDIA公司推出的统一计算设备架构,对求解过程中耗时最多的两个模块有限元刚度矩阵的生成和线性方程组的求解进行基于图形处理器的并行加速;根据统一计算设备架构的特点,进行计算任务的分配、存储器的合理使用以及数据的预处理三方面的优化;仿体及数字鼠仿真实验对比刚度矩阵生成时间以及平均迭代时间,以评价所提出方法的加速效果。实验结果表明,该方法可使求解速度提高30倍左右,展示了该方法在光学分子成像中的优势及潜力。

English Abstract

参考文献 (15)

目录

    /

    返回文章
    返回