资源简介
Nbody问题采用treecode算法在GPU上的并行实现
代码片段和文件信息
# -*- coding: utf-8 -*-
import sys
SortList = []
Reorder = []
Construction = []
ComputeProp = []
Approx = []
inputFile = sys.argv[1]
f = open(inputFile ‘r‘)
f.readline()
count = 0
for line in f:
tokens = line.split(‘\t‘)
#remove eol symbol
tokens[3] = tokens[3].strip()
if(int(tokens[1]) == 0):
SortList.append(float(tokens[3]))
if(int(tokens[1]) == 1):
Reorder.append(float(tokens[3]))
if(int(tokens[1]) == 2):
Construction.append(float(tokens[3]))
if(int(tokens[1]) == 3):
ComputeProp.append(float(tokens[3]))
if(int(tokens[1]) == 4):
Approx.append(float(tokens[3]))
f.close()
#Write sort timing
outputFile = “logs/0_“ + inputFile
f = open(outputFile ‘w‘)
for data in SortList:
f.write(str(data) + “\n“)
f.close()
#Write reorder data
outputFile = “logs/1_“ + inputFile
f = open(outputFile ‘w‘)
for data in Reorder:
f.write(str(data) + “\n“)
f.close()
#Write construction timing
outputFile = “logs/2_“ + inputFile
f = open(outputFile ‘w‘)
for data in Construction:
f.write(str(data) + “\n“)
f.close()
#Write ComputeProperties timing
outputFile = “logs/3_“ + inputFile
f = open(outputFile ‘w‘)
for data in ComputeProp:
f.write(str(data) + “\n“)
f.close()
#Write approximation timing
outputFile = “logs/4_“ + inputFile
f = open(outputFile ‘w‘)
for data in Approx:
f.write(str(data) + “\n“)
f.close()
print “File processed!“
#26 3 Compute properties 0.49696
#27 4 Approximation 49.739
#28 0 Sorting 3.21206
#29 1 Data reordering 0.579392
#30 2 Tree-construction 4.2455
#31 3 Compute properties 0.50048
#32 4 Approximation 49.974
#33 0 Sorting 3.19478
#34 1 Data reordering 0.554944
#35 2 Tree-construction 4.36106
#36 3 Compute properties 0.50752
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 3889 2013-08-21 19:56 gpu&treecode\bonsai.txt
文件 27228 2011-12-20 19:32 gpu&treecode\bonsai2\CUDAkernels\build_tree.cu
文件 18782 2011-12-19 22:19 gpu&treecode\bonsai2\CUDAkernels\compute_properties.cu
文件 23561 2011-12-20 18:40 gpu&treecode\bonsai2\CUDAkernels\compute_propertiesD.cu
文件 40484 2011-12-19 22:28 gpu&treecode\bonsai2\CUDAkernels\dev_approximate_gravity.cu
文件 40795 2011-12-20 21:16 gpu&treecode\bonsai2\CUDAkernels\dev_approximate_gravity_let.cu
文件 11596 2011-12-19 22:19 gpu&treecode\bonsai2\CUDAkernels\parallel.cu
文件 14114 2011-12-19 22:19 gpu&treecode\bonsai2\CUDAkernels\scanKernels.cu
文件 12232 2011-12-19 22:19 gpu&treecode\bonsai2\CUDAkernels\sortKernels.cu
文件 14654 2011-12-19 22:19 gpu&treecode\bonsai2\CUDAkernels\support_kernels.cu
文件 28742 2011-12-20 20:46 gpu&treecode\bonsai2\CUDAkernels\timestep.cu
文件 49774 2011-12-20 20:51 gpu&treecode\bonsai2\include\my_cuda.h
文件 25497 2011-12-19 22:19 gpu&treecode\bonsai2\include\my_ocl.h
文件 2790 2011-12-20 22:28 gpu&treecode\bonsai2\include\node_specs.h
文件 21613 2011-12-20 21:32 gpu&treecode\bonsai2\include\octree.h
文件 816 2011-12-19 22:19 gpu&treecode\bonsai2\include\tipsydefs.h
文件 2007 2011-12-20 21:11 gpu&treecode\bonsai2\logProcess.py
文件 2608 2011-12-20 22:28 gpu&treecode\bonsai2\Makefile
文件 176 2011-12-19 22:20 gpu&treecode\bonsai2\profileCommand
文件 151 2011-12-19 22:19 gpu&treecode\bonsai2\profiler.conf
文件 15963 2011-12-20 19:06 gpu&treecode\bonsai2\src\build.cpp
文件 13037 2011-12-20 18:43 gpu&treecode\bonsai2\src\compute_properties.cpp
文件 50951 2011-12-20 21:51 gpu&treecode\bonsai2\src\gpu_iterate.cpp
文件 6830 2011-12-19 22:20 gpu&treecode\bonsai2\src\libraryInterface.cpp
文件 27844 2011-12-20 21:31 gpu&treecode\bonsai2\src\load_kernels.cpp
文件 19936 2011-12-20 22:36 gpu&treecode\bonsai2\src\main.cpp
文件 16111 2011-12-20 21:01 gpu&treecode\bonsai2\src\octree.cpp
文件 91528 2011-12-20 21:27 gpu&treecode\bonsai2\src\parallel.cpp
文件 3090 2011-12-19 22:20 gpu&treecode\bonsai2\src\sort_bodies.cpp
文件 16950 2011-12-20 21:39 gpu&treecode\bonsai2\src\sort_bodies_gpu.cpp
............此处省略9个文件信息
相关资源
- CUDA、GPU实现图像的sobel、prewitt、均值
- cuda、GPU实现向量相加
- 基于GPU的并行遗传算法
- GPU Gems 3
- FastLineRendererforUnity-GPULineandParticleSys
- 北极星架构显卡编辑器1.7版本
- GPU Games 三部曲合集
- Gpu pro1-7
- GPU pro shaderX GPU gems 全系列
- 基于CUDA架构实现GPU加速FDK重建算法研
- NVIDIA vGPU for vSphere xenserver rhel windows
- libcudnn7-doc_7.6.5.32-1+cuda10.2_amd64.deb
- 使用opengl 4.3的compute shader实现通用计
- cudart64_101.dll
- yolov3使用教程(从tensorflow-gpu环境搭建
- nvidia-docker-1.0.1-1.x86_64.rpm
- 哼唱检索的并行化方法研究与实现
- 深度学习入门工具介绍PPT——实践篇
- GPU-SPH源代码
- 基于NVIDIA的GPU加速的各向异性二维三
- HLSL语言编程
评论
共有 条评论