资源简介
cuda 权威指南习题答案pdf,以及在Linux code!!!!

代码片段和文件信息
#include
#include
#include
inline double seconds()
{
struct timeval tp;
struct timezone tzp;
int i = gettimeofday(&tp &tzp);
return ((double)tp.tv_sec + (double)tp.tv_usec * 1.e-6);
}
// Recursive Implementation of Interleaved Pair Approach
float recursiveReduce(float *data int const size)
{
// terminate check
if (size == 1) return data[0];
// renew the stride
int const stride = size / 2;
// in-place reduction
for (int i = 0; i < stride; i++)
{
data[i] += data[i + stride];
}
// call recursively
return recursiveReduce(data stride);
}
int main(int argc char **argv)
{
// initialization
int size = 1 << 24; // total number of elements to reduce
printf(“%s starting reduction with array size %d\n“ argv[0] size);
// execution configuration
int blocksize = 512; // initial block size
if(argc > 1)
{
blocksize = atoi(argv[1]); // block size from command line argument
}
// allocate host memory
size_t bytes = size * sizeof(float);
float *h_idata = (float *) malloc(bytes);
// initialize the array
for (int i = 0; i < size; i++)
{
h_idata[i] = (float)(rand() & 0xFF);
}
// cpu reduction
double iStart = seconds();
int cpu_sum = recursiveReduce (h_idata size);
double iElaps = seconds() - iStart;
printf(“cpu reduce elapsed %f sec cpu_sum: %d\n“ iElaps cpu_sum);
// free host memory
free(h_idata);
return EXIT_SUCCESS;
}
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
目录 0 2014-07-08 03:02 Solutions\
文件 6148 2014-07-07 20:01 Solutions\.DS_Store
目录 0 2014-06-22 07:22 Solutions\chapter02\
文件 232 2014-06-22 07:22 Solutions\chapter02\Makefile
文件 4545 2014-06-22 07:22 Solutions\chapter02\sumMatrixOnGPU-2D-grid-1D-block-two.cu
文件 4231 2014-06-22 07:22 Solutions\chapter02\sumMatrixOnGPU-2D-grid-2D-block-integer.cu
目录 0 2014-07-06 09:26 Solutions\chapter03\
文件 576 2014-07-05 06:28 Solutions\chapter03\Makefile
文件 1410 2014-06-23 14:57 Solutions\chapter03\nestedHelloWorldLimited.cu
文件 1354 2014-06-23 14:57 Solutions\chapter03\nestedHelloWorldNew.cu
文件 1552 2014-06-23 14:57 Solutions\chapter03\reduceFloat.c
文件 9853 2014-06-23 14:57 Solutions\chapter03\reduceFloatGpu.cu
文件 23598 2014-07-04 22:09 Solutions\chapter03\reduceInteger-16.cu
文件 24935 2014-07-05 07:17 Solutions\chapter03\reduceInteger-8-new.cu
文件 10531 2014-07-06 09:26 Solutions\chapter03\reduceInteger-sync.cu
目录 0 2014-07-06 20:27 Solutions\chapter04\
文件 1236 2014-06-23 14:57 Solutions\chapter04\globalVariable1.cu
文件 1053 2014-06-23 14:57 Solutions\chapter04\globalVariable2.cu
文件 368 2014-07-06 20:27 Solutions\chapter04\Makefile
文件 1607 2014-07-04 22:09 Solutions\chapter04\memTransfer.cu
文件 1908 2014-07-04 22:09 Solutions\chapter04\pinMemTransfer.cu
文件 4215 2014-06-25 00:06 Solutions\chapter04\readWriteSegment.cu
文件 4012 2014-06-25 00:06 Solutions\chapter04\readWriteSegmentUnroll.cu
文件 4467 2014-07-06 09:26 Solutions\chapter04\simpleMathAoS-align.cu
文件 4279 2014-07-06 20:27 Solutions\chapter04\simpleMathAoS-x.cu
文件 4987 2014-07-06 09:26 Solutions\chapter04\sumArrayZerocpy-offset.cu
文件 5594 2014-07-06 09:26 Solutions\chapter04\sumArrayZerocpyUVA-offset.cu
文件 6148 2014-06-25 08:35 Solutions\chapter04\sumArrayZerocpyUVA.cu
文件 14296 2014-06-25 05:58 Solutions\chapter04\transpose.cu
目录 0 2014-06-29 18:35 Solutions\chapter05\
文件 8978 2014-06-25 23:07 Solutions\chapter05\checkSmemRectangle.cu
............此处省略31个文件信息
- 上一篇:计算机网络课程设计----模拟Ethernet帧发送
- 下一篇:多元统计分析统计论文
相关资源
- NVIDIAOpticalFlowSDK-79c6cee80a2df9a196f20afd6
- MPI和CUDA在多层快速多极子中的应用
- CUDA实现的图像融合算法
- GPU高性能运算之CUDA源代码
- CUDA实现稀疏大矩阵乘法
- 使用CUDA做图像模湖匹配
- 深入浅出谈CUDA.
- 基于CUDA 的矩阵乘法和FFT 性能测试
- 《GPU高性能计算之CUDA》书中源代码
- CUDA9.2及cudnn7.1 for win10
- CUDA Fortran for Scientists and Engineers[英文
- _CPU_GPU协同并行计算研究综述_cuda_op
- nVIDIA显卡CUDA性能测试工具,可测试
- CUDA的图像分割并行算法的设计与实现
- Jetson-TX2手动安装CUDA和Cudnn.pdf
- cuda_cudpp源码
- 《CUDA C编程权威指南》的源码
- matconvnet的gpu编译版本(cuda7.5)
- NVAPI_R410-developer
- nvdia cuda c best practices guide
- CUDA && GPU 数据传输测试
- The CUDA Handbook: A Comprehensive Guide to
- CUDA by Example英文原书+自带源代码
- CUDA_C_Programming_Guide中文版
- GPU计算高级优化技术精简手册
- meanFilter.zip
- CUDA并行排序(1)——整数
- CUDA和OPENCL遥感影像正射校正
- 解决GTX970、980等不能用CUDA转码的问题
- cuda 常用dll库
评论
共有 条评论