资源简介
几个cuda源代码示例
1.cuda矩阵例子.cu
2.实现矩阵的乘法.cu
3....
/*****************************************************************************************/
/核心代码部分,实现了矩阵的乘法运算/核心代码部分,实现了矩阵的乘法运算
/*****************************************************************************************/
/
// Matrix multiplication kernel –thread specification
__global__ void MatrixMulKernel(Matrix M, Matrix N, Matrix P)
{
// 2D Thread ID
int tx = threadIdx.x;
int ty = threadIdx.y;
// Pvalue is used to store the element of the matrix
// that is computed by the thread
float Pvalue = 0;
// 并行计算体现在次,多个thread并行进行
// 每个thread计算一行与一列的乘积
for (int k = 0; k < M.width; ++k)
{
float Melement = M.elements[ty * M.pitch + k];
float Nelement = Nd.elements[k * N.pitch + tx];
Pvalue += Melement * Nelement;
}
// Write the matrix to device memory;
// each thread writes one element
P.elements[ty * P.pitch + tx] = Pvalue;
}
代码片段和文件信息
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 4190 2008-08-23 18:41 cuda code\code\cudaMallocAndMemcpy.cu
文件 2173 2008-08-23 17:45 cuda code\code\cuda矩阵例子.cu
文件 4167 2008-08-23 17:39 cuda code\code\my_first_kernel.cu
文件 1672 2008-08-26 16:20 cuda code\code\n_body.cu
文件 4321 2008-08-23 18:55 cuda code\code\reverseArry_singleblock.cu
文件 4865 2008-08-23 15:32 cuda code\code\实现矩阵的乘法.cu
目录 0 2012-07-23 17:04 cuda code\code
目录 0 2012-07-23 17:04 cuda code
----------- --------- ---------- ----- ----
21388 8
----------- --------- ---------- ----- ----
文件 4190 2008-08-23 18:41 cuda code\code\cudaMallocAndMemcpy.cu
文件 2173 2008-08-23 17:45 cuda code\code\cuda矩阵例子.cu
文件 4167 2008-08-23 17:39 cuda code\code\my_first_kernel.cu
文件 1672 2008-08-26 16:20 cuda code\code\n_body.cu
文件 4321 2008-08-23 18:55 cuda code\code\reverseArry_singleblock.cu
文件 4865 2008-08-23 15:32 cuda code\code\实现矩阵的乘法.cu
目录 0 2012-07-23 17:04 cuda code\code
目录 0 2012-07-23 17:04 cuda code
----------- --------- ---------- ----- ----
21388 8
相关资源
- cudnn5.1 for cuda8.0适合于64位Windows7系统
- cuda8.0适于Windows10_64位
- 基于CUDA的大量数字排序
- 百度云 win10 深度学习环境 cuda_9.0.17
- CUDA工具包9.0.176 for windows 10
- 树莓派GPU手册 videocore IV
- cuda9+cudnn7和cuda7+cudnn7for win7版本
- cuda9.1+配套cudnn
- pytorch-1.1.0-py3.6_cuda90_cudnn7_1.tar.bz2
- tensorflow_gpu-2.1.0-cp37-cp37m-win_amd64.whl
- 《Win10 opencv4.4 dnn cuda源码编译/安装说
- 二维TTI介质拟声波正演模拟和逆时偏
- 基于GPU加速的二维VTI介质正演模拟与
- 基于CUDA的VTI介质有限差分正演与逆时
- windows10环境下的CUDA9.1安装包
- cuda8.0.6-win10、cudnn-v6.0 for cuda 8.0
- win10 x64环境下的 cudart64_100.dll
- tensorflow1.12.0+gpucuda 9.0
- AES加密解密GPU程序
- CUDA_BY_EXAMPLE自带的几个头文件
- cuda_8.0.44_windows
- cuda开发cutilDLL
- CUDA C10.1 对vs2019的模板
- 卸载tensorflow-cpu重装tensorflow-gpu操作
- cuda_9.0.176_windows7+cudnn-9.0-windows7-x64-v
- openCL编程指导随书源代码
- cudart64_101.zip
- CUDA找数组的最大值.cu
- CUDA by example 中文:GPU高性能编程CUD
- cuda实现LU分解线性方程源代码
评论
共有 条评论