首页 > 其他分享 >cuda nbody实验

cuda nbody实验

时间:2023-05-11 18:45:32浏览次数:31  
标签:每个 处理 线程 cuda 实验 共享内存 nbody

1 并行化

非常简单得,直接分配4096线程处理,每个线程处理一个天体。每个kernel函数中的循环,就去全局变量里面找其他点的信息,进行计算就好了

2 优化

2.1 共享内存

按1中的,是每个线程处理n个,这里的话,每个线程分批次处理,每次处理一部分。引入共享内存。

标签:每个,处理,线程,cuda,实验,共享内存,nbody
From: https://www.cnblogs.com/jye159X/p/17391459.html

相关文章

  • 实验5
    试验任务11#include<stdio.h>#defineN4intmain(){intx[N]={1,9,8,4};inti;int*p;//方式1:通过数组名和下标遍历输出数组元素for(i=0;i<N;++i)printf("%d",x[i]);printf("\n");//方式2:通过指针变量遍历输出数组元素(写法1)for(p=x;p<x+......
  • 实验5
    #include<stdio.h>#defineN4intmain(){intx[N]={1,9,8,4};inti;int*p;//方式1:通过数组名和下标遍历输出数组元素for(i=0;i<N;++i)printf("%d",x[i]);printf("\n");//方式2:通过指针变量遍历输出数组元素(写法1)for(p=x;p<x+N;++p)......
  • 实验5
    实验1源代码#include<stdio.h>#defineN4intmain(){ intx[N]={1,9,8,4}; inti; int*p; for(i=0;i<N;++i) printf("%d",x[i]); printf("\n"); return0;} 实验截图 实验1.2源代码(使用指针变量p间接访问二维数组)#include<stdio.h>intmain(){......
  • 实验5
    1 #include<stdio.h>intmain(){intx[2][4]={{1,9,8,4},{2,0,4,9}};inti,j;int*p;int(*q)[4];for(i=0;i<2;++i){for(j=0;j<4;++j)printf("%d",x[i][j]);printf("\n");}......
  • 实验五
    task1_1.c#include<stdio.h>#defineN4intmain(){intx[N]={1,9,8,4};inti;int*p;for(i=0;i<N;++i)printf("%d",x[i]);printf("\n");for(p=x;p<x+N;++p)p......
  • 实验5
    task1_1#include<stdio.h>#defineN4intmain(){intx[N]={1,9,8,4};inti;int*p;for(i=0;i<N;++i)printf("%d",x[i]);printf("\n");for(p=x;p<x+N;++p)......
  • 工程数学实验二
    clearall;closeall;clc;%定义目标函数f=@(x)100*(x(1)^2-x(2))^2+(x(1)-1)^2;%定义梯度函数grad_f=@(x)[400*x(1)*(x(1)^2-x(2))+2*(x(1)-1);-200*(x(1)^2-x(2))];%定义终止准则epsilon=1e-5;%定义最大迭代次数max_iter=1000;%定义初始点in......
  • Ubuntu20.04安装CUDA和CUDNN
    CUDA是GPU深度学习的运行库,那么cuDNN就是训练加速工具,两者要相互配合使用,所以一般机器学习需要训练引擎(tensorflow-gpu)+CUDA+cuDNN使用。想不安装cuDNN是不可以的,而且cuDNN版本要和CUDA版本相互搭配。1、前置工作查看显卡信息nvidia-smi+-----------------------------......
  • 实验5
    1.实验任务1task1_1.c#include<stdio.h>#defineN4intmain(){intx[N]={1,9,8,4};inti;int*p;//方式1:通过数组名和下标遍历输出数组元素for(i=0;i<N;++i)printf("%d",x[i]);printf("\n");//方式2:通过指针变量遍历输出数组元素(写法1)for(p=......
  • CUDA已经安装但nvcc -V显示command not found(Ubuntu20.04LTS系统)
    背景介绍安装了NVIDIA驱动程序,同时也安装了CUDA,但使用nvcc-V命令提示不存在,如下所示:1Command'nvcc'notfound,butcanbeinstalledwith:2sudoaptinstallnvidia-cuda-toolkit知识补充:为什么要使用nvcc命令?使用nvcc-V命令可以查看CUDA的版本,如下所示为正常的输入......