• 2025-01-14parallel programming in CUDA C(GPU并行程序实现数组求和 & Julia set)
    前言我们这节会学习到:Ⅰ.CUDA在实现并行性时采用的一种重要方式Ⅱ.用CUDAC编写第一段并行代码一、Summingvector#defineN10voidadd(int*a,int*b,int*c){inttid=0;//这是第0个CPU,因此索引从0开始while(tid<N){c[tid]=a[tid]+b[tid];
  • 2024-08-31并行程序设计基础——组通信(3)
    目录一、组归约二、归约并散发三、扫描四、π值计算五、不同类型归约操作的对比六、不正确的组通信方式七、MINLOC和MAXLOC八、用户自定义归约操作九、小结    前两节我们介绍了组通信中常用的一对多、多对一以及多对多接口调用,本节继续对其余组通信操作进
  • 2024-08-10CUDA入门必看,如何高效地编写并行程序
    CUDA入门必看,如何高效地编写并行程序进入公司实习已经一个月有余,从编写第一个kernel开始到现在分析优化LLM程序,我的CUDA学习成果颇丰,项目进展顺利,现将我的学习路径整理分享出来。跟随在GPU芯片架构领域深耕多年的企业家王旭老师,我从一开始对GPU架构领域全无了解,到如今上手LLM
  • 2024-06-12一个串行程序,94%的执行时间花费在一个可以并行化的函数中。现使其并行化,问该并行程序在10个处理机上执行所能达到的加速比是多少?能达到的最大加速比是多少?2)一个并行程序,在单个处理机上执行,6
    经测试发现,1)一个串行程序,94%的执行时间花费在一个可以并行化的函数中。现使其并行化,问该并行程序在10个处理机上执行所能达到的加速比是多少?能达到的最大加速比是多少?2)一个并行程序,在单个处理机上执行,6%的时间花费在一个I/O函数中,问要达到加速比10,至少需要多少个处理机?
  • 2024-01-29《实战Java高并发程序设计(第2版)》PDF
    内容简介在单核CPU时代,单任务在一个时间点只能执行单一程序,随着多核CPU的发展,并行程序开发变得尤为重要。《实战Java高并发程序设计(第2版)》主要介绍基于Java的并行程序设计基础、思路、方法和实战。第一,立足于并发程序基础,详细介绍Java进行并行程序设计的基本方法。第二,进一步详细
  • 2023-11-2411.23日记
    MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义:(1)MapReduce是一个基于集群的高性能并行计算平台(ClusterInfrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。(2)MapReduce是一个并行计算与运行软件
  • 2023-11-13《实战Java高并发程序》——第2章 Java并行程序基础
    进程和线程简单的话来说,在Windows中看到的后缀为.exe的文件都是程序。不过程序是"死"的、静态的。当双击这个.exe文件的时候,这个.exe文件中的执行就会被加载,你就能得到一个有关这个程序的进程。进程是"活"的,或者说是正在被执行的。进程中可以容纳若干线程。那进程和线程之间究
  • 2023-10-03初识openMP
    openMP关于并行程序我写的一个程序运行效率太低了,等不了。所以尝试并行。目前流行的并行程序设计方法是:分布式内存结构上使用MPI,共享内存结构上使用Pthreads或OpenMP。我这个场合是使用openMP。多个线程的执行顺序是不能保证的。我们一般并不是要对相同代码在多个线程并行执行
  • 2023-07-18C++并行程序设计
    什么是并发?两个或两个以上事件或活动在同一时刻发生。如多个任务在多个CPU或CPU的多个核上同时执行,不存在CPU资源的竞争、等待行为并发程序的意义何在?充分发掘多核处理器的性能,提高计算速率仅供初次学习此内容创作,如有不对请大佬指正前置并行计算基础理论背景
  • 2023-07-03UVA210 双端队列模拟并行程序
    #include<iostream>#include<algorithm>#include<string>#include<sstream>#include<vector>#include<queue>#include<cstring>usingnamespacestd;constintmaxn=10001;//uva210:题意模拟n个程序的并行执行,有赋值,打印,lock,unlock,
  • 2023-03-07UVA-210 并行程序模拟 题解答案代码 算法竞赛入门经典第二版
    ​​GitHub-jzplp/aoapc-UVA-Answer:算法竞赛入门经典例题和习题答案刘汝佳第二版​​注意:每次unlock后,只需要拿出一个在阻塞队列里面的程序放到等待队列的头部。因为
  • 2023-01-10Hadoop核心概念
    大数据开发总体架构:Hadoop是大数据开发所使用的一个核心框架。使用Hadoop可以方便的管理分布式集群,将海量数据分布式的存储在集群中,并使用分布式并行程序来处理这些数据。Ha
  • 2022-11-16CUDA并行程序设计:GPU编程指南 电子书 pdf
    作者:(美)ShaneCook出版社:机械工业出版社原作名:CUDAProgramming:ADeveloper'sGuidetoParallelComputingwithGPUs译者:苏统华/李东/李松泽/魏通/主审
  • 2022-11-12scratch程序设计-并发篇
    scratch程序设计篇 随着孩子们逐渐入门scratch,开始自己拼搭程序建立项目,他们对角色实现动作效果的要求也更高,这时候开始遇到了“并行程序”这个问题。我之前讲过,6-8岁这
  • 2022-11-04CS149笔记03并行程序性能优化
    Part1:WorkDistributionandScheduling为了高性能优化目标:在所有可执行资源上达到负载均衡降低communication,避免stalls减少额外的overhead负载均衡在assign1
  • 2022-10-31CUDA并行程序设计:GPU编程指南 电子书 pdf
    作者:(美)ShaneCook出版社:机械工业出版社原作名:CUDAProgramming:ADeveloper'sGuidetoParallelComputingwithGPUs译者:苏统华/李东/李松泽/魏通/主审
  • 2022-10-22大规模并行处理器编程实战 第三版 电子书 pdf
    作者:科克(DavidB.Kirk)出版社:清华大学出版社原作名:ProgrammingMassivelyParallelProcessors:AHands-onApproach 链接:大规模并行处理器编程实战第三版