OpenMP 编程模型

时间：2024-03-14 11:30:07浏览次数：37

标签：模型编程并行线程内存 OpenMP 共享内存

OpenMP 内存模型

共享内存模型：

OpenMP 专为多处理器/核心、共享内存机器设计，底层架构可以是共享内存UMA或NUM

OpenMP 执行模型

基于线程的并行：

OpenMP 程序基于多线程来实现并行，线程是操作系统可以调度的最小执行单元。线程存在于单个进程的资源中，没有进程，线程就不存在。通常，线程的数量与机器处理器/核心的数量相匹配。然而，实际使用线程的方式取决于应用程序。

显式并行化：

OpenMP 是一种显式（非自动）编程模型，使得程序员能够完全控制并行流程。

并行化可以很简单，例如串行代码加上一些编译指令，也可以以很复杂，例如多级并行，锁，甚至嵌套锁。

分叉-合并(fork-join)模型：

OpenMP 使用分叉-合并模型进行并行执行：

所有 OpenMP 程序都从主线程开始，主线程顺序执行，直到遇到第一个并行区域 结构。然后，

分叉：主线程创建一组并行线程，处于并行区域结构的程序，将在各个线程之间并行执行。

合并：当线程组完成并行区域结构中的语句时，它们将同步并终止，只留下主线程。

并行区域和组成它们的线程的数量是任意的。

基于编译器指令：

大多数 OpenMP 并行是通过嵌入在 C/C++ 或 Fortran 源代码中的编译器指令来指定的。

嵌套并行性：

API 允许在并行区域内嵌套并行区域。不同实现版本可能对此功能支持不一样。

动态线程：

API 允许运行时环境动态改变线程数量以便更有效的利用资源。不同实现版本可能对此功能支持不一样。

输入/输出：

OpenMP 对并行 I/O 没有具体规定。程序员需要自己保证在多线程程序中 I/O 的正确性。

执行模型和内存模型的相互作用：

单程序多数据（SPMD）是基本的编程范式，所有线程都有执行相同程序代码的潜力，但是每个线程可能访问、修改不同的数据并遍历不同的执行路径。

OpenMP 提供了“松弛一致性”和“临时"线程内存视图。线程可以平等地访问共享内存，共享内存中的变量可以被检索/存储。每个线程还有自己的临时变量副本，可以独立于内存中的变量进行修改。当所有线程都需要对共享变量具有一致的视图时，程序员（或编译器）需要确保所有的线程都更新了此变量。

OpenMP 编程主要内容：

启动并行线程的方法
统计正在运行的线程数量的方法
唯一标识线程的方式
将线程汇合(join)，进行串行执行的方法
同步线程的方法
当必要时确保对数据项的一致视图
必须检查数据依赖性、数据冲突、条件竞争或死锁

标签：模型,编程,并行,线程,内存,OpenMP,共享内存
From： https://blog.csdn.net/leizhengshenglzs/article/details/136690948

Android14音频进阶：生产者与消费者模型(六十二)
简介：CSDN博客专家，专注Android/Linux系统，分享多mic语音方案、音视频、编解码等技术，与大家一起成长！优质专栏：Audio工程师进阶系列【原创干货持续更新中……】......
网络安全AI智能体公司「云起无垠」获数千万元天使+轮融资，致力于大模型与网络安全深度
「云起无垠」致力于打造最懂安全的AI智能体，通过持续运营的工具、知识以及记忆引擎，不断提升智能体对用户安全场景的理解，以达到易于使用、自我学习、自主行动的特性，助力企业自动化执行各类安全任务，让软件更安全，让安全更智能。近年来，随着我国互联网的普及以及数字化程度逐渐加深，......
Sora爆火，多模态大模型背后的存算思考
近日，随着OpenAI推出Sora，人工智能从文本到文本、文本到图片的生成模式，进阶到文生视频。其文本到视频的模型能够生成长达一分钟的视频，在保持视觉质量的同时并严格遵循用户的提示，使得“扔进一本小说，生成一部电影”的想法成为现实。OpenAI将这一创新描述为构建“物理世......
深入解读：24GB显卡为什么能训练70亿参数大模型
在人工智能的世界里,模型的参数量往往代表了它的“智慧”。更多的参数意味着模型能够学习和存储更多的知识,从而在各种任务上表现得更加出色。然而,训练这些大模型需要消耗大量的计算资源和内存,这对硬件提出了极高的要求，以当前最著名的拥有1750亿参数大语言模型为例，至少需......
利用AI辅助编程开发：新时代的编程助手
随着人工智能技术的飞速发展，AI在编程开发领域的应用也日益广泛。AI辅助编程不仅能够提高开发效率，还能减少错误，让开发者更加专注于创新性的工作。本文将详细介绍如何利用AI来辅助编程开发，并通过实际例子和代码展示其实际应用。一、代码自动补全与错误检查AI在编程中的一个......
R语言风险价值：ARIMA，GARCH模型，Delta-normal法滚动估计，预测VaR（Value at Risk）和回测分析
原文链接：http://tecdat.cn/?p=24492原文出处：拓端数据部落公众号介绍此分析的目的是帮助客户构建一个过程，以在给定时变波动性的情况下正确估计风险价值。风险价值被广泛用于衡量金融机构的市场风险。我们的时间序列数据包括1258天的股票收益。为了解释每日收益率方差的一小部......
每日反思之学会结对编程
长时间独立开发让人容易进入心流，也容易走向习惯性思维的误区。想起过去创业的时候，总是一个人写代码，自测，merge代码，分布上线，反馈之后再调整。整个过程全靠自己去思考并完成，在一些不复杂的情形下算是最简最快的方案。但当自己融入到一个大的团队和项目中，合作分工成为了主流，而不是单......
图解Java并发编程第一章总结【精炼版】
【第一章】图解Java并发编程Java线程的基本操作yield操作：yield操作，在基于时间片轮转的cpu调度算法中，用来放弃当前时间片sleep操作：sleep操作分为三种情况普通sleep：在指定时间内放弃cpu使用权，不释放同步锁sleep(0):作用与yield相同sleep被中断：抛出中断异常......
考虑功率均分与电压频率的事件触发分布式二次控制MATLAB模型
微❤关注“电气仔推送”获得资料（专享优惠）模型简介此模型是在《基于事件触发机制的孤岛微电网二次电压与频率协同控制MATLAB仿真模型》上进一步创作的，之前的模型只考虑了二次电压与频率控制，并没有考虑均分这一项点。因此此模型在事件触发机制的基础上，继续创作了基于事件触发......
【预训练语言模型】使用Transformers库进行GPT2预训练
基于HuggingFace的Transformer库，在Colab或Kaggle进行预训练。本教程提供：英文数据集wikitext-2和代码数据集的预训练。注：可以自行上传数据集进行训练目的：跑通自回归语言模型的预训练流程一、准备1.1安装依赖!pipinstall-Udatasets!pipinstallaccelerate-U注意：在C......