首页 > 其他分享 >【 ARMv8/ARMv9 硬件加速系列 3.5.1 -- SVE 谓词寄存器有多少位?】

【 ARMv8/ARMv9 硬件加速系列 3.5.1 -- SVE 谓词寄存器有多少位?】

时间:2024-06-20 21:59:40浏览次数:23  
标签:-- SVE 数据类型 3.5 位数 谓词 寄存器 向量

文章目录

SVE 谓词寄存器(predicate registers)简介

ARMv9的Scalable Vector Extension (SVE) 引入了谓词寄存器(Predicate Registers,简称Pg),为向量化操作提供灵活的数据选择和控制能力。在SVE中,谓词寄存器的设计目的是为了控制对向量寄存器中每个元素的访问,使得基于条件的操作能够在单个指令中对多个数据元素并行执行。

SVE 谓词寄存器的位数

谓词寄存器的大小并不是固定的,而是依赖于SVE向量长度(Vector Length,VL),这是一个在运行时可以配置的值,谓词寄存器的大小范围是 16bits-256bits。因此,谓词寄存器的位数等于SVE配置的向量长度(VL)除以单个向量元素的位数。在这里插入图片描述

SVE 谓词寄存器对向量寄存器的控制

在SVE中,每1位的谓词寄存器控制对应向量寄存器中的一个元素。具体每1位控制多少位,取决于操作的数据类型:

  • 对于8位(byte)的数据类型,每1位谓词控制8位数据。
  • 对于16位(halfword)的数据类型,每1位谓词控制16位数据。
  • 对于32位(word)的数据类型,每1位谓词控制32位数据。
  • 对于64位(doubleword)的数据类型,每1位谓词控制64位数据。

SVE 谓词寄存器位数计算

假设SVE向量长度(VL)配置为512位,那么对于32位(word)的操作:

  • 谓词寄存器将有 512 / 32 = 16 位。
  • 每一位在谓词寄存器中控制向量寄存器中的一个32位元素。
    这意味着,谓词寄存器的每一位可以独立地启用或禁用对应的向量寄存器中的元素操作。这种设计允许SVE在不同的应用场景中提供极高的灵活性和并行度,支持复杂的向量化条件逻辑。

SVE 谓词寄存器小结

谓词寄存器在ARMv9的SVE中提供了一种强大的方式来控制向量操作的执行。每1位谓词可控制的向量寄存器位数取决于操作的数据类型,而谓词寄存器本身的大小则与SVE向量长度(VL)直接相关,这使得SVE能够在保持高效性的同时,适应各种不同的硬件配置和应用需求。

标签:--,SVE,数据类型,3.5,位数,谓词,寄存器,向量
From: https://blog.csdn.net/sinat_32960911/article/details/139747810

相关文章

  • cesium中如何高性能渲染3D模型(附水淹分析模拟)
    大家好,我是日拱一卒的攻城师不浪,专注可视化、数字孪生、前端、nodejs、AI学习、GIS等学习沉淀,这是2024年输出的第18/100篇文章;前言之前在参加城市应急数字孪生项目开发过程中,遇到一个场景,就是模拟水淹分析。也就是说,甲方需要根据你这个平台,在下暴雨的时候,精准监测到城......
  • ef core自定义默认的迁移表的名称
    efcore自定义默认的迁移表的名称usingMicrosoft.EntityFrameworkCore;usingMicrosoft.EntityFrameworkCore.Design;namespaceLong.EntityFrameworkCore;classMyDesignTimeDbContextFactory:IDesignTimeDbContextFactory<ApplicationDbContext>{publicApplicat......
  • 强大的多数据库客户端工具:DataGrip【送源码】
    今天给大家带来的工具是:DataGrip介绍DataGrip是jetbrains开发的一款关系数据库和NoSQL数据库的多数据库客户端工具,可以30天免费试用,后续使用需要购买。DataGrip还是一款强大的跨平台工具,支持多种操作系统,比如Windows、macOS、Linux等。特性配合智能查询控制台,提供强......
  • 远程桌面一键登录 winform
    RDPRemoteLoginPro\RDPRemoteLoginPro.csproj<ProjectSdk="Microsoft.NET.Sdk"><PropertyGroup><TargetFramework>net8.0-windows</TargetFramework><OutputType>WinExe</OutputType><AssemblyName&g......
  • CSS新手入门笔记【导入方法、选择器介绍、选择器优先级、属性详细介绍、盒子模型】
    目录一、目的与优势二、CSS导入方式三、语法结构四、选择器类型基本选择器组合选择器伪类与伪元素属性选择器六、选择器优先级总结六、CSS属性1.字体与文本属性2.背景属性3.尺寸与盒模型属性4.布局与定位5.列表样式6.边框与轮廓7.文本装饰与效果8.动画与过渡......
  • 全是坑!!从 MySQL 到 PostgreSQL【送源码】
    0、前言原项目框架SpringBoot+ MybatisPlus +Mysql1、切换流程1.1、项目引入postgresql驱动包由于我们要连接新的数据库,理所当然的要引入该数据库的驱动包,这与mysql驱动包类似<dependency>    <groupId>org.postgresql</groupId>    <artifactId>postgresq......
  • 调用了这么久的JS方法是长在对象、类、值本身还是原型链上?
    调用了这么久的JS方法是长在对象、类、值本身还是原型链上?JavaScript这门语言总是能带给我惊喜,在敲代码的时候习以为常的写法,退一步再看看发现自己其实对很多基操只有表面的使用,而从来没思考过为何要这样操作。今天整理JS代码的时候突然发出灵魂三连问:为什么有些时候操作对象,......
  • 求职难遇理想offer!!【送源码】
    现在的求职行情确实不太好,有很多抱怨自己找到的工作技术栈落后的同学,我也是建议他们接下先干着。不能幻想毕业之后还能找到更合适的工作,那个时候就基本只能参加社招了,没有工作经验参加社招想要获得满意offer的更是地狱难度。校招都获得不了合适的offer,还指望社招么?这都什么......
  • 青岛二中集训日报(D7-D8)
    打模拟赛,顺便复习了ACAM,学习了全局平衡二叉树.D7T1简单贪心题.直接上正解.首先同时操作的线程只有两个,情况比较简单,只有两种情况,一种是两个线程同时工作,一种是只有一个线程工作.显然最大化同时工作的时间是最优的.来个表面的简单假贪心,直接考虑在所有可行叶子里面摩......
  • 开源MES优秀博文整理
    PyScada的相关资料PyScada的相关资料|同欣数字化落地(txodoo.cn)树莓派设置开机启动指定打开应用树莓派设置开机启动指定打开应用|同欣数字化落地(txodoo.cn)物联网IoT\IoE\边缘计算软件平台物联网IoT\IoE\边缘计算软件平台|同欣数字化落地(txodoo.cn)如何应......