首页 > 其他分享 >高性能计算-NEON-intrinsic函数

高性能计算-NEON-intrinsic函数

时间:2024-12-03 16:11:39浏览次数:5  
标签:arre int NEON int32x4 高性能 vst1q s32 intrinsic 向量

1. 对寄存器数据重排

/*
两个向量,每两个通道一组,第一个向量每组的后一个元素与第二个向量每组的第一个元素一次彼此交换
*/
#include <stdio.h>
#include <arm_neon.h>


void main()
{
    int arrc[8]={0};
    int arrd[4]={0};
    int arre[4]={0};
    // 1 2 3 4
    // 5 6 7 8
    int32x4_t a = {1,2,3,4};
    int32x4_t b = {5,6,7,8};
    // 1 5 3 7
    // 2 6 4 8
    int32x4x2_t c = vtrnq_s32(a,b);
    // 1 5 3 7
    int32x4_t d = vtrn1q_s32(a,b);
    // 2 6 4 8
    int32x4_t e= vtrn2q_s32(a,b);

    vst1q_s32_x2(arrc,c);
    vst1q_s32(arrd,d);
    vst1q_s32(arre,e);
    for(int i=0;i<8;i++)
        printf("%d ",arrc[i]);
    printf("\n====\n");
    for(int i=0;i<4;i++)
        printf("%d ",arrd[i]);
    printf("\n====\n");
    for(int i=0;i<4;i++)
        printf("%d ",arre[i]);
    printf("\n====\n");

}

标签:arre,int,NEON,int32x4,高性能,vst1q,s32,intrinsic,向量
From: https://www.cnblogs.com/anluo8/p/18584311

相关文章

  • 全网唯一的高性能在线客服系统源码(开源代码+终身使用+安装教程)
    本系统采用GolangGin框架+GORM+MySQL+Vue+ElementUI开发的独立高性能在线客服系统。客服系统访客端支持PC端、移动端、小程序、公众号中接入客服,利用超链接、网页内嵌、二维码、定制对接等方式让网上所有通道都可以快速通过本系统联系到商家。服务端可编译为二进制程序包,无需......
  • 在ArkTS中,如何优化布局以提高性能?
    大家好,我是V哥。在鸿蒙原生应用开发中,当一个复杂的界面加载数据或发生变化时,布局可能会发生调整,为了提高布局变化带来的性能问题,V哥在实际开发中,总结了一些优化技巧,来提高布局性能,笔记分享给大家。1.避免不必要的二次布局在Flex布局中,如果子组件的主轴尺寸总和不等于容器的......
  • 高性能!易用友好的开源实时监控系统!
    大家好,我是Java陈序员。在企业开发中,监控系统可以说具有举足轻重的功能,可以实时反馈系统故障,及时发出告警信息,以便在第一时间处理问题,将企业损失降低到最低。今天,给大家介绍一个易用友好的开源实时监控系统!关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200......
  • 使用WebAssembly结合Rust实现高性能Web应用的技术详解
    ......
  • 高性能计算-gemv-向量化优化(16)
    1.目标:矩阵向量乘法y=A*x(列向量=矩阵*列向量),进行串行,循环展开+simd,simd+omp的效率对比。2.源码#include<iostream>#include<ctime>#include<arm_neon.h>#include<omp.h>usingnamespacestd;voiddgemv(constintn,constintm,constdouble*cons......
  • 高性能计算-bgra2rgb转换-向量化优化(15)
    1.这是一个对图像通道bgra转换为rgb的示例程序。转换方式有普通写法、openmp-simd编译指导语句、neonintrinsic函数三种实现方式2.源码#include<stdio.h>#include<stdlib.h>#include<iostream>#include<arm_neon.h>#include<omp.h>usingnamespacestd;voidb......
  • 高性能反向代理Nginx 安装配置‌配置指导
    Nginx是一款高性能的HTTP和反向代理服务器,也是一个IMAP/POP3/SMTP代理服务器。在Web项目应用中是构建Web服务器的一个重要工具,通过Nginx实现反向代理服务,实现负载均衡,也可配合使用Lua脚本实现其他各种复杂的服务器特性,以下是Nginx的下载、安装、配置及启动的步骤。1.......
  • 高性能C++内存映射库mio使用心得
    背景在C++编程中,高效的数据访问至关重要,而内存映射文件(MemoryMappedFiles)提供了一种强大的工具,它允许我们直接将文件内容加载到进程地址空间,从而以极高的效率进行读写操作。今天,我们要向大家推荐一个轻量级且易于使用的开源库——mio。项目介绍mio是一个头文件式的、跨平台的......
  • 【高性能编程】SIMD类型指令基本概念与使用示例
    一、SIMD基本概念SIMD指令即单指令多数据流(SingleInstructionMultipleData)指令,是一种能够在同一时间同步执行同一条指令,以对多个数据元素进行并行处理的技术,以下是具体介绍:原理传统的单指令单数据(SISD)架构中,CPU需要分别访问内存以获取操作数,然后逐个进行运算。而SIM......
  • 高性能AMD香港服务器:卓越性能与优势完美结合
    高性能AMD香港鼎峰服务器:卓越性能与全面优势的完美结合在当今数字化时代,高性能服务器已成为企业和开发者不可或缺的重要工具。香港鼎峰服务器凭借其卓越的性能和全面的优势,在众多服务器提供商中脱颖而出,成为众多企业和开发者的首选。香港鼎峰服务器采用先进的硬件设施和高......