• 2024-07-31CPU上的快速多维矩阵乘法(草稿)
    CPU上的快速多维矩阵乘法(草稿)Numpy可以在大约8毫秒内将4核IntelCPU上的两个1024x1024矩阵相乘。考虑到这归结为18FLOPS/核心/周期,一个周期需要三分之一纳秒,这是非常快的。Numpy使用高度优化的BLAS实现来实现这一点。BLAS是BasicLinearAlgebra子程序的缩写。这些库提供快速实
  • 2023-10-10src/param.cpp:30:26: fatal error: gsl/gsl_blas.h: No such file or directory
     001、问题:安装gemma软件报错src/param.cpp:30:26:fatalerror:gsl/gsl_blas.h:Nosuchfileordirectory 002、解决方法,安装glsa、官网下载http://mirrors.ustc.edu.cn/gnu/gsl/ b、wgethttp://mirrors.ustc.edu.cn/gnu/gsl/gsl-2.7.tar.gztar-xzfgsl-2.7
  • 2023-08-28【openEuler创新项目探索】一个Java端的向量化BLAS库VectorBLAS
    VectorBLAS简介VectorBLAS是一个使用Java语言实现的向量化BLAS高性能库,目前已在openEuler社区开源。VectorBLAS通过循环展开、矩阵分块和内存布局优化等算法优化,对BLAS函数进行了深度优化,并利用VectorAPIJDK提供的多种向量化API实现。可以理解为:VectorBLAS=VectorAPI+BLAS
  • 2023-05-27HPL测试的配置(依赖于BLAS),通过OpenMpi进行实现
    1.1虚拟机的配置1.1.1Linux光盘映像文件由于对于Ubuntu系统更为熟悉,所以选择了最新版的Ubuntu系统作为Linux发行版。1.1.2Hypervisor由于之前一直使用VMware,对其中操作熟悉,因此选择VMware作为Hypervisor1.2搭建集群并安装相关程序1.2.1创建虚拟机以上为虚拟
  • 2023-02-28windows 编译 lapack+blas
    参考 https://www.zhihu.com/question/4222903061下载安装tdm-gcchttps://github.com/jmeubank/tdm-gcc安装时还会下载东西,最好保持迷信上网状态。用管理员权限,选完
  • 2023-01-16cmake 检测Eigen库
    ​​代码在git​​cmake_minimum_required(VERSION3.9FATAL_ERROR)project(recipe-07LANGUAGESCXX)set(CMAKE_CXX_STANDARD11)set(CMAKE_CXX_EXTENSIONSOFF)set(CMAKE
  • 2022-12-06数学相关三方库整理
    CasADiCasADi提供了一种高效的开源优化问题解决方案,非常适用于解决非线性优化问题(nonlinearoptimization)和实现自动微分(algorithmicdifferentiation)其他优化库ACADO、