网站首页
编程语言
数据库
系统相关
其他分享
编程问答
cutlass
2024-10-17
CUTLASS: NVIDIA的高性能CUDA线性代数库
CUTLASS简介CUTLASS(CUDATemplatesforLinearAlgebraSubroutines)是NVIDIA开发的一个开源CUDAC++模板库,用于实现高性能的矩阵乘法(GEMM)和相关计算。它采用了类似cuBLAS和cuDNN的分层分解和数据移动策略,将这些"移动部件"分解为可重用的模块化软件组件,通过C++模板类进行