• 2024-12-13转载:【AI系统】昇腾异构计算架构 CANN
    本文将介绍昇腾AI异构计算架构CANN(ComputeArchitectureforNeuralNetworks),这是一套为高性能神经网络计算需求专门设计和优化的架构。CANN包括硬件层面的达·芬奇架构和软件层面的全栈支持,旨在提供强大的硬件基础和管理网络模型、计算流及数据流的软件栈,以支撑神经网络在异
  • 2024-12-13转载:【AI系统】CANN 算子类型
    算子是编程和数学中的重要概念,它们是用于执行特定操作的符号或函数,以便处理输入值并生成输出值。本文将会介绍CANN算子类型及其在AI编程和神经网络中的应用,以及华为CANN算子在AICPU的详细架构和开发要求。算子基本介绍一元算子通过对单个操作数进行操作,如取反或递增,而
  • 2024-12-13转载:【AI系统】CANN 算子类型
    算子是编程和数学中的重要概念,它们是用于执行特定操作的符号或函数,以便处理输入值并生成输出值。本文将会介绍CANN算子类型及其在AI编程和神经网络中的应用,以及华为CANN算子在AICPU的详细架构和开发要求。算子基本介绍一元算子通过对单个操作数进行操作,如取反或递增,而
  • 2024-12-13转载:【AI系统】昇腾异构计算架构 CANN
    本文将介绍昇腾AI异构计算架构CANN(ComputeArchitectureforNeuralNetworks),这是一套为高性能神经网络计算需求专门设计和优化的架构。CANN包括硬件层面的达·芬奇架构和软件层面的全栈支持,旨在提供强大的硬件基础和管理网络模型、计算流及数据流的软件栈,以支撑神经网络在异
  • 2024-12-12转载:【AI系统】昇腾异构计算架构 CANN
    本文将介绍昇腾AI异构计算架构CANN(ComputeArchitectureforNeuralNetworks),这是一套为高性能神经网络计算需求专门设计和优化的架构。CANN包括硬件层面的达·芬奇架构和软件层面的全栈支持,旨在提供强大的硬件基础和管理网络模型、计算流及数据流的软件栈,以支撑神经网络在异
  • 2024-12-12转载:【AI系统】CANN 算子类型
    算子是编程和数学中的重要概念,它们是用于执行特定操作的符号或函数,以便处理输入值并生成输出值。本文将会介绍CANN算子类型及其在AI编程和神经网络中的应用,以及华为CANN算子在AICPU的详细架构和开发要求。算子基本介绍一元算子通过对单个操作数进行操作,如取反或递增,而
  • 2024-10-13小北的技术博客:探索华为昇腾CANN训练营与AI技术创新——Ascend C算子开发能力认证考试(中级)
    前言    哈喽哈喽,这里是zyll~,北浊.(大家可以亲切的呼唤我叫小北)智慧龙阁的创始人,一个在大数据和全站领域不断深耕的技术创作者。今天,我想和大家分享一些关于华为昇腾CANN训练营以及AI技术创新的最新资讯和实践经验~(初级证书还没拿到的小伙伴,可以先参考小北的这篇技术博
  • 2024-08-25华为昇腾Atlas 200I DK A2安装MIndspore失败
    该最新的镜像版本为预装了CANN的7.0R1版本的CANN在MIndspore官网进行了相对应的CANN和MIndspore的版本相关匹配从图中可以看出来7.0仅仅支持Ascend的910而我们的Atlas200IDKA2处理器为Ascend310因此7.0的CANN明显不符合我们的型号于是我决定选择进行降低CANN的版本进
  • 2024-08-07深度解读昇腾CANN小shape算子计算优化技术,进一步减少调度开销
    摘要:Host调度模式下,GE将模型中算子的执行单元划分为HostCPU执行与Device(昇腾AI处理器)执行两大类。本文分享自华为云社区《深度解读昇腾CANN小shape算子计算优化技术,进一步减少调度开销》,作者:昇腾CANN。GE(GraphEngine)将模型的调度分为Host调度与下沉调度两种模式。经过上期的介
  • 2024-07-17如何安装Ascend深度学习套件
    1、 驱动安装1.1驱动测试输入测试命令:npu-smiinfo 结果如下: 1.2Ascend驱动未安装请参考Ascend驱动的安装文档,进行安装对应显卡的驱动,文档链接如下:https://support.huawei.com/enterprise/zh/doc/EDOC1100368783/2645a51f 2、 Ascend 深度学习套
  • 2024-07-15深度解读昇腾CANN模型下沉技术,提升模型调度性能
    本文分享自华为云社区《深度解读昇腾CANN模型下沉技术,提升模型调度性能》,作者:昇腾CANN。AI模型的运行通常情况下需要CPU和NPU(昇腾AI处理器)等AI专用处理器协同工作,CPU所在位置称为主机端(Host),而NPU所在位置称为设备端(Device)。对于采用Host调度的AI模型来说,Host下发Task的时序和Devi
  • 2024-07-09深度解读昇腾CANN内存复用技术,降低网络内存占用
    本文分享自华为云社区《深度解读昇腾CANN内存复用技术,降低网络内存占用》,作者:昇腾CANN。随着大模型的兴起,神经网络规模不断扩大,对内存资源的消耗也越来越高,如何降低AI算法的内存占用成为AI计算领域降成本提性能的一个重要手段。当前降低AI算法内存占用的主要技术有内存复用(Memor
  • 2024-05-26Ascend Cann适用
    AscendCanntoolkit是开发昇腾算子、模型的工具。提供了x86和aarch64两个版本。根据不同芯片,如910B训练卡和310推理卡,提供了不同的kernel安装包,同一芯片版本下kernel同时提供了x86和aarch64的驱动版本。Cann包的下载地址在https://www.hiascend.com/developer/download/communi
  • 2024-04-05【CANN训练营笔记】OrangePI AIPro 体验手写体识别模型训练与推理
    CANN简介当我们谈到香橙派AIPro的时候,总会把她和昇腾生态关联起来,因为在昇腾芯片的加持下,这款开发板有着出色的算力,被众多开发者追捧。而谈到昇腾芯片,我们不得不提上层的AI异构计算架构CANN。异构计算架构CANN(ComputeArchitectureforNeuralNetworks)是华为针对AI场
  • 2023-11-30Ascend C 算子开发遇到的问题及解决方法
    摘要:在学习AscendC算子开发进阶课程的时候,进行AscendC自定义算子工程、算子调用等实验,在开发环境中遇到了一些问题,在这里记录一下。首先如果在启智社区CANN版本为6.3,要进行AscendC算子开发,需要更新CANN版本。在CANN社区根据你的架构,比如我的为CPU架构位aarch64,所以下载Ascend-
  • 2023-10-23昇腾CANN 7.0 黑科技:大模型训练性能优化之道
    本文分享自华为云社区《昇腾CANN7.0黑科技:大模型训练性能优化之道》,作者:昇腾CANN。目前,大模型凭借超强的学习能力,已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力。大模型经过海量数据的预训练,通常具有良好的通用性和泛化性。用户基于“大
  • 2023-10-192023年CANN训练营第二季——叭一叭几款AscendC算子支持芯片的运算单元以及AscendC提供的API接口
    前言:    我们知道昇腾AI芯片,有1个或多个AiCore,AiCore上有Cube和Vector运算单元提供给算子进行运算,有的AiCore是Cube和Vector一体的,有的Cube和Vector是分开,各自独立的。我们还记得例程中的例子一般都指定核心数BLOCK_DIM=8,这又是为什么,有啥道理呢?本文就来叭一叭,昇腾芯片的运
  • 2023-08-27待整理。。。
    CUDA属于驱动层cudnn和cann属于开发层套件 创建网络模型验证模型保存模型加载->迁移学习 推理部署:模型导出,格式转换,部署与调优 开发态可以展示讲 cpu也有驱动层(对于mindspore) shengteng,kuipeng
  • 2023-05-31【2023 · CANN训练营第一季】——应用开发深入讲解——模型转换的ATC工具
    前言: 做一个推理应用,首先从模型转换开始(当然先得选好一个合适的模型)。在昇腾平台做模型推理,需要将Caffe,TensorFlow等开源框架网络模型转换成Davinci架构专用模型(OM格式)。昇腾张量编译器(AscendTensorCompiler,简称ATC)是异构计算架构CANN体系下的模型转换工具,模型转换过程中,ATC会进
  • 2023-05-31【2023 · CANN训练营第一季】——开发者套件进阶,玩转智能小车课程笔记
    前言:基于新款开发者套件Atlas200IDKA2的智能小车,采用人工智能的方法,对摄像头采集到实时影像进行推理,产生电机等运动机构的控制指令,在特定环境里,实现自动行驶、自动泊车、目标跟踪等功能。昇腾官方开源了“玩”小车的全部软、硬件资料,还准备了模拟环境,让还没有小车的小伙伴体验自
  • 2023-05-31【2023 · CANN训练营第一季】——搭建环境:创建ECS,下载sample仓
    前言:        本文是环境搭建的第一篇笔记。主要包括下面两方面内容:    1、在华为云上创建ECS服务器,并修改Ubuntu源和pip源为国内镜像地址。        2、为了更好的使用ECS,需要在本地安装远程连接和查看代码的工具软件,以Windows为例介绍几个常用的工具软件。
  • 2023-05-31【2023 · CANN训练营第一季】——Ascend C算子沙箱实验
    前言:CANN训练营的Ascend C算子课程,以在线课程的方式提供了一个沙箱实验环境。这将有助于帮助开发者了解Ascend C算子开发的软、硬件环境;熟悉自定义AscendC算子的开发流程和关键代码;同时也可以了解到自定义算子包的部署路径及部署后的各类文件。在线试验地址:在线实验>基于昇腾CA
  • 2023-05-30【2023 · CANN训练营第一季】初识新一代开发者套件Atlas 200I DK A2之模型适配工具
    初识新一代开发者套件Atlas200IDKA2之模型适配工具模型适配工具是一款集成数据集管理、模型训练、模型打包为一体的开发者工具套件。通过此工具,可以降低开发者在模型开发过程中对AI专业知识、深度学习框架的学习成本,极大降低开发的难度、复杂度。1.功能介绍工具预置了4个典型模
  • 2023-05-30【2023 · CANN训练营第一季】昇腾AI入门课(PyTorch)之模型迁移
    昇腾AI入门课(PyTorch)之模型迁移将基于PyTorch的训练脚本迁移到昇腾AI处理器上进行训练,目前有以下3种方式:自动迁移(推荐)、工具迁移、手工迁移,且迁移前要保证该脚本能在GPU、CPU上运行。自动迁移:训练时,在训练脚本中导入脚本转换库,导入后执行训练。训练脚本在运行的同时,会将脚本中的CUD