首页 > 其他分享 >应用层需要 AI 编译器

应用层需要 AI 编译器

时间:2024-09-30 14:25:27浏览次数:8  
标签:AI 硬件 芯片 编译器 算子 优化 应用层

应用层需要 AI 编译器 从硬件角度以及底层软件的角度来看待为什么需要 AI 编译器的,而现在可以换一个上层应用视角来看待这个问题。 以深度神经网络为技术基础的人工智能领域在近些年发展十分迅速,从 10 年前,AI 技术可能只能解决图形分类等较为简单的任务,但如今无论是推荐系统、大语言模型、自动驾驶甚至 AI4S 等领域已经取得了十分显著的发展。 如今,AI 算法已经在很多领域取得了显著成果,这直接促进了 AI 算法的爆发式增长。同时,当前越来越多的公司愿意投入人力物理去开发自己的 AI 框架,这却间接导致了 AI 框架的碎片化和多样化。还有因地缘政治等因素,AI 芯片也变得加多样性,而不同的 AI 芯片都有着自己的编译体系,如图8-4所示。 图8-4 编译技术广泛运用于各种应用场景 目前,AI 领域的快速发展,导致每天都有各种各样的不同的 AI 算法被提出,这直接导致了两个重要的挑战。 第一个就是对于算子的优化,随着越来越来多的 AI 算法的诞生,这带来了更多的新算子。虽然简单的实现一个算子并不算是特别难的事情,但是这些算子还需要放在特定的 AI 芯片上进行优化,充分发挥硬件性能。而目前阶段算子的开发和维护还是以人工手动实现、优化、测试为主的,人工优化算子的工作量是非常大的。 虽然硬件供应商会发布一些通用性的优化算子库(如 MKL-DNN 和 CuDNN),但从人力成本的角度来说,这种工作是极度重复性的,MKL-DNN 和 CuDNN 背后是相似的算法,只不过由不同的公司两批不同的人来做的而已。从现实意义的角度,感觉意义并没有那么大。同时,硬件供应商提供优化后的算子库,一定程度上会限制用户编程的灵活性导致无法真正充分的发挥硬件性能,如图8-5所示。 图8-5编译技术支持通用性的优化算子库 第二个重大挑战是性能可移植性十分困难。由于大多数 NPU 使用 ASIC 设计芯片,其在神经网络场景对计算、存储和数据搬运做了很多特殊的指令优化,这使得与 AI 相关的计算得到了巨大的性能提升,比如 NVIDIA 在其一些芯片中提供的张量核 计算单元。如果相关 AI 框架使用了张量核 来优化其计算性能,必然会带来难以移植的问题。不同芯片有的提供类似 Tenosr Core 的矩阵计算单元,有的不提供。提供了矩阵计算单元的不同芯片,其编程范式又极不相同,这是限制可移植性的重要原因,如图8-6所示。 不同芯片厂商提供 XPU 的 ISA(Instruction Set Architectrue)千奇百怪,各不相同。而当前阶段又缺乏如 GCC、LLVM 等编译工具链,这使得针对 CPU 和 GPU 已有的优化算子库和针对语言的优化 Pass 很难移植到 NPU 上。这样的现状可能对于某个较为领先的硬件厂商来说是技术壁垒,是一种优势,但随着技术的不断发展,很多 idea 会被不断地相互借鉴,不断整合类似的 Pass,在 AI 编译器领域推出一个类似于 GCC 或者 LLVM 的编译器是非常有必要的。这会极大的促进 AI 领域的发展! 图8-6编译技术支持性能可移植性

标签:AI,硬件,芯片,编译器,算子,优化,应用层
From: https://www.cnblogs.com/wujianming-110117/p/18441729

相关文章

  • AI产品经理市场需求分析:岗位热度与就业前景探讨
    前言在当今这个科技日新月异的时代,人工智能(AI)已不再仅仅是一个遥远的概念,而是深深嵌入到我们生活的方方面面,从日常的语音助手到复杂的自动驾驶系统,AI的触角无处不在。随着AI技术的广泛应用和持续进步,AI产品经理这一角色的重要性日益凸显,成为了连接技术与市场、推动AI产品创......
  • 为什么需要 AI 编译器
    为什么需要AI编译器随着硬件技术的不断进步,进入了一个新的计算加速时代,这个时代的硬件平台变得越来越复杂和多层次。现代计算加速平台采用了多层架构,包括标量、向量、多核、多包、多机架等不同层次的并行处理能力。这种设计不仅提高了性能,也增加了硬件设计的复杂性。同时,现代计......
  • 传统编译器与 AI 编译器区别
    传统编译器与AI编译器区别接下来,来了解一下AI编译器与传统编译器的区别与联系。1.区别与联系1)目标相同:AI编译器与传统编译器都是通过自动化的方式进行程序优化和代码生成,从而节省大量的人力对不同底层硬件的手动优化。2)优化方式类似:在编译优化层,AI编译器与传统编译器都......
  • SciTech-Automation-UI交互自动化: Microsoft 的 接口自动化测试 : 微信的: LLM(AI/Tr
    用LLM+Python实现微信消息的自动应答!/usr/bin/python3#coding:utf-8importpandasaspdimportnumpyasnpfromuiautomationimportwindowControl,Menucontrolfromfunctoolsimportpartial,wraps#readreplydatadf=pd.read_csv("应答数据.csv",......
  • AI变革营销全链路:从市场洞察到销售转化,AI将推动营销效率革命
    大家好!今天,我要和大家聊聊AI如何助力营销行业,变革营销全链路的。从市场洞察到销售转化,AI正一步步推动着营销效率的革命。什么是营销全链路什么是营销全链路?简单来说,就是从了解消费者需求开始,到制作出吸引人的内容,再到把信息传播出去,最后实现销售转化的整个过程。这个过程环......
  • 从互联网到人工智能:产品经理转型指南——传统产品经理赚到AI产品经理
    我是一名从事PC/移动互联网的产品经理,从今年年初开始有意向转型进入人工智能领域。毕竟这是一个非常前沿科技型的新要素,越早进入的人,越能享受新科技所带来的各种红利。将此新技术应用到相关业务场景后,也必定会带来新一轮的市场发展。但是,当我搜索了很多资料以后发现:并没有......
  • php email功能实现:详细步骤与配置技巧?
    phpemail发送功能详细教程?如何使用phpemail服务?无论是用户注册、密码重置,还是订单确认,电子邮件都是与用户沟通的重要手段。AokSend将详细介绍如何实现phpemail功能,并提供一些配置技巧,帮助你更好地掌握这一关键技术。phpemail:配置环境在开始使用phpemail功能之前,确保你......
  • 转载 fastapi 部署 原文链接:https://blog.csdn.net/FrenzyTechAI/article/details/132
    sudoadd-apt-repositoryppa:deadsnakes/ppasudoaptupdatesudoaptinstallpython3.12python3.12-venv-ysudoaptinstallsupervisorsudoaptinstallsupervisornginx-y启用并启动Supervisor:sudosystemctlenablesupervisorsudosystemctlstartsupervisor使用ena......
  • Minstrel自动生成结构化提示,让AI为AI写提示词的多代理提示生成框架
    在人工智能快速发展的今天,如何有效利用大型语言模型(LLMs)成为了一个普遍关注的话题。这是9月份的一篇论文,提出了LangGPT结构化提示框架和Minstrel多代理提示生成系统,为非AI专家使用LLMs提供了强大支持。对于非人工智能专家来说,构建高质量的提示以充分利用LLMs的能力仍然是一个巨大......
  • 开源 AI 智能名片 2+1 链动模式 S2B2C 商城小程序的数据运营策略与价值创造
    一、引言1.1研究背景在当今数字化时代,数据运营已成为企业发展的核心驱动力。开源AI智能名片2+1链动模式S2B2C商城小程序作为一种创新的营销工具,与数据运营紧密相连。该小程序通过集成人工智能、大数据分析等先进技术,能够实时收集、分析用户行为数据,为企业提供精准的用......