首页 > 其他分享 >使用 Optimum-Intel 和 OpenVINO GenAI 优化和部署模型

使用 Optimum-Intel 和 OpenVINO GenAI 优化和部署模型

时间:2024-10-21 13:43:31浏览次数:1  
标签:OpenVINO Intel Python Optimum openvino API config GenAI

在端侧部署 Transformer 模型需要仔细考虑性能和兼容性。Python 虽然功能强大,但对于部署来说有时并不算理想,特别是在由 C++ 主导的环境中。这篇博客将指导您如何使用 Optimum-Intel 和 OpenVINO™ GenAI 来优化和部署 Hugging Face Transformers 模型,确保在最小依赖性的情况下进行高效的 AI 推理。

为什么使用 OpenVINO 来进行端侧部署

OpenVINO™ 最初是作为 C++ AI 推理解决方案开发的,使其非常适合在端侧设备部署中,其中最小化依赖性至关重要。随着引入 GenAI API,将大型语言模型 (LLMs) 集成到 C++ 或 Python 应用程序中变得更加简单,其特性旨在简化部署并提升性能。

第一步: 创建环境

预先准备

开始之前,请确保您的环境已正确配置了 Python 和 C++。安装必要的 Python 包:

pip install --upgrade --upgrade-strategy eager optimum[openvino]

以下是本文中使用的具体包:

transformers==4.44
openvino==24.3
openvino-tokenizers==24.3
optimum-intel==1.20
lm-eval==0.4.3

有关 GenAI C++ 库的安装,请按照 此处 的说明进行操作。

第二步: 将模型导出为 OpenVINO IR

Hugging Face 和 Intel 的合作促成了 Optimum-Intel 项目。该项目旨在优化 Transformers 模型在 Intel 硬件上的推理性能。Optimum-Intel 支持 OpenVINO 作为推理后端,其 API 为各种基于 OpenVINO 推理 API 构建的模型架构提供了封装。这些封装都以 OV 前缀开头,例如 OVModelForCausalLM 。除此之外,它与

标签:OpenVINO,Intel,Python,Optimum,openvino,API,config,GenAI
From: https://www.cnblogs.com/huggingface/p/18489324

相关文章

  • IPMI(智能平台管理接口,Intelligent Platform Management Interface)是一种行业标准的接
    IPMI(智能平台管理接口,IntelligentPlatformManagementInterface)是一种行业标准的接口规范,主要用于服务器和计算机系统的管理。它提供了硬件监控和管理功能,使管理员能够远程监控和控制计算机系统。以下是IPMI的一些主要特点和功能:主要特点硬件监控:IPMI能够监控系统的硬件状态......
  • 主动管理技术(Active Management Technology,AMT)是英特尔(Intel)推出的一种硬件管理解决方
    主动管理技术(ActiveManagementTechnology,AMT)是英特尔(Intel)推出的一种硬件管理解决方案,专门用于企业级计算环境。AMT是英特尔管理引擎(IntelManagementEngine,ME)的一部分,旨在提供全面的远程管理和维护功能。以下是AMT的主要特点和功能:1. 远程管理远程访问:AMT允许IT管理员在操......
  • AI 大模型:Intelligent Agent—— 开启智能新纪元
    在LLM语境下,Agent理解为在某种能自主理解、规划决策、执行复杂任务的智能体,LLM充当着智能体的“大脑”。从软件工程的角度,智能体是一种基于大语言模型的,具备规划思考能力、记忆能力、使用工具函数的能力,能自主完成给定任务的计算机程序。在基于LLM的智能体中,LLM的充......
  • IntelliJ IDEA 2024 安装使用 (附加激活码、补丁,亲测有效!)
    第一步:下载IDEA安装包访问IDEA官网,下载IDEA2024.1.4版本的安装包,下载链接如下:idea官方链接也可以在这里点击下载idea下载idea第二步:安装IDEA点击xx关掉程序!第三步:下载补丁下载地址(里面包含激活码)https://pan.quark.cn/s/9dbfe698c064补丁下载成功后,......
  • IntelliJ IDEA 快捷键大全(也适用全家桶其他编辑器)
    以下是IntelliJIDEA的常用功能快捷键大全,适用于Windows/Linux系统(Mac用户可将Ctrl替换为Cmd,Alt替换为Option):功能分类功能描述快捷键(Windows/Linux)基本操作显示所有快捷键Ctrl+J显示主菜单Alt+Home全局搜索(任何内容)DoubleShift打开设置Ctrl+Alt+S保存所......
  • 人工智能(Artificial Intelligence,简称AI)
    人工智能(ArtificialIntelligence,简称AI)是一种模拟人类智能的科学与技术,它通过模拟人类的思维和行为,实现智能化的计算机系统。人工智能在现代科技中的应用越来越广泛,涵盖了各个领域。在医疗领域,人工智能可以用于辅助诊断和治疗。通过分析大量的医疗数据和图像,人工智能可以提高......
  • openvino 大模型qwen2.5推理案例
    参看:https://github.com/openvinotoolkit/openvino.genai/releases/tag/2024.4.0.0https://github.com/TommyZihao/openvino_tonypi/blob/main/OpenVINO-0911/AIPC%E4%BB%A3%E7%A0%81/%E3%80%90B1%E3%80%91%E4%B8%89%E8%A1%8C%E4%BB%A3%E7%A0%81%E5%BC%80%E5%90%AF%E5%A4%......
  • 2024 最新 IntelliJ IDEA 2024.1.6 激活(亲测可用)
    注意:接下来本文分享免费激活 IDEA 等Jetbrains全家桶工具,一直支持到最新版本2024.1.6。 1.下载安装IDEA (mac、window、linux都支持)大家直接在官网下载最新版本,登陆官网,下载最新版本2024.1.4。一步一步确定安装,然后打开这里提示输入激活码,先关闭应用!!!2.下载激活工具打......
  • IntelliJ IDEA(IDEA)下无法解析 ApplicationContext 中的方法 getBean
    只需要:删除过程目录下的.idea文件后,关闭IDEA,再重新打开IDEA即可解决“getBean”报红问题。(注意:前提是要保证有依赖(Spring核心库配置正确、依赖版本兼容)、配置正确(ApplicationContext 创建正确、有 Bean定义、扫描包正确)、编码问题(导入正确的类、方法调用正确))以上原理:.i......
  • Intel core 2 QX6600 CPU
    目录简介参数1.基本规格2.热设计功耗(TDP)3.内存支持4.架构与特性5.其他信息参考链接简介Intelcore2QX6600CPU中文名QX是一款IntelExtreme版处理器,具有解锁的倍频,并且在发布时是最快的。双核和四核的非X型号实际上在工作站系列中没有任何作用,除了以更高的速度运......