使用 Optimum-Intel 和 OpenVINO GenAI 优化和部署模型

时间：2024-10-21 13:43:31浏览次数：7

标签：OpenVINO Intel Python Optimum openvino API config GenAI

在端侧部署 Transformer 模型需要仔细考虑性能和兼容性。Python 虽然功能强大，但对于部署来说有时并不算理想，特别是在由 C++ 主导的环境中。这篇博客将指导您如何使用 Optimum-Intel 和 OpenVINO™ GenAI 来优化和部署 Hugging Face Transformers 模型，确保在最小依赖性的情况下进行高效的 AI 推理。

为什么使用 OpenVINO 来进行端侧部署

OpenVINO™ 最初是作为 C++ AI 推理解决方案开发的，使其非常适合在端侧设备部署中，其中最小化依赖性至关重要。随着引入 GenAI API，将大型语言模型 (LLMs) 集成到 C++ 或 Python 应用程序中变得更加简单，其特性旨在简化部署并提升性能。

第一步: 创建环境

预先准备

开始之前，请确保您的环境已正确配置了 Python 和 C++。安装必要的 Python 包:

pip install --upgrade --upgrade-strategy eager optimum[openvino]

以下是本文中使用的具体包:

transformers==4.44
openvino==24.3
openvino-tokenizers==24.3
optimum-intel==1.20
lm-eval==0.4.3

有关 GenAI C++ 库的安装，请按照此处的说明进行操作。

第二步: 将模型导出为 OpenVINO IR

Hugging Face 和 Intel 的合作促成了 Optimum-Intel 项目。该项目旨在优化 Transformers 模型在 Intel 硬件上的推理性能。Optimum-Intel 支持 OpenVINO 作为推理后端，其 API 为各种基于 OpenVINO 推理 API 构建的模型架构提供了封装。这些封装都以 OV 前缀开头，例如 OVModelForCausalLM 。除此之外，它与

标签：OpenVINO,Intel,Python,Optimum,openvino,API,config,GenAI
From： https://www.cnblogs.com/huggingface/p/18489324

IPMI（智能平台管理接口，Intelligent Platform Management Interface）是一种行业标准的接
IPMI（智能平台管理接口，IntelligentPlatformManagementInterface）是一种行业标准的接口规范，主要用于服务器和计算机系统的管理。它提供了硬件监控和管理功能，使管理员能够远程监控和控制计算机系统。以下是IPMI的一些主要特点和功能：主要特点硬件监控：IPMI能够监控系统的硬件状态......
主动管理技术（Active Management Technology，AMT）是英特尔（Intel）推出的一种硬件管理解决方
主动管理技术（ActiveManagementTechnology，AMT）是英特尔（Intel）推出的一种硬件管理解决方案，专门用于企业级计算环境。AMT是英特尔管理引擎（IntelManagementEngine，ME）的一部分，旨在提供全面的远程管理和维护功能。以下是AMT的主要特点和功能：1. 远程管理远程访问：AMT允许IT管理员在操......
AI 大模型：Intelligent Agent—— 开启智能新纪元
在LLM语境下，Agent理解为在某种能自主理解、规划决策、执行复杂任务的智能体，LLM充当着智能体的“大脑”。从软件工程的角度，智能体是一种基于大语言模型的，具备规划思考能力、记忆能力、使用工具函数的能力，能自主完成给定任务的计算机程序。在基于LLM的智能体中，LLM的充......
IntelliJ IDEA 2024 安装使用 (附加激活码、补丁，亲测有效！)
第一步：下载IDEA安装包访问IDEA官网，下载IDEA2024.1.4版本的安装包，下载链接如下:idea官方链接也可以在这里点击下载idea下载idea第二步:安装IDEA点击xx关掉程序！第三步:下载补丁下载地址(里面包含激活码)https://pan.quark.cn/s/9dbfe698c064补丁下载成功后，......
IntelliJ IDEA 快捷键大全（也适用全家桶其他编辑器）
以下是IntelliJIDEA的常用功能快捷键大全，适用于Windows/Linux系统（Mac用户可将Ctrl替换为Cmd，Alt替换为Option）：功能分类功能描述快捷键(Windows/Linux)基本操作显示所有快捷键Ctrl+J显示主菜单Alt+Home全局搜索（任何内容）DoubleShift打开设置Ctrl+Alt+S保存所......
人工智能（Artificial Intelligence，简称AI）
人工智能（ArtificialIntelligence，简称AI）是一种模拟人类智能的科学与技术，它通过模拟人类的思维和行为，实现智能化的计算机系统。人工智能在现代科技中的应用越来越广泛，涵盖了各个领域。在医疗领域，人工智能可以用于辅助诊断和治疗。通过分析大量的医疗数据和图像，人工智能可以提高......
openvino 大模型qwen2.5推理案例
参看：https://github.com/openvinotoolkit/openvino.genai/releases/tag/2024.4.0.0https://github.com/TommyZihao/openvino_tonypi/blob/main/OpenVINO-0911/AIPC%E4%BB%A3%E7%A0%81/%E3%80%90B1%E3%80%91%E4%B8%89%E8%A1%8C%E4%BB%A3%E7%A0%81%E5%BC%80%E5%90%AF%E5%A4%......
2024 最新 IntelliJ IDEA 2024.1.6 激活（亲测可用）
注意：接下来本文分享免费激活 IDEA 等Jetbrains全家桶工具，一直支持到最新版本2024.1.6。 1.下载安装IDEA （mac、window、linux都支持）大家直接在官网下载最新版本，登陆官网，下载最新版本2024.1.4。一步一步确定安装，然后打开这里提示输入激活码，先关闭应用！！！2.下载激活工具打......
IntelliJ IDEA（IDEA）下无法解析 ApplicationContext 中的方法 getBean
只需要:删除过程目录下的.idea文件后，关闭IDEA，再重新打开IDEA即可解决“getBean”报红问题。（注意：前提是要保证有依赖（Spring核心库配置正确、依赖版本兼容）、配置正确（ApplicationContext 创建正确、有 Bean定义、扫描包正确）、编码问题（导入正确的类、方法调用正确））以上原理：.i......
Intel core 2 QX6600 CPU
目录简介参数1.基本规格2.热设计功耗（TDP）3.内存支持4.架构与特性5.其他信息参考链接简介Intelcore2QX6600CPU中文名QX是一款IntelExtreme版处理器，具有解锁的倍频，并且在发布时是最快的。双核和四核的非X型号实际上在工作站系列中没有任何作用，除了以更高的速度运......

使用 Optimum-Intel 和 OpenVINO GenAI 优化和部署模型

为什么使用 OpenVINO 来进行端侧部署

第一步: 创建环境

预先准备

第二步: 将模型导出为 OpenVINO IR

相关文章

赞助商

阅读排行