首页 > 其他分享 >在 Google Cloud 上轻松部署开放大语言模型

在 Google Cloud 上轻松部署开放大语言模型

时间:2024-04-12 22:22:44浏览次数:27  
标签:Google AI 模型 Vertex 轻松 部署 Cloud

今天,我们想向大家宣布:“在 Google Cloud 上部署”功能正式上线!

这是 Hugging Face Hub 上的一个新功能,让开发者可以轻松地将数千个基础模型使用 Vertex AI 或 Google Kubernetes Engine (GKE) 部署到 Google Cloud。

Model Garden (模型库) 是 Google Cloud Vertex AI 平台的一个工具,用户能够发现、定制和部署来自 Google 及其合作伙伴的各种模型。不论是在 Hugging Face 模型页面还是在 Vertex AI 模型库页面,开发者们都可以轻松简单地将开放模型作为 API 端点部署在自己的 Google Cloud 账户内。我们也将启用 Hugging Face 上最受欢迎的开放模型进行推理,这一切都得益于我们的生产级解决方案 文本生成推理

借助“在 Google Cloud 上部署”,开发者可以在自己的安全 Google Cloud 环境中直接构建准备就绪的生成式 AI 应用,无需自行管理基础设施和服务器。

为 AI 开发者构建

这一全新的体验是基于我们今年早些时候宣布的 战略合作关系 进一步扩展的,目的是简化 Google 客户访问和部署开放生成式 AI 模型的过程。开发者和机构面临的一个主要挑战是,部署模型需要投入大量时间和资源,且必须确保部署的安全性和可靠性。

“在 Google Cloud 上部署”提供了一个简单且管理化的解决方案,专为 Hugging Face 模型提供了专门的配置和资源。只需简单点击几下,就可以在 Google Cloud 的 Vertex AI 上创建一个准备就绪的端点。

Google 产品经理 Wenming Ye 表示:“Vertex AI 的 Model Garden 与 Hugging Face Hub 的集成,让在 Vertex AI 和 GKE 上发现和部署开放模型变得无缝衔接,无论您是从 Hub 开始,还是直接在 Google Cloud 控制台中。我们迫不及待想看到 Google 开发者们将会用 Hugging Face 模型创建出什么样的创新。”

从 HF Hub 开启模型部署

在 Google Cloud 上部署 Hugging Face 模型变得非常简单。以下是如何部署 Zephyr Gemma 的步骤指导。从今天开始,所有带有 text-generation-inference 标签的模型都将受到支持。

model-card

只需打开“部署”菜单,选择“Google Cloud”即可。这将直接带您进入 Google Cloud 控制台,您可以在 Vertex AI 或 GKE 上轻松一键部署 Zephyr Gemma。

vertex-ai-model-garden

进入 Vertex AI 模型库之后,您可以选择 Vertex AI 或 GKE 作为部署环境。如果选择 Vertex AI,您可以通过点击“部署”一键完成部署过程。如果选择 GKE,您可以根据提供的指南和模板,在新建或现有的 Kubernetes 集群上部署模型。

从 Vertex AI 模型库开启模型部署

Vertex AI 模型库是 Google 开发者寻找可用于生成式 AI 项目的现成模型的理想场所。从今天开始,Vertex Model Garden 将提供一种全新的体验,使开发者能够轻松部署 Hugging Face 上可用的最流行的开放大语言模型!

在 Google Vertex AI 模型库中,您会发现一个新的“从 Hugging Face 部署”选项,允许您直接在 Google Cloud 控制台内搜索并部署 Hugging Face 模型。

deploy-from-huggingface.png

点击“从 Hugging Face 部署”后,将显示一个表单,您可以在其中快速查找模型 ID。Hugging Face 上数以百计最受欢迎的开放大语言模型已经准备就绪,提供了经过测试的硬件配置。

model-selection.png

找到想要部署的模型后,选择该模型,Vertex AI 会自动填充所有必要的配置,以便您将模型部署到 Vertex AI 或 GKE 上。通过“在 Hugging Face 上查看”功能,您甚至可以确认选择的模型是否正确。如果您使用的是受限模型,请确保提供您的 Hugging Face 访问令牌,以授权下载模型。

from-deploy.png

就是这样!从 Vertex AI 模型库直接将模型如 Zephyr Gemma 部署到您的 Google Cloud 账户,只需简单几步。

这只是开始

我们很高兴能够与 Google Cloud 合作,让 AI 更加开放和易于访问。无论是从 Hugging Face Hub 开始,还是在 Google Cloud 控制台内,部署开放模型到 Google Cloud 上都变得前所未有的简单。但我们不会止步于此——敬请期待,我们将开启更多在 Google Cloud 上利用开放模型构建 AI 的新体验!

英文原文: https://hf.co/blog/google-cloud-model-garden

原文作者: Philipp Schmid & Jeff Boudier

标签:Google,AI,模型,Vertex,轻松,部署,Cloud
From: https://www.cnblogs.com/huggingface/p/18132249

相关文章

  • 配置中心Spring cloud config、Apollo、Nacos对比
    配置中心springcloudconfigApolloNacos(重点)动态配置管理SpringCloudBus自动刷新支持支持服务发现与服务健康检查Eureka或Consul实现不支持支持配置格式Properties、yaml只支持xml、text、Properties支持yaml、text......
  • 手机号机主姓名核验,简单操作轻松完成!
     随着互联网的迅猛发展,越来越多的应用场景需要进行用户实名认证,其中手机号机主姓名核验就是其中必不可少的一环。在电商、游戏、直播、金融等领域,用户实名认证成为了一个重要的手段,以提高安全性和信任度。近年来,随着手机号的普及和使用频率的增加,手机号的归属地信息也逐渐成为......
  • 轻松识别、一键验真-翔云发票识别+发票查验接口
    在这个瞬息万变的商业世界里,商业欺诈如影随形,虚假发票成为企业难以忽视的风险。而发票作为每笔交易的重要凭证,对其进行入账前的真伪查验显得尤为重要。但面对海量的发票查验与发票录入工作,人工手动查验的方式,速度慢、效率低、误差大,任何细小的疏忽都可能引起不必要的税务风险,如何......
  • 2024年腾讯云服务器代金券领取及使用教程:轻松享受优惠购云体验
    随着云计算技术的日益发展,越来越多的企业选择将业务迁移到云上,腾讯云作为国内领先的云服务提供商,不断推出优惠活动回馈用户。今天,我们就来详细讲解一下腾讯云优惠券的使用教程,特别是新春服务器代金券的特惠活动。腾讯云优惠券是腾讯云的一种优惠方式,主要包括代金券和折扣券两......
  • 记录一个springcloud-task-core.jar导致CommandLineRunner @order排序失效的问题
    项目中编写了几个CommandLineRunner,并且加上了spring的@order注解,期望在启动时会按顺序执行(从order的value小到大执行),但是实际使用发现排序不生效于是进行debug,CommandLineRunner类的排序是在SpringApplication.class的callRunners方法privatevoidcallRunners(ApplicationCon......
  • KOL运营推广方案,CloudKOL将为您提供专业的服务和支持
    在当今数字营销的时代,KOL(KeyOpinionLeader)已经成为品牌推广的重要策略之一。CloudKOL作为专业的数字营销服务提供商,致力于为客户提供一流的KOL运营推广方案,为品牌在市场上赢得更多的曝光和认可。以下是CloudKOL为您量身打造的KOL运营推广方案:1.目标设定与受众定位在制定K......
  • 找汽车之家打广告一般需要多少钱?CloudKOL为您准备1000+汽车自媒体资源
    CloudKOL汽车自媒体广告投放价格指南汽车之家作为国内知名的汽车资讯平台之一,拥有大量的汽车爱好者和潜在消费者用户群体,是众多汽车品牌进行广告投放的首选平台之一。在进行广告投放前,了解汽车之家广告投放的价格是非常重要的。下面是CloudKOL为您准备的汽车之家广告投放价格......
  • 国外KOL推广的实操指南:CloudKOL为您提供一站式服务
    随着全球化的发展,国外KOL(KeyOpinionLeader)推广已成为许多品牌进军国际市场的重要策略之一。CloudKOL作为专业的数字营销服务提供商,致力于为客户提供一站式的国外KOL推广服务。以下是国外KOL推广的实操指南,帮助品牌在国际市场获得更多曝光和认可。1.目标设定与受众定位在......
  • 如何写新闻稿件并投稿?CloudKOL教您稿件投稿流程
    在数字化时代,写作并投稿新闻稿件已成为推广企业或个人品牌的重要手段之一。以下是一些关于如何写新闻稿件并投稿的基本流程,以CloudKOL为例:1.确定新闻内容和目标受众在写新闻稿件之前,首先要确定新闻内容和目标受众。新闻内容应该具有独特性、新颖性和吸引力,能够引起受众的关......
  • Springcloud学习笔记63---RocketMq超时重试,导致重复消费的问题,解决方案
    1.重复消费的背景当Consumer处理时间过长,在超时时间内没有返回给Broker消费状态,那么Broker也会自动重试。设定一个超时时间,达到超时时间的那个消费当作消费失败处理。Java客户端中的DefaultPushConsumer中的构造方法中的consumeTimeout字段(默认15分钟)。packagewilliam.rmq.......