首页 > 其他分享 >起心动念 | 生成式 AI 开发实践系列的开端

起心动念 | 生成式 AI 开发实践系列的开端

时间:2024-02-03 10:13:27浏览次数:32  
标签:心动 AI 模型 生成式 亚马逊 Amazon 开发者

生成式 AI 和大模型的技术变革力量,正在逐渐影响着我们当下这个时代,全球各行各业都呈现百舸争流、万象更新的趋势。在 2023 年,我们通过各种面向开发者的活动,收集到了大量开发者关于基于生成式 AI 的开发内容需求和建议反馈。开发者们都期待我们在 2024 年推出更多关于生成式 AI 开发实践的系列内容。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

根据来自于过去一年的开发者的需求建议上的深度思考,我们确定了以下三个围绕生成式 AI 开发实践的内容系列,希望在 2024 年里,对开发者们在生成式 AI 应用领域的开发实践有所帮助:

  • 构建生成式 AI 应用开发实践系列

  • 开源大语言模型的优化实践系列

  • 亚马逊云科技上的生成式 AI 开发实践系列

构建生成式 AI 应用开发实践系列

在亚马逊云科技 re:Invent 2023 以及之后的 reCap 巡展中,细心的开发者们也许已经发现有一个很有趣的动手实验:

开发一款可部署的基于大语言模型的字谜游戏。

该款游戏使用了文生图模型为玩家提供一个未知的提示词,玩家需要根据模型生成的图像来猜测该提示词,来完成游戏。该动手实验完整地展示了如何在亚马逊云科技上完整构建生成式 AI 应用程序。

这款游戏的后端使用了三个大模型,包括:

  • 文本到图像的模型

  • 文本嵌入(Text Embedding)模型

  • 文本生成模型

整个游戏的主要拓扑结构图如下所示:

image.png

本系列计划用 3-5 篇博客的篇幅,完整阐述如何构建基于大模型的生成式 AI 应用实践,来帮助开发者们全面了解构建 生成式 AI 应用开发的完整流程,包括:构建前端程序、构建后端程序、以及代码面向生产环境的持续集成和持续部署(CI/CD)等方面内容:

  • 生成式 AI 应用设计概述

  • 文本到图像模型的设计

  • 嵌入模型的设计

  • 文本生成模型的设计

  • 生成式 AI 应用 CI/CD 实践

开源大语言模型的优化实践系列

该系列的策划起源自我们在 2023 年亚马逊云科技 re:Invent 上的演讲分享——使用 Amazon SageMaker 优化开源大语言模型的部署和微调

在技术分享中,我们和世界各地的开发者们一起探讨了大语言模型的模型部署和微调优化领域,包括:模型编译、模型压缩、模型分布式训练、模型推理批处理等方面的行业最新论文和发展趋势,以及通过两个实际代码展示了 Amazon SageMaker 如何高效简化大语言模型的部署和微调流程。如下图所示:

image.png

分享结束后,很多开发者和我们沟通联系,希望我们可以把这个话题延展地更深入一些,因为和开源大模型优化相关的很多子领域,在过去一年行业进步迅速,很多优秀的论文和想法脱颖而出。因此,我规划了这一系列,通过 4-6 篇博客来分享我在开源大语言模型优化领域的心得和体会,话题包括:

  • 模型编译

  • 模型压缩

  • 模型分布式训练

  • 模型部署

  • 模型推理优化

在亚马逊云科技上的生成式 AI 开发实践系列

从 2023 年开始,在生成式 AI 领域涌现了很多优秀的书籍和在线课程。为帮助开发者可以系统了了解如何利用亚马逊云科技在云基础设施、数据存储、数据处理以及数据分析等诸多方面的优势,我们特别规划了这个系列的内容。

我们希望在 2024 年里通过 8-12 篇技术博客和大家逐步分享行业的最新进展和在亚马逊云科技上的开发实践,主要内容规划如下:

  • 生成式 AI 用例、基础知识、项目生命周期

  • 提示工程和上下文学习

  • 大型语言基础模型

  • 模型量化和模型的分布式训练

  • 模型微调和模型评估

  • 参数高效微调(PEFT)

  • 使用 RLHF 进行强化学习微调

  • 优化和部署 生成式 应用程序

  • 检索增强生成 (RAG) 和代理

  • 多模态基础模型概述

  • 使用 Stable Diffusion 模型进行用户可控的模型生成和微调

  • 使用 Amazon Bedrock 的生成式 AI 开发实践

敬请期待!

特别推荐

除了今年的内容分享预告,我也希望给开发者们推荐以下学习资源,与开发者共勉。

书籍《Generative AI on Amazon Web Services》

难度:初级/中级

该书的作者为来自亚马逊云科技的同事 Chris Fregly、Antje Barth 和 Shelbee Eigenbrode 等。 

书籍主要内容包括了:生成式 AI 的生命周期,包括用例定义、模型选择、模型微调、检索增强生成、通过人类反馈的强化学习以及模型量化、优化和部署等。如果开发者计划利用亚马逊云科技的诸多服务,在云端设计和开发生成式 AI 的应用的话,非常推荐此书。

书籍链接:https://www\.amazon.com/\_/dp/1098159225?trk=cndc-detail

在线课程《Generative AI with Large Language Models》

技术难度:中级

吴恩达创办的 DeepLearning.AI 一直在提供各种面向 AI 领域的精品课程。而在大语言模型领域,笔者非常推荐 DeepLearning.AI 与亚马逊云科技合作推出这门在线课程。

这门在线课程的主要内容是讲授生成式 AI 的工作原理,以及如何部署面向真实世界应用的生成式 AI 模型。这门课的对象主要是针对中等水平的生成式 AI 开发人员,所以需要有一定的编程基础并且对机器学习有一定的了解。此外,官方建议课程的学习时间是三周,也是一个比较长的学习周期。

在线课程链接:https://www\.coursera.org/learn/generative-ai-with-llms?trk=cndc-detail

在线课程《Hands-on Machine Learning with Amazon Web Services and NVIDIA》

技术难度:中级/高级

该在线课程是 DeepLearning.AI 与亚马逊云科技合作的又一重要课程,专为数据科学家和开发人员等 ML 实践者设计。课程要求注册课程的开发者,具有机器学习工作流程的基础知识。

在该课程中,开发者将了解如何让使用 Amazon SageMaker 和 NVIDIA GPU 加速的 Amazon EC2 实例构建、训练和部署可扩展机器学习模型的实践经验。

课程首先概述了 Amazon SageMaker 和 NVIDIA GPU。然后指导开发者通过运行由 GPU 驱动的 Amazon SageMaker 笔记本实例进行实践操作。学习内容包括:如何准备用于模型训练的数据集、构建模型、执行模型训练以及部署和优化 ML 模型等生成式 AI 模型训练的完整流程。

在线课程链接:https://www\.coursera.org/learn/machine-learning-aws-nvidia?trk=cndc-detail

最后,祝福各位开发者龙年新年快乐,阖家幸福,万事如意!

文章来源:https://dev.amazoncloud.cn/column/article/65bd9436cfa5835dd40eb4bf?sc_medium=regulartraffic&sc_campaign=crossplatform&sc_channel=bokey

 

标签:心动,AI,模型,生成式,亚马逊,Amazon,开发者
From: https://www.cnblogs.com/AmazonwebService/p/18004373

相关文章

  • AIStudio框架汇总及介绍
    长风破浪会有时,直挂云帆济沧海AIStudio.框架汇总开源版名称地址描述GiteeGitHub博客Wpf画板框架:示意图,流程图,SFC顺序控制图,逻辑图,思维导图,画板,Block基础功能,可编程画板(预览)等GiteeGitHub博客权限框架Wpf客户端:大屏,系统管理,流程中心,通用查询,代码生成,文......
  • AI生成的图片是否具有版权:如何认定美术作品的“抄袭”行为?
    相关:实务丨如何认定美术作品的“抄袭”行为?首先,我认为AI生成的图片是否具有版权这个问题就不是一个问题,或者说这不是一个正确的提法,应该说AI生成的某张图片是否具有版权?也可以说,AI生成的某张图片是否侵权?因为,不把问题具体到具体的某张图片上,这个问题是没有讨论的前提的,还有,......
  • 2024年AI发展趋势的十大预测
    美国《福布斯》发布了《10AIPredictionsFor2024》对2024年AI发展趋势进行了预测。今年AI领域会有哪些变化和发展趋势呢?对企业、开发者、从业人员有哪些影响?1.英伟达将努力成为云服务提供商去年英伟达已经推出了DGXCloud的云服务,今年有可能建立自己的数据中心(DGX......
  • 想好新年去哪了吗?合合信息扫描全能王用AI“留住”年味
    还有不到十天,除夕就要到了。近几年春节假期中,有人第一次带着孩子直击海面冰风,坐船回老家;也有人选择“漫游”国内外,在旅行中迎接新春的朝气。合合信息旗下扫描全能王APP通过AI扫描技术,提供了一种全新的“年味记录”方式,帮助用户留住温暖的瞬间。 游子千里归乡,“拍春节”留住瞬......
  • int main(int argc,char* argv[]) 参数详细说明
    argc:参数个数argv[]:参数内容注意:当程序直接运行,没有额外的命令行参数时,argc为1,因此argc至少为1,argv[]至少长度为1,即argv[0]存储程序的名称,argv[1]以后的元素为空上述两个参数在编译器内部运行无效,在命令行或终端运行发挥作用举例:假设需要两个整数参数进行加法......
  • AI监控+智能充电桩系统如何缓解新能源汽车充电难问题
    在新能源汽车行业的快速发展中,充电桩作为重要的配套设施,其建设和发展至关重要。随着新能源汽车销量的增长,补能需求也日益迫切,这为充电桩行业的发展提供了巨大的机遇。然而,充电桩行业在快速发展的同时,也暴露出一些短板和问题:1、充电桩的数量更是有限,给车主带来很大的不便;2、充电......
  • AI入门导航
    【新手快速入门】全套入门教程:https://www.bilibili.com/read/cv22159609快速入门生成图片:https://www.bilibili.com/read/cv22661198模型安装使用教程:https://www.bilibili.com/read/cv213622022023年4月模型分享:https://www.bilibili.com/video/BV1em4y1z7Dg【常用网站】A......
  • Qt 解决中报错xxx.h:4:10: ‘QMainWindow‘ file not found
    前言qt中这个报错非常无语,在一个目录下打开是正常的,然后copy项目到其他文件夹就找不到报错,大家的原因都不太相同,这里列出以下几种可能及解决方法。可能1.中文路径很有可能copy到了一个中文路径下的目录,然后导致出现问题。解决方式就是换到英文目录可能2.将.pr......
  • 2023 Airtest 年终总结来了,大佬们速来围观!
    此文章来源于项目官方公众号:“AirtestProject”版权声明:允许转载,但转载必须保留原链接;请勿用作商业或者非法用途1、前言马上要进入2024年龙年春节了~,~让我们回顾一下2023年里大家与AirtestProject一起成长的痕迹,也快来看看,在2024年,AirtestProject会有什么新的功能~2、开源产......
  • 自然语言开发AI应用,利用云雀大模型打造自己的专属AI机器人
    如今,大模型层出不穷,这为自然语言处理、计算机视觉、语音识别和其他领域的人工智能任务带来了重大的突破和进展。大模型通常指那些参数量庞大、层数深、拥有巨大的计算能力和数据训练集的模型。但不能不承认的是,普通人使用大模型还是有一定门槛的,首先大模型通常需要大量的计算资......