首页 > 其他分享 >Amazon SageMaker: 拓展机器学习边界,塑造未来创新趋势

Amazon SageMaker: 拓展机器学习边界,塑造未来创新趋势

时间:2024-04-15 19:35:39浏览次数:14  
标签:训练 S3 创建 模型 塑造 Amazon SageMaker

授权说明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 亚马逊云科技开发者社区, 知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道。

近期在 re:Invent 2023 大会上,亚马逊云科技发布了一组引人注目的新功能,重点强调了生成式人工智能在塑造人工智能未来方向上的引领地位。其中,Amazon SageMaker 作为一款全面托管的机器学习服务,在其新功能的引领下,能够为用户提供更高效、更强大的机器学习工具。 我将在后文对 Amazon SageMaker 的产品进行使用体验,以及对其进行全面的总结。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

image.png

一、 Amazon SageMaker: 高效、便捷的机器学习全方位解决方案

Amazon SageMaker 以其全面而先进的功能和解决方案,为用户提供了更多可能性,使机器学习的构建、训练和部署过程更加便捷高效。SageMaker 持续推动着机器学习技术的进步,也为用户提供了更为出色的工具和平台。这一系列优势共同构成了 SageMaker 在机器学习领域的引领地位。

image.png

通过专注于创新,提供面向数据科学家的 IDE 和无代码界面,Amazon SageMaker 能够让开发者轻松利用机器学习处理结构化和非结构化数据。其优化基础设施将培训时间从几小时缩短到几分钟,专用工具提高团队生产力多达10倍。此外,自动执行和标准化 MLOps 实践和治理,支持组织中的透明度和可审核性。

二、SageMaker 新功能:突破创新之路

Amazon SageMaker 作为全面托管的机器学习服务,为我们提供了无需关注底层复杂性的机会,将重心集中在模型的构建和优化上。通过 SageMaker,我们可以轻松构建和训练机器学习模型,并将其直接部署到生产就绪的托管环境中。这一服务不仅提供了集成的 Jupyter 编写 Notebook 实例,方便访问数据源进行探索和分析,还支持常见机器学习算法,为分布式环境中的高效数据处理提供了优化的解决方案。

image.png

1. SageMaker HyperPod 和 Inference:强大的训练与部署基础设施

亚马逊云科技最新发布的 SageMaker HyperPod 和 Inference 功能展现了其对机器学习领域的持续创新。SageMaker HyperPod 是为大规模分布式训练而设计的创新基础设施,旨在解决训练模型所面临的复杂性和高成本挑战。SageMaker HyperPod 通过预配置 SageMaker 的分布式训练库,自动将训练工作负载分发到数千个加速器中,实现并行处理以提高模型性能。

image.png

而 SageMaker Inference 则致力于降低模型部署的成本和延迟,满足组织对性能优化的需求。用户可以单独控制每个模型的扩展策略,以适应不同的模型使用模式,同时优化基础架构成本。通过智能路由推理请求,SageMaker 主动监控处理请求的实例,并将请求平均路由到可用的实例。

2. SageMaker Clarify 和 Canvas:负责任 AI 的评估与直观工作流

SageMaker Clarify 和 Canvas 功能的引入进一步推动了机器学习应用的发展。SageMaker Clarify 为用户提供了一种负责任使用 AI 的便捷方式,快速评估和选择基础模型。通过支持用户有效评估模型,确保其符合负责任的AI标准。用户可以轻松提交模型进行评估,也可以通过 SageMaker JumpStart 选择适用于其用例的模型,同时获取详细的报告,为用户提供基于性能标准的快速比较、评估和选择最佳模型的便利。

image.png

新的 Amazon SageMaker Canvas 增强功能使用户更轻松、更快速地将生成式 AI 集成到其工作流程中。Canvas 支持用户在无代码环境中构建 ML 模型并生成预测,无需编写任何代码。此次更新扩展了 Canvas 的即用型功能,使用户能够更直观地准备数据,通过自然语言指令解决常见的数据问题。

三、功能测评体验

首先用户在亚马逊云科技官网完成账号登录,没有账号的需要先进行注册,登录之后来到个人控制台,在搜索栏搜索 Amazon SageMaker 服务:

image.png

进入到 Amazon SageMaker 服务界面之后,在左侧导航栏找到笔记本模块,点击笔记本实例,并进行创建:

image.png

。进入创建界面后,可以根据开发需要进行配置信息选择,同时也可以新的 IAM 角色,也可以使用已经存在的角色。

image.png

稍等片刻,等待笔记本实例状态变为 InService,即表示实例可用。

image.png

为了测试使用,我们在顶部搜索栏搜素 S3 存储桶服务,然后创建通用存储桶,配置完信息之后,等待存储桶的创建完毕,之后我们可以进入桶内部进行相关操作。

image.png

进入存储桶中之后,我们可以通过上传功能将本地的资源进行上传到 S3 存储桶中,如图,我将本地的一些图片资源传输到我创建的存储桶中。

image.png

回到 Amazon SageMaker 界面,进入 Jupyter 界面:

image.png

进入界面之后,选择图中所示功能进行相关操作:

image.png

然后输入如下 python 代码:注意,需要将其中的 S3 存储桶对应的信息切换为刚才咱们创建的 S3 通用存储桶信息才可以生效,在这一块,我贴出代码:

import sagemaker
 
sess = sagemaker.Session()
bucket = sess.default_bucket()
 
!xxx s3 sync s3://sagemaker-sample-files/datasets/image/caltech-101/inference/ s3://{bucket}/ground-truth-demo/images/
 
print('Copy and paste the below link into a web browser to confirm the ten images were successfully uploaded to your bucket:')
print(f'https://s3.console.xxx.amazon.com/s3/buckets/{bucket}/ground-truth-demo/images/')
 
print('\nWhen prompted by Sagemaker to enter the S3 location for input datasets, you can paste in the below S3 URL')
 
print(f's3://{bucket}/ground-truth-demo/images/')
 
print('\nWhen prompted by Sagemaker to Specify a new location, you can paste in the below S3 URL')
 
print(f's3://{bucket}/ground-truth-demo/labeled-data/')

 

 

标红的一处需要将对应信息切换成我们刚才创建的 S3 存储桶对应信息。

image.png

回到 Amazon SageMaker 界面,我们选择 Ground Truth 模块中的贴标作业,然后创建标准作业。

image.png

在创建的时候,选择我们刚才创建的 S3 存储桶,然后根据开发需求进行相关信息配置,配置完毕之后,开始创建。

image.png

在数据设置中,将 S3 存储桶可以设置成我们刚才创建好的,同时数据类型选择图像, IAM 角色选择创建新角色或使用早前 Jupyter 笔记本的对应数值:

image.png

在任务设置中,选择图像作为任务类型,选择图像分类(单个标签)作为任务类别,然后点击下一步。

image.png

标注作业创建完毕之后,可以查看相关的信息。

image.png

核查标注作业结果也至关重要,可评估标记质量和确定是否需要优化说明和数据。回到我们的 SageMaker 控制台,选择 Labeling jobs 标注作业,然后选择我们刚才创建好的作业,然后就可以进行对所选作业结果进行评估。

image.png

标注作业创建成功之后,我们选择左侧功能栏中的训练模块,开始根据需求进行作业训练,以便达到想要的结果。

image.png

然后训练作业,点击创建训练作业并且去配置相关训练参数,这一块信息配置可以根据开发需要进行相关设置。

image.png

完成训练作业,当我们看到作业状态变更为 success,即表示作业训练完成。

image.png

四、体验感悟和总结

作为一个机器学习爱好者,我对 SageMaker HyperPod 和 Inference 功能的引入感到非常激动。HyperPod 作为一项创新性基础设施,解决了我在大规模分布式训练中所面临的挑战。以前,使用 GPU 和 Trainium 计算实例进行训练时,我常常碰到数据量增加、模型大小膨胀以及训练时间延长的问题。

image.png

HyperPod 的出现改变了这一切,通过自动分发训练工作负载到数千个加速器中,显著提高了我的模型性能。同时,它的定期保存检查点功能确保了在硬件故障发生时的平稳继续训练,省去了我繁琐的手动管理过程。现在,我能够更加高效地进行数周甚至数月的训练,为我的模型构建和优化提供了更多的便利。

image.png

而 SageMaker Inference 则是解决模型部署过程中成本和延迟问题的救星。通过支持将多个模型部署到同一实例,Inference 平均降低了部署成本约50%。这让我可以更灵活地控制每个模型的扩展策略,更好地适应不同的模型使用模式,同时有效地优化基础架构成本。通过智能路由推理请求,SageMaker 还能够主动监控实例处理请求的情况,将请求平均路由到可用的实例,降低了推理延迟约20%。

image.png

这一系列创新性功能的整合不仅在硬件基础设施的优化上取得了显著进展,同时也为我提供了更加便捷、高效的机器学习工作流。整体来说,Amazon SageMaker 新推出的功能为用户在 AI 领域的探索之路提供了更为强大的支持,让用户更加期待未来在机器学习领域的深入应用。

文章来源:https://dev.amazoncloud.cn/column/article/658ad3155d096603bb1d9d95?sc_medium=regulartraffic&sc_campaign=crossplatform&sc_channel=bokey

标签:训练,S3,创建,模型,塑造,Amazon,SageMaker
From: https://www.cnblogs.com/AmazonwebService/p/18136733

相关文章

  • Amazon Q:对话智能赋能企业发展
    授权说明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在亚马逊云科技开发者社区,知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道。在最近举办的亚马逊云科技大会上,引人瞩目的消息是AmazonQ的推出,这是一款专注于生成式AI支持的新型助手。与其他......
  • Amazon Bedrock 实践系列 | Claude 3 深度探秘
    生成式AI和大模型在2024年已经进入落地实践阶段。因此,围绕开发者在生成式应用程序开发中的主要痛点和需求,我们组织了这个“AmazonBedrock实践”的系列,希望可以帮助开发者高效地上手生成式AI和大模型的应用开发。本篇为第二篇(特别提示:本篇探讨的AnthropicClaude3模型......
  • Amazon SageMaker:让机器学习变得更简单、更强大
    授权说明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在亚马逊云科技开发者社区,知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道。前言:在大数据时代的浪潮中,数据不再只是数字的堆积,而是成为我们理解世界、做出决策的关键元素。随着信息技术的飞速......
  • 【Python】深入探究:if、elif、else语句如何塑造Python代码的逻辑魅力
    欢迎来CILMY23的博客本篇主题为深入探究:if、elif、else语句如何塑造Python代码的逻辑魅力个人主页:CILMY23-CSDN博客个人专栏系列:Python|C语言|数据结构与算法|C++感谢观看,支持的可以给个一键三连,点赞关注+收藏。 写在前头:本篇博客主要对各种的条件语句进行详......
  • 用 AI 让数据分析更智能 - Amazon Q 在 Amazon Quicksight 中的应用
    今年1月25日,亚马逊云科技(北京)区域上线了数据可视化神器–Quicksight,这是一项快速、可扩展且完全托管的商业智能(BI)服务,可以基于企业内部的数据轻松创建和发布交互式数据分析控制面板,从此企业用户可以更便捷的将亚马逊云端的数据集成第三方、本地数据进行集中分析,并更轻松的进......
  • 猫头虎博主深度探索:Amazon Q——2023 re:Invent 大会的 AI 革新之星
    摘要大家好,我是猫头虎博主!今天,我要带大家深入了解2023年re:Invent大会上发布的一款革命性产品——AmazonQ。让我们一起探索这个引领未来工作方式的新型工具吧!引言在2023年的re:Invent大会上,亚马逊云科技(亚马逊云科技)不仅展示了包括AmazonGraviton3、AmazonSageMakerSt......
  • 【亚马逊云科技】使用 Vscode Amazon-Q 完成 GUI 界面粉笔脚本开发
    前言亚马逊云科技-Q,可以快速获得紧迫问题的相关答案,解决问题,生成内容。当与Q聊天时,它会提供即时的相关信息和建议,以帮助简化任务、加快决策速度,并帮助激发工作中的创造力和创新。本次我们通过完整的项目开发全方面体验一下Q的实用性,体验在代码开发中是否真正做到解放生产力......
  • 使用 Amazon Bedrock + Claude 3 打造个性化智能编程助手
    最近,随着人工智能技术的迅速发展,代码助手已经成为软件开发领域备受关注的工具。像AmazonCodeWhisperer和GithubCopilot这样的工具可以在集成开发环境中帮助用户自动生成代码,极大地提高了开发效率。然而,这些助手通常缺乏直接执行代码的能力,需要额外集成开发环境来执行代码。......
  • Amazon Bedrock 实践 | 动手玩转 Claude 3
    生成式AI和大模型在2024年已经进入落地实践阶段。因此,围绕开发者在生成式应用程序开发中的主要痛点和需求,我们组织了这个“AmazonBedrock实践”的系列,希望可以帮助开发者高效地上手生成式AI和大模型的应用开发,本篇为第一篇。亚马逊云科技开发者社区为开发者们提供全球......
  • Amazon Aurora Limitless Database :数据库管理的全新境界
    在当今数亿用户、PB级数据和数百万交易的业务环境中,数据库管理面临着巨大的挑战。传统数据库扩展的繁琐性和耗时性使得许多组织需要花费数月甚至数年的时间来构建自定义软件以满足其极端的工在当今数亿用户、PB级数据和数百万交易的业务环境中,数据库管理面临着巨大的挑战。 ......