首页 > 其他分享 >使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意

使用亚马逊Bedrock的Stable Diffusion XL模型实现文本到图像生成:探索AI的无限创意

时间:2024-09-07 21:54:33浏览次数:11  
标签:Diffusion XL AI 模型 Amazon Notebook Bedrock image

引言

什么是Amazon Bedrock?
Amazon Bedrock是亚马逊云服务(AWS)推出的一项旗舰服务,旨在推动生成式人工智能(AI)在各行业的广泛应用。它的核心功能是提供由顶尖AI公司(如AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI以及亚马逊自身)开发的多种基础模型(Foundation Models,简称FMs)。这些模型经过优化,适用于特定的应用场景和行业需求,为各种AI应用提供了坚实的基础。

Amazon Bedrock的独特之处在于其通过单一API访问多个模型的统一方式。这大大简化了开发流程,用户无需对代码进行大量修改即可轻松与多种基础模型进行交互。此外,该服务还提供强大的定制化功能,允许用户根据特定领域或任务对预训练模型进行微调,从而提升模型的性能和准确性。

Amazon Bedrock的另一大亮点是其对先进AI技术的支持,例如检索增强生成(Retrieval Augmented Generation,简称RAG)。通过结合基于检索和生成的模型元素,RAG在自然语言处理(NLP)任务中能够生成更具上下文相关性和准确性的回应。该服务采用无服务器架构,用户无需管理复杂的基础设施,只需专注于构建AI应用。此外,Amazon Bedrock还与其他AWS服务无缝集成,确保兼容现有的基础设施、安全特性和数据管理工具。

在安全、隐私和负责任的AI实践方面,Amazon Bedrock也做出了卓越的承诺。它为用户提供了全面的控制和保护措施,以确保敏感数据的安全,并在AI开发和部署过程中遵守道德规范。

总的来说,Amazon Bedrock为组织提供了一个全面的平台,使其能够利用生成式AI的强大功能,在推动创新的同时,严格遵守安全、隐私和道德标准。

架构图

验证Bedrock模型的访问权限

  1. 请确认您所在的区域为美国东部(弗吉尼亚北部)us-east-1区域。

  2. 进入Bedrock页面,点击顶部的服务菜单,然后选择Bedrock。

  3. 在Bedrock页面左侧菜单中,选择“模型访问”(Model Access)。

  4. 向下滚动至Stability AI模型,确认您已获得该模型的访问权限。

 

创建 SageMaker Notebook 实例

  1. 确保您位于美国东部(弗吉尼亚北部)us-east-1 区域。在顶部搜索栏中搜索“Amazon SageMaker”,并进入 SageMaker 服务页面。

  2. 在 SageMaker 仪表板上,选择左侧菜单中的“Notebook”选项,然后点击“Notebook 实例”。

  3. 点击“创建 Notebook 实例”按钮。

  4. 配置 Notebook 实例:

    • 名称:SageMakerInstance
    • Notebook 实例类型:ml.t2.medium
    • 平台标识符:Amazon Linux 2, Jupyter Lab 3
    • IAM 角色选择:SageMakerInstanceRole
    • 其他选项保持默认设置。
    • 点击“创建 Notebook 实例”按钮。
  5. 等待状态变为“InService”,因为 Notebook 实例的创建可能需要大约 5 分钟。

  6. 在 Notebook 实例的操作部分,点击“打开 Jupyter”以进入 Jupyter 环境。

使用 Stable Diffusion 生成图像

在此步骤中,我们将生成一张狗的示例图片,以了解如何使用 Amazon Bedrock 服务生成图像。

  1. 在 JupyterLab 中点击“New”按钮,并从下拉菜单中选择 conda_python3 notebook。

  2. 点击“Files”并使用“Rename”按钮将 notebook 重命名为 Whiz_Image_generation

  3. 将以下代码粘贴到 Jupyter Notebook 提供的代码块中,以使用 Stable Diffusion 模型生成图像。

    import base64
    import os
    import random
    import boto3
    import json
    
    prompt_data = """
    A high-red 4k HDR photo of a golden retriever puppy running on a beach.
    Action shot, blue sky, white sand, and a big smile. Cinematic film quality.
    """
    
    def main():
        seed = random.randint(0, 100000)
        generate_image(prompt=prompt_data, seed=seed, index=0)
    
    def generate_image(prompt: str, seed: int, index: int):
        payload = {
            "text_prompts": [{"text": prompt}],
            "cfg_scale": 12,
            "seed": seed,
            "steps": 80,
        }
    
        # Create the client and invoke the model.
        bedrock = boto3.client(service_name="bedrock-runtime")
        body = json.dumps(payload)
        model_id = "stability.stable-diffusion-xl-v1"
        response = bedrock.invoke_model(
            body=body,
            modelId=model_id,
            accept="application/json",
            contentType="application/json",
        )
    
        # Get the image from the response. It is base64 encoded.
        response_body = json.loads(response.get("body").read())
        artifact = response_body.get("artifacts")[0]
        image_encoded = artifact.get("base64").encode("utf-8")
        image_bytes = base64.b64decode(image_encoded)
    
        # Save image to a file in the output directory.
        output_dir = "output"
        os.makedirs(output_dir, exist_ok=True)
        file_name = f"{output_dir}/generated-{index}.png"
        with open(file_name, "wb") as f:
            f.write(image_bytes)
    
        print("Image generated successfully")
    
    if __name__ == "__main__":
        main()
    
    

  4. 点击“Run”按钮运行代码。

  5. 成功执行后,您将收到“Image generated successfully.”(图像生成成功)的输出消息。

  6. 返回到根文件夹,您会看到一个名为“output”的新创建文件夹。

  7. 在“output”文件夹中,您将找到使用 Stable Diffusion 模型生成的图像。

  8. 点击图像以查看生成的图像。

总结 

通过上述步骤,您已经成功使用 Amazon Bedrock 的 Stable Diffusion 模型生成了一张示例图像。这不仅展示了该服务的强大功能,也为您在未来的项目中如何运用生成式 AI 提供了实用的操作指南。无论是用于图像生成还是其他复杂的 AI 应用,Amazon Bedrock 都为开发者提供了一个灵活且易于使用的平台,助力创新。现在,您可以探索更多可能性,进一步优化和扩展您的 AI 应用。

标签:Diffusion,XL,AI,模型,Amazon,Notebook,Bedrock,image
From: https://blog.csdn.net/rralucard123/article/details/142003884

相关文章

  • AI预测福彩3D采取888=3策略+和值012路或胆码测试9月7日新模型预测第80弹
            经过近80期的测试,当然有很多彩友也一直在观察我每天发的预测结果,得到了一个非常有价值的信息,那就是9码定位的命中率非常高,70多期一共只错了8次,这给喜欢打私房菜的朋友提供了极高价值的预测结果~当然了,大部分菜友还是走的正常渠道,因此,得想办法进行缩水,尽可能少......
  • AI预测体彩排3采取888=3策略+和值012路或胆码测试9月7日升级新模型预测第75弹
             经过70多期的测试,当然有很多彩友也一直在观察我每天发的预测结果,得到了一个非常有价值的信息,那就是9码定位的命中率非常高,已到达90%的命中率,这给喜欢打私菜的朋友提供了极高价值的预测结果~当然了,大部分菜友还是走的正常渠道,因此,得想办法进行缩水,尽可能少的......
  • sekaiCTF-2024-pwn-nolibc解析
    sekaiCTF2024nolibc程序逆向IDA反编译之后:全是没有符号表的函数。start函数就是主函数。然后发现一些类似于printf的函数也没有符号。我们linux上运行程序可以确定,至少sub_1322("WelcometoStringStorage!");这样的函数实现的功能就是类似于printf。逆向函数:__int64__......
  • 解锁AI奥秘:高效学习人工智能的十大策略
    大家好,今天给大家介绍解锁AI奥秘:高效学习人工智能的十大策略,文章末尾附有分享大家一个资料包,差不多150多G。里面学习内容、面经、项目都比较新也比较全!可进群免费领取。解锁AI奥秘:高效学习人工智能的十大策略随着人工智能技术的飞速发展,掌握AI知识已成为许多人提升竞争力......
  • AI换脸深度伪造技术的全新Deepfakes解决方案:Roop-Unleashed,一键整合包教程
    无需训练即可使用未经审查的图像和视频Deepfakes,并且具有易于使用的GUI。     Stars情况如下:  随着科技的发展,图像和视频编辑工具层出不穷。Roop-Unleashed作为一款先进的开源软件,专注于图像和视频的面部替换,通过其无训练要求的设计和易用的用户界面,......
  • 【Azure Developer】上手 The Best AI Code "Cursor" : 仅仅7次对话,制作个人页面原型,
    AICode时代早已开启,自己才行动。上手一试,让人惊叹。借助这感叹的情绪,把今天操作Cursor的步骤记录下来,也分享给大家。推荐大家上手一试,让你改变! 准备阶段下载Cursor(https://www.cursor.com/),点击右上角“Download”下载exe安装文件。安装后,桌面会有一个Cursor图表。双击启动! ......
  • 【Azure Developer】上手 The Best AI Code "Cursor" : 仅仅7次对话,制作个人页面原型,
    AICode时代早已开启,自己才行动。上手一试,让人惊叹。借助这感叹的情绪,把今天操作Cursor的步骤记录下来,也分享给大家。推荐大家上手一试,让你改变! 准备阶段下载Cursor(https://www.cursor.com/),点击右上角“Download”下载exe安装文件。安装后,桌面会有一个Cursor图表。......
  • Kubernetes 1.25 containerd 环境部署 SuperMap iManager
    超图官网目提供的Kubernetes版本为1.20版本,容器运行时为docker本次部署使用已有的Kubernetes1.25版本集群,容器运行时为containerdKubernetes,containerd部署请自行了解,本次不做介绍,下面介绍在此环境上如何部署iManager11i并创建云套件1.环境介绍虚拟机CPU......
  • 测试你们认为最好的AI工具,是不是好用得自己试试!
    大家好,我是凡人,在OpenAI春季发布会后,GPT-4o一时风光无量,一个同事不信邪,非要用 GPT-4o版本对OpenAI官网上的例子尝试生成,本来还是嘲笑他的心态,但他还真的发现了点有意思的事情。今天决定对官网上部分例子进行简单测试,人家说再好的东西,也要亲自验证才安心。下面我们......
  • AI是不是真的能落地应用,未来看看这三个行业
    大家好,我是凡人,最近也被GPT-4o刷爆了朋友圈,各种对OpenAI新布局的猜想也是层出不穷。GPT-4o再次将多模态交互拉到了新高度,一放出就颠覆了原有AI 给传统行业带来新冲击。还有不了解GPT-4o 的同学,可以查看我上一篇文章:GPT-4o横空出世!OpenAI26分钟重回巅峰!接下来,我会重点......