如何使用 Amazon Sagemaker 创建生成式 AI 图像

Rifat Business Oct 3, 2024

近年来,人工智能 (AI) 领域取得了显著进步,图像生成 AI 已成为最引人注目且发展最快的领域之一。这项尖端技术使我们能够仅通过文字描述即可创建出令人惊叹、逼真的图像,开启了无限的创意可能性。

图像生成 AI 模型利用深度学习算法和大量训练数据来学习和理解文本与视觉表示之间的复杂模式和关系。通过提供简单的文本提示,这些模型可以合成与给定描述高度一致的全新图像,捕捉复杂的细节、风格和构图。

什么是 Amazon Sagemaker?

Amazon SageMaker是 AWS 提供的一项完全托管的机器学习服务,它简化了端到端机器学习工作流程,实现了快速高效的模型构建、训练和部署。它抽象了复杂的基础设施任务,使开发人员和数据科学家能够专注于他们的核心目标并加快产品上市时间。

SageMaker 提供各种内置算法、预训练模型和对自定义模型的支持,确保灵活性并能够访问最新进展,包括图像生成 AI 模型。其用户友好的界面 SageMaker Studio 提供了一个集成的开发环境,可实现无缝编码、测试和部署,从而增强协作并简化开发流程。

创建令人惊叹的网站

使用最好的免费页面构建器 Elementor

现在开始

与 Amazon S3、EC2 和 SageMaker Ground Truth 等 AWS 服务的无缝集成使用户能够充分利用 AWS 生态系统,获得流畅的机器学习体验。自动模型调整、分布式训练和内置部署等高级功能以及强大的监控和日志记录工具可优化模型性能和可扩展性。SageMaker 可帮助组织加快其机器学习项目、降低运营开销并提供创新的 AI 解决方案。

开始使用 Amazon Sagemaker

从控制台启动 Amazon SageMaker Studio 是一个简单的过程,它允许您访问完全集成的机器学习开发环境。请按照以下步骤开始:

  1. 打开 Amazon SageMaker 控制台
  2. 在左侧导航窗格中,找到并选择“Studio”选项。
  3. 在 Studio 登录页面上,您将看到可用域和用户配置文件的列表。选择要用于启动 Studio 的适当域和用户配置文件。
  4. 选择域和用户配置文件后,点击“打开 Studio”按钮。
  5. 要完成启动,请选择“启动个人工作室”。

通过遵循这些步骤,您将能够快速访问 Amazon SageMaker Studio 并开始利用其强大的功能开展您的机器学习项目。

选择 JumpStart

Stable Diffusion 2 模型允许我们通过一行简单的文本创建图像,非常适合生成社交媒体帖子、宣传材料、专辑封面和其他创意艺术品等内容。

要使用此模型,请从 JumpStart 中搜索“Stable Diffusion 2”,然后选择它。

然后,在“部署模型”部分中,单击以展开“部署配置”。

对于 SageMaker 托管实例,选择所需的实例类型。在本示例中,我们使用ml.g5.2xlarge

在“端点名称”字段中,输入demo-stabilityai-stable-diffusion-v2

单击“部署”按钮开始部署过程。

请注意,部署较大的模型可能需要一些时间。在这种情况下,可能需要长达 25 分钟。部署完成后,端点状态将更新为“正在服务”。

选择“打开笔记本”以访问包含 Python 代码的 Jupyter 笔记本。

这是通知框 2 的代码。

import boto3
import matplotlib.pyplot as plt
import numpy as np
import json

这是盒子 3。

endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
	client = boto3.client('runtime.sagemaker')
    
    encoded_text = json.dumps(text).encode("utf-8")
    response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
    
    return response
    
def parse-response(query_response):
	response_dict = json.loads(query_response['Body'].read())
    return response_dict['generated_image'], response-dict['prompt']
    
def display-image(img,prmpt):
	plt.figure(figsize=(12,12))
    plt.imshow(np.array(img))
    plt.axis('off')
    plt.title(prmpt)
    plt.show()

现在,要启动该过程,请运行前两个框。

在第三个框中,输入提示并运行该块。

现在您需要等待一分钟或半分钟才能看到结果。

如果您愿意,有很多高级选项可供使用。最好的部分是 - 它每次都会生成一张全新的图片。

使用后请记得删除您的端点。由于我们使用的是 ml.g5.2xlarge 实例,因此会产生更高的费用,在撰写本文时约为每小时 1 美元。

总结

通过利用Amazon SageMaker的功能,您可以释放图像生成 AI 的无限潜力,激发您的创造力并彻底改变您创建视觉内容的方式。无论您是寻求新表达方式的艺术家、需要引人注目的视觉效果的营销人员,还是探索虚拟原型的产品设计师,这项技术都能为您提供大量机会。

Divi WordPress Theme