Comment créer une image IA générative avec Amazon Sagemaker

Rifat Entreprise Oct 3, 2024

Le monde de l’intelligence artificielle (IA) a connu des avancées remarquables ces dernières années, et l’IA génératrice d’images est devenue l’un des domaines les plus captivants et en pleine évolution. Cette technologie de pointe nous permet de créer des images époustouflantes et réalistes à partir de simples descriptions textuelles, ouvrant ainsi un champ de possibilités créatives illimitées.

Les modèles d'IA génératrices d'images exploitent des algorithmes d'apprentissage profond et de vastes quantités de données de formation pour apprendre et comprendre les modèles et les relations complexes entre le texte et les représentations visuelles. En fournissant une invite textuelle simple, ces modèles peuvent synthétiser des images entièrement nouvelles qui correspondent remarquablement à la description donnée, capturant des détails, des styles et des compositions complexes.

Qu'est-ce qu'Amazon Sagemaker ?

Amazon SageMaker , un service de machine learning entièrement géré par AWS, simplifie le flux de travail de machine learning de bout en bout, permettant la création, la formation et le déploiement rapides et efficaces de modèles. Il fait abstraction des tâches d'infrastructure complexes, permettant aux développeurs et aux data scientists de se concentrer sur leurs objectifs principaux et d'accélérer la mise sur le marché.

SageMaker propose une large gamme d'algorithmes intégrés, de modèles pré-entraînés et de prise en charge de modèles personnalisés, garantissant flexibilité et accès aux dernières avancées, notamment les modèles d'IA génératrices d'images. Son interface conviviale, SageMaker Studio, fournit un environnement de développement intégré pour un codage, des tests et un déploiement transparents, améliorant la collaboration et rationalisant le processus de développement.

Créer des sites Web incroyables

Avec le meilleur constructeur de page Elementor

Commencer Maintenant

L'intégration transparente avec les services AWS tels qu'Amazon S3, EC2 et SageMaker Ground Truth permet aux utilisateurs d'utiliser pleinement l'écosystème AWS pour une expérience d'apprentissage automatique fluide. Des fonctionnalités avancées telles que le réglage automatique des modèles, la formation distribuée et le déploiement intégré, ainsi que des outils de surveillance et de journalisation robustes, optimisent les performances et l'évolutivité des modèles. SageMaker aide les organisations à accélérer leurs projets d'apprentissage automatique, à réduire les frais généraux opérationnels et à fournir des solutions d'IA innovantes.

Premiers pas avec Amazon Sagemaker

Le lancement d'Amazon SageMaker Studio à partir de la console est un processus simple qui vous permet d'accéder à un environnement de développement entièrement intégré pour l'apprentissage automatique. Suivez ces étapes pour commencer:

  1. Ouvrez la console Amazon SageMaker
  2. Dans le volet de navigation de gauche, recherchez et sélectionnez l’option « Studio ».
  3. Sur la page d'accueil de Studio, vous verrez une liste des domaines et des profils d'utilisateur disponibles. Sélectionnez le domaine et le profil d'utilisateur appropriés que vous souhaitez utiliser pour lancer Studio.
  4. Après avoir sélectionné le domaine et le profil utilisateur, cliquez sur le bouton « Ouvrir Studio ».
  5. Pour finaliser le lancement, choisissez «Lancer Personal Studio».

En suivant ces étapes, vous pourrez accéder rapidement à Amazon SageMaker Studio et commencer à exploiter ses puissantes fonctionnalités pour vos projets d'apprentissage automatique.

Choisissez un JumpStart

Le modèle Stable Diffusion 2 nous permet de créer des images à partir d'une simple ligne de texte, ce qui le rend idéal pour générer du contenu tel que des publications sur les réseaux sociaux, du matériel promotionnel, des pochettes d'album et d'autres œuvres d'art créatives.

Pour utiliser ce modèle, depuis JumpStart, recherchez «Stable Diffusion 2» et sélectionnez-le.

Ensuite, dans la section «Déployer le modèle», cliquez pour développer la «Configuration de déploiement».

Pour l'instance d'hébergement SageMaker, choisissez le type d'instance souhaité. Pour cet exemple, nous utilisons ml.g5.2xlarge .

Dans le champ «Nom du point de terminaison», saisissez demo-stabilityai-stable-diffusion-v2 .

Cliquez sur le bouton «Déployer» pour démarrer le processus de déploiement.

Veuillez noter que le déploiement de modèles plus volumineux peut prendre un certain temps. Dans ce cas, cela peut prendre jusqu'à 25 minutes. Une fois le déploiement terminé, le statut du point de terminaison passe à « En service ».

Sélectionnez «Ouvrir le bloc-notes» pour accéder à un bloc-notes Jupyter avec du code Python.

Voici le code de la case notifiée 2.

import boto3
import matplotlib.pyplot as plt
import numpy as np
import json

Et voici pour la boîte 3.

endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
	client = boto3.client('runtime.sagemaker')
    
    encoded_text = json.dumps(text).encode("utf-8")
    response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
    
    return response
    
def parse-response(query_response):
	response_dict = json.loads(query_response['Body'].read())
    return response_dict['generated_image'], response-dict['prompt']
    
def display-image(img,prmpt):
	plt.figure(figsize=(12,12))
    plt.imshow(np.array(img))
    plt.axis('off')
    plt.title(prmpt)
    plt.show()

Maintenant, pour lancer le processus, exécutez les deux premières cases.

Dans la troisième case, entrez l’invite et exécutez le bloc.

Il faut maintenant attendre une minute ou une demi-minute pour voir le résultat.

Si vous le souhaitez, de nombreuses options avancées sont à votre disposition. Et le meilleur dans tout ça, c'est qu'il génère une toute nouvelle image à chaque fois.

N'oubliez pas de supprimer votre point de terminaison après utilisation. Étant donné que nous utilisons l'instance ml.g5.2xlarge, des frais plus élevés sont facturés, environ 1$ par heure au moment de la rédaction.

Pour conclure

En exploitant les capacités d' Amazon SageMaker , vous pouvez exploiter le potentiel illimité de l'IA génératrice d'images, alimenter votre créativité et révolutionner votre approche de la création de contenu visuel. Que vous soyez un artiste à la recherche de nouvelles voies d'expression, un spécialiste du marketing ayant besoin de visuels convaincants ou un concepteur de produits explorant le prototypage virtuel, cette technologie offre une multitude d'opportunités.

Divi WordPress Theme