Come creare un'immagine AI generativa con Amazon Sagemaker

Rifat Attività commerciale Oct 3, 2024

Il mondo dell'intelligenza artificiale (IA) ha assistito a notevoli progressi negli ultimi anni e l'IA generativa di immagini è emersa come uno dei campi più accattivanti e in rapida evoluzione. Questa tecnologia all'avanguardia ci consente di creare immagini sorprendenti e realistiche da semplici descrizioni di testo, aprendo un regno di possibilità creative illimitate.

I modelli di intelligenza artificiale generativa di immagini sfruttano algoritmi di apprendimento profondo e grandi quantità di dati di addestramento per apprendere e comprendere gli intricati modelli e relazioni tra testo e rappresentazioni visive. Fornendo un semplice prompt testuale, questi modelli possono sintetizzare immagini completamente nuove che si allineano in modo straordinario con la descrizione fornita, catturando dettagli, stili e composizioni intricati.

Che cos'è Amazon Sagemaker?

Amazon SageMaker , un servizio di apprendimento automatico completamente gestito da AWS, semplifica il flusso di lavoro di apprendimento automatico end-to-end, consentendo la creazione, la formazione e l'implementazione di modelli rapidi ed efficienti. Astrae attività infrastrutturali complesse, consentendo a sviluppatori e data scientist di concentrarsi sui loro obiettivi principali e accelerare il time-to-market.

SageMaker offre un'ampia gamma di algoritmi integrati, modelli pre-addestrati e supporto per modelli personalizzati, garantendo flessibilità e accesso agli ultimi progressi, inclusi modelli AI generativi di immagini. La sua interfaccia intuitiva, SageMaker Studio, fornisce un ambiente di sviluppo integrato per codifica, test e distribuzione senza soluzione di continuità, migliorando la collaborazione e semplificando il processo di sviluppo.

Create Amazing Websites

Con il miglior generatore di pagine gratuito Elementor

Parti ora

L'integrazione senza soluzione di continuità con servizi AWS come Amazon S3, EC2 e SageMaker Ground Truth consente agli utenti di utilizzare l'ecosistema AWS per un'esperienza di apprendimento automatico fluida e completa. Funzionalità avanzate come la messa a punto automatica dei modelli, la formazione distribuita e la distribuzione integrata, insieme a solidi strumenti di monitoraggio e registrazione, ottimizzano le prestazioni e la scalabilità dei modelli. SageMaker aiuta le organizzazioni ad accelerare i loro progetti di apprendimento automatico, ridurre le spese generali operative e fornire soluzioni AI innovative.

Introduzione ad Amazon Sagemaker

Avviare Amazon SageMaker Studio dalla console è un processo semplice che ti consente di accedere a un ambiente di sviluppo completamente integrato per l'apprendimento automatico. Segui questi passaggi per iniziare:

  1. Aprire la console Amazon SageMaker
  2. Nel riquadro di navigazione a sinistra, individua e seleziona l'opzione "Studio".
  3. Nella landing page di Studio, vedrai un elenco di domini e profili utente disponibili. Seleziona il dominio e il profilo utente appropriati che vuoi usare per avviare Studio.
  4. Dopo aver selezionato il dominio e il profilo utente, fare clic sul pulsante "Apri Studio".
  5. Per finalizzare l'avvio, seleziona "Avvia Studio personale".

Seguendo questi passaggi, potrai accedere rapidamente ad Amazon SageMaker Studio e iniziare a sfruttare le sue potenti funzionalità per i tuoi progetti di apprendimento automatico.

Scegli un JumpStart

Il modello Stable Diffusion 2 consente di creare immagini da una semplice riga di testo, rendendolo ideale per generare contenuti quali post sui social media, materiale promozionale, copertine di album e altre opere d'arte creative.

Per utilizzare questo modello, da JumpStart, cerca "Stable Diffusion 2" e selezionalo.

Quindi, nella sezione "Modello di distribuzione", fare clic per espandere "Configurazione di distribuzione".

Per l'istanza di hosting di SageMaker, scegli il tipo di istanza desiderato. Per questo esempio, stiamo usando ml.g5.2xlarge .

Nel campo "Nome endpoint", digitare demo-stabilityai-stable-diffusion-v2 .

Fare clic sul pulsante "Distribuisci" per avviare il processo di distribuzione.

Si prega di notare che la distribuzione di modelli più grandi può richiedere del tempo. In questo caso, potrebbero volerci fino a 25 minuti. Una volta completata la distribuzione, lo stato dell'endpoint verrà aggiornato a "In servizio".

Selezionare "Apri notebook" per accedere a un notebook Jupyter con codice Python.

Ecco il codice per la casella notificata come 2.

import boto3
import matplotlib.pyplot as plt
import numpy as np
import json

Ed ecco il riquadro 3.

endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
	client = boto3.client('runtime.sagemaker')
    
    encoded_text = json.dumps(text).encode("utf-8")
    response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
    
    return response
    
def parse-response(query_response):
	response_dict = json.loads(query_response['Body'].read())
    return response_dict['generated_image'], response-dict['prompt']
    
def display-image(img,prmpt):
	plt.figure(figsize=(12,12))
    plt.imshow(np.array(img))
    plt.axis('off')
    plt.title(prmpt)
    plt.show()

Ora, per avviare il processo, esegui le prime due caselle.

Nella terza casella, inserisci il prompt ed esegui il blocco.

Ora bisogna aspettare un minuto o mezzo per vedere il risultato.

Se vuoi, ci sono un sacco di opzioni avanzate con cui giocare. E la parte migliore è che genera un'immagine completamente nuova ogni volta.

Ricordati di eliminare il tuo endpoint dopo l'uso. Poiché stiamo usando l'istanza ml.g5.2xlarge, comporta costi più elevati, circa $ 1 all'ora al momento in cui scrivo.

Conclusione

Sfruttando le capacità di Amazon SageMaker , puoi sbloccare il potenziale sconfinato dell'intelligenza artificiale generativa di immagini, alimentando la tua creatività e rivoluzionando il modo in cui affronti la creazione di contenuti visivi. Che tu sia un artista alla ricerca di nuove vie di espressione, un addetto al marketing alla ricerca di immagini accattivanti o un product designer che esplora la prototipazione virtuale, questa tecnologia offre una vasta gamma di opportunità.

Divi WordPress Theme