Hoe u een generatieve AI-afbeelding kunt maken met Amazon Sagemaker

Rifat Bedrijf Oct 3, 2024

De wereld van kunstmatige intelligentie (AI) heeft de afgelopen jaren opmerkelijke vooruitgang geboekt en beeldgenererende AI is uitgegroeid tot een van de meest boeiende en snelst evoluerende gebieden. Deze geavanceerde technologie stelt ons in staat om verbluffende, realistische afbeeldingen te maken van louter tekstbeschrijvingen, wat een rijk van onbegrensde creatieve mogelijkheden opent.

Image-generative AI-modellen maken gebruik van deep learning-algoritmen en enorme hoeveelheden trainingsdata om de ingewikkelde patronen en relaties tussen tekst en visuele representaties te leren en begrijpen. Door een eenvoudige tekstuele prompt te bieden, kunnen deze modellen geheel nieuwe afbeeldingen synthetiseren die opmerkelijk goed aansluiten bij de gegeven beschrijving, waarbij ingewikkelde details, stijlen en composities worden vastgelegd.

Wat is Amazon Sagemaker?

Amazon SageMaker , een volledig beheerde machine learning-service van AWS, vereenvoudigt de end-to-end machine learning-workflow, waardoor snelle en efficiënte modelbouw, training en implementatie mogelijk zijn. Het abstraheert complexe infrastructuurtaken, waardoor ontwikkelaars en datawetenschappers zich kunnen richten op hun kerndoelen en de time-to-market kunnen versnellen.

SageMaker biedt een breed scala aan ingebouwde algoritmen, vooraf getrainde modellen en ondersteuning voor aangepaste modellen, wat flexibiliteit en toegang tot de nieuwste ontwikkelingen garandeert, waaronder beeldgeneratieve AI-modellen. De gebruiksvriendelijke interface, SageMaker Studio, biedt een geïntegreerde ontwikkelomgeving voor naadloze codering, testen en implementatie, wat de samenwerking verbetert en het ontwikkelingsproces stroomlijnt.

Maak geweldige websites

Met de beste gratis paginabuilder Elementor

Begin nu

Naadloze integratie met AWS-services zoals Amazon S3, EC2 en SageMaker Ground Truth stelt gebruikers in staat om het AWS-ecosysteem volledig te benutten voor een soepele machine-learningervaring. Geavanceerde functies zoals automatische modelafstemming, gedistribueerde training en ingebouwde implementatie, samen met robuuste monitoring- en loggingtools, optimaliseren de modelprestaties en schaalbaarheid. SageMaker helpt organisaties hun machine learning-projecten te versnellen, operationele overhead te verminderen en innovatieve AI-oplossingen te leveren.

Aan de slag met Amazon Sagemaker

Amazon SageMaker Studio starten vanaf de console is een eenvoudig proces waarmee u toegang krijgt tot een volledig geïntegreerde ontwikkelomgeving voor machine learning. Volg deze stappen om te beginnen:

  1. Open de Amazon SageMaker-console
  2. Zoek en selecteer de optie 'Studio' in het navigatievenster aan de linkerkant.
  3. Op de Studio-landingspagina ziet u een lijst met beschikbare domeinen en gebruikersprofielen. Selecteer het juiste domein en gebruikersprofiel dat u wilt gebruiken om Studio te starten.
  4. Nadat u het domein en het gebruikersprofiel hebt geselecteerd, klikt u op de knop "Open Studio".
  5. Om de lancering te voltooien, kiest u 'Persoonlijke Studio starten'.

Als u deze stappen volgt, krijgt u snel toegang tot Amazon SageMaker Studio en kunt u de krachtige functies ervan voor uw machine learning-projecten gebruiken.

Kies een JumpStart

Met het Stable Diffusion 2-model kunnen we afbeeldingen maken van een eenvoudige tekstregel. Dit maakt het model ideaal voor het genereren van content zoals berichten op sociale media, promotiemateriaal, albumhoezen en ander creatief artwork.

Om dit model te gebruiken, zoekt u in de JumpStart naar 'Stable Diffusion 2' en selecteert u dit.

Klik vervolgens in het gedeelte 'Model implementeren' om 'Implementatieconfiguratie' uit te vouwen.

Voor de SageMaker hosting instance kiest u het gewenste instance type. Voor dit voorbeeld gebruiken we ml.g5.2xlarge .

Typ demo-stabilityai-stable-diffusion-v2 in het veld 'Eindpuntnaam'.

Klik op de knop 'Implementeren' om het implementatieproces te starten.

Houd er rekening mee dat het implementeren van grotere modellen enige tijd kan duren. In dit geval kan het tot 25 minuten duren. Zodra de implementatie is voltooid, wordt de eindpuntstatus bijgewerkt naar 'In Service'.

Selecteer 'Open Notebook' om toegang te krijgen tot een Jupyter-notebook met Python-code.

Hier is de code voor het vakje met nummer 2.

import boto3
import matplotlib.pyplot as plt
import numpy as np
import json

En dit is voor vakje 3.

endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
	client = boto3.client('runtime.sagemaker')
    
    encoded_text = json.dumps(text).encode("utf-8")
    response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
    
    return response
    
def parse-response(query_response):
	response_dict = json.loads(query_response['Body'].read())
    return response_dict['generated_image'], response-dict['prompt']
    
def display-image(img,prmpt):
	plt.figure(figsize=(12,12))
    plt.imshow(np.array(img))
    plt.axis('off')
    plt.title(prmpt)
    plt.show()

Om het proces te starten, start u de eerste twee boxen.

Voer in het derde vak de prompt in en voer het blok uit.

Nu moet u een minuut of anderhalve minuut wachten voordat u het resultaat ziet.

Als je wilt, zijn er veel geavanceerde opties om mee te spelen. En het beste is: het genereert elke keer een gloednieuwe foto.

Vergeet niet om uw endpoint na gebruik te verwijderen. Omdat we de ml.g5.2xlarge instance gebruiken, brengt dit hogere kosten met zich mee, ongeveer $ 1 per uur op het moment van schrijven.

Afronden

Door de mogelijkheden van Amazon SageMaker te benutten, kunt u het grenzeloze potentieel van beeldgenererende AI ontsluiten, uw creativiteit aanwakkeren en de manier waarop u visuele contentcreatie benadert, revolutioneren. Of u nu een kunstenaar bent die op zoek is naar nieuwe wegen voor expressie, een marketeer die behoefte heeft aan overtuigende beelden of een productontwerper die virtuele prototyping onderzoekt, deze technologie biedt een schat aan mogelijkheden.

Divi WordPress Theme