Die Welt der künstlichen Intelligenz (KI) hat in den letzten Jahren bemerkenswerte Fortschritte erlebt, und die bildgenerierende KI hat sich zu einem der faszinierendsten und sich am schnellsten entwickelnden Bereiche entwickelt. Diese Spitzentechnologie ermöglicht es uns, aus bloßen Textbeschreibungen atemberaubende, realistische Bilder zu erstellen, was einen Bereich unbegrenzter kreativer Möglichkeiten eröffnet.

Bildgenerierende KI-Modelle nutzen Deep-Learning-Algorithmen und riesige Mengen an Trainingsdaten, um die komplexen Muster und Beziehungen zwischen Text und visuellen Darstellungen zu erlernen und zu verstehen. Durch die Bereitstellung einer einfachen Texteingabe können diese Modelle völlig neue Bilder synthetisieren, die bemerkenswert gut mit der gegebenen Beschreibung übereinstimmen und komplexe Details, Stile und Kompositionen erfassen.
Was ist Amazon Sagemaker?

Amazon SageMaker , ein vollständig verwalteter Machine-Learning-Service von AWS, vereinfacht den End-to-End-Workflow des Machine Learning und ermöglicht eine schnelle und effiziente Modellerstellung, Schulung und Bereitstellung. Es abstrahiert komplexe Infrastrukturaufgaben, sodass sich Entwickler und Datenwissenschaftler auf ihre Kernziele konzentrieren und die Markteinführungszeit verkürzen können.
SageMaker bietet eine breite Palette integrierter Algorithmen, vorab trainierter Modelle und Unterstützung für benutzerdefinierte Modelle. Dies gewährleistet Flexibilität und Zugriff auf die neuesten Entwicklungen, einschließlich bildgenerierender KI-Modelle. Die benutzerfreundliche Oberfläche, SageMaker Studio, bietet eine integrierte Entwicklungsumgebung für nahtloses Codieren, Testen und Bereitstellen, verbessert die Zusammenarbeit und optimiert den Entwicklungsprozess.
Erstellen Sie erstaunliche Websites
Mit dem besten kostenlosen Seite Builder Elementor
Jetzt anfangenDurch die nahtlose Integration mit AWS-Diensten wie Amazon S3, EC2 und SageMaker Ground Truth können Benutzer das AWS-Ökosystem für ein reibungsloses maschinelles Lernerlebnis voll ausnutzen. Erweiterte Funktionen wie automatische Modelloptimierung, verteiltes Training und integrierte Bereitstellung sowie robuste Überwachungs- und Protokollierungstools optimieren die Modellleistung und Skalierbarkeit. SageMaker hilft Unternehmen, ihre maschinellen Lernprojekte zu beschleunigen, den Betriebsaufwand zu reduzieren und innovative KI-Lösungen bereitzustellen.
Erste Schritte mit Amazon Sagemaker
Das Starten von Amazon SageMaker Studio über die Konsole ist ein unkomplizierter Vorgang, der Ihnen Zugriff auf eine vollständig integrierte Entwicklungsumgebung für maschinelles Lernen ermöglicht. Befolgen Sie diese Schritte, um loszulegen:
- Öffnen Sie die Amazon SageMaker-Konsole
- Suchen und wählen Sie im linken Navigationsbereich die Option „Studio“ aus.
- Auf der Startseite von Studio wird eine Liste der verfügbaren Domänen und Benutzerprofile angezeigt. Wählen Sie die entsprechende Domäne und das Benutzerprofil aus, mit dem Sie Studio starten möchten.
- Nachdem Sie die Domäne und das Benutzerprofil ausgewählt haben, klicken Sie auf die Schaltfläche „Studio öffnen“.
- Um den Start abzuschließen, wählen Sie „Persönliches Studio starten“.
Wenn Sie diese Schritte befolgen, können Sie schnell auf Amazon SageMaker Studio zugreifen und dessen leistungsstarke Funktionen für Ihre Machine-Learning-Projekte nutzen.
Wählen Sie einen JumpStart
Mit dem Modell Stable Diffusion 2 können wir Bilder aus einer einfachen Textzeile erstellen und es eignet sich daher ideal für die Generierung von Inhalten wie Social-Media-Posts, Werbematerialien, Albumcovern und anderen kreativen Kunstwerken.
Um dieses Modell zu verwenden, suchen Sie im JumpStart nach „Stable Diffusion 2“ und wählen Sie es aus.

Klicken Sie dann im Abschnitt „Bereitstellungsmodell“ auf „Bereitstellungskonfiguration“, um es zu erweitern.
Wählen Sie für die SageMaker-Hostinstanz den gewünschten Instanztyp. Für dieses Beispiel verwenden wir ml.g5.2xlarge
.
Geben Sie im Feld „Endpunktname“ demo-stabilityai-stable-diffusion-v2
ein.
Klicken Sie auf die Schaltfläche „Bereitstellen“, um den Bereitstellungsprozess zu starten.
Bitte beachten Sie, dass die Bereitstellung größerer Modelle einige Zeit in Anspruch nehmen kann. In diesem Fall kann es bis zu 25 Minuten dauern. Sobald die Bereitstellung abgeschlossen ist, wird der Endpunktstatus auf „In Betrieb“ aktualisiert.

Wählen Sie „Notebook öffnen“, um auf ein Jupyter-Notebook mit Python-Code zuzugreifen.

Hier ist der Code für das als 2 angegebene Feld.
import boto3
import matplotlib.pyplot as plt
import numpy as np
import json
Und hier ist Feld 3.
endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
client = boto3.client('runtime.sagemaker')
encoded_text = json.dumps(text).encode("utf-8")
response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
return response
def parse-response(query_response):
response_dict = json.loads(query_response['Body'].read())
return response_dict['generated_image'], response-dict['prompt']
def display-image(img,prmpt):
plt.figure(figsize=(12,12))
plt.imshow(np.array(img))
plt.axis('off')
plt.title(prmpt)
plt.show()
Um den Vorgang zu starten, führen Sie nun die ersten beiden Felder aus.
Geben Sie im dritten Feld die Eingabeaufforderung ein und führen Sie den Block aus.

Jetzt müssen Sie ein bis eineinhalb Minuten warten, um das Ergebnis zu sehen.

Wenn Sie möchten, stehen Ihnen viele erweiterte Optionen zum Ausprobieren zur Verfügung. Und das Beste daran ist: Jedes Mal wird ein brandneues Bild generiert.
Denken Sie daran, Ihren Endpunkt nach der Verwendung zu löschen. Da wir die Instanz ml.g5.2xlarge verwenden, fallen höhere Gebühren an, zum Zeitpunkt des Schreibens etwa 1 USD pro Stunde.
Einpacken
Indem Sie die Funktionen von Amazon SageMaker nutzen, können Sie das grenzenlose Potenzial der bildgenerierenden KI freisetzen, Ihre Kreativität beflügeln und Ihre Herangehensweise an die Erstellung visueller Inhalte revolutionieren. Egal, ob Sie ein Künstler sind, der nach neuen Ausdrucksmöglichkeiten sucht, ein Vermarkter, der überzeugende visuelle Elemente benötigt, oder ein Produktdesigner, der virtuelles Prototyping ausprobiert – diese Technologie bietet eine Fülle von Möglichkeiten.