Świat sztucznej inteligencji (AI) doświadczył w ostatnich latach niezwykłych postępów, a AI generująca obrazy stała się jedną z najbardziej fascynujących i szybko rozwijających się dziedzin. Ta najnowocześniejsza technologia pozwala nam tworzyć oszałamiające, realistyczne obrazy z samych opisów tekstowych, otwierając królestwo nieograniczonych możliwości twórczych.

Modele AI generujące obrazy wykorzystują algorytmy głębokiego uczenia się i ogromne ilości danych treningowych, aby uczyć się i rozumieć skomplikowane wzorce i relacje między tekstem a reprezentacjami wizualnymi. Zapewniając prosty tekstowy monit, te modele mogą syntetyzować zupełnie nowe obrazy, które w niezwykły sposób pasują do podanego opisu, rejestrując skomplikowane szczegóły, style i kompozycje.
Czym jest Amazon Sagemaker?

Amazon SageMaker , w pełni zarządzana usługa uczenia maszynowego od AWS, upraszcza kompleksowy przepływ pracy uczenia maszynowego, umożliwiając szybkie i wydajne budowanie, szkolenie i wdrażanie modeli. Abstrahuje złożone zadania infrastrukturalne, umożliwiając deweloperom i naukowcom zajmującym się danymi skupienie się na ich głównych celach i przyspieszenie czasu wprowadzania produktów na rynek.
SageMaker oferuje szeroki zakres wbudowanych algorytmów, wstępnie wytrenowanych modeli i obsługę modeli niestandardowych, zapewniając elastyczność i dostęp do najnowszych osiągnięć, w tym modeli AI generujących obrazy. Przyjazny dla użytkownika interfejs, SageMaker Studio, zapewnia zintegrowane środowisko programistyczne do płynnego kodowania, testowania i wdrażania, usprawniając współpracę i usprawniając proces rozwoju.
Twórz niesamowite strony internetowe
Z najlepszym darmowym kreatorem stron Elementor
Zacząć terazBezproblemowa integracja z usługami AWS, takimi jak Amazon S3, EC2 i SageMaker Ground Truth, umożliwia użytkownikom pełne wykorzystanie ekosystemu AWS w celu płynnego korzystania z uczenia maszynowego. Zaawansowane funkcje, takie jak automatyczne dostrajanie modeli, rozproszone szkolenie i wbudowane wdrażanie, wraz z solidnymi narzędziami do monitorowania i rejestrowania, optymalizują wydajność i skalowalność modelu. SageMaker pomaga organizacjom przyspieszyć projekty uczenia maszynowego, zmniejszyć narzut operacyjny i dostarczać innowacyjne rozwiązania AI.
Pierwsze kroki z Amazon Sagemaker
Uruchomienie Amazon SageMaker Studio z konsoli to prosty proces, który umożliwia dostęp do w pełni zintegrowanego środowiska programistycznego do uczenia maszynowego. Aby rozpocząć, wykonaj następujące kroki:
- Otwórz konsolę Amazon SageMaker
- W lewym panelu nawigacyjnym znajdź i wybierz opcję „Studio”.
- Na stronie docelowej Studio zobaczysz listę dostępnych domen i profili użytkowników. Wybierz odpowiednią domenę i profil użytkownika, których chcesz użyć do uruchomienia Studio.
- Po wybraniu domeny i profilu użytkownika kliknij przycisk „Otwórz Studio”.
- Aby sfinalizować uruchomienie, wybierz opcję „Uruchom osobiste Studio”.
Postępując zgodnie z poniższymi krokami, będziesz mieć szybki dostęp do Amazon SageMaker Studio i będziesz mógł zacząć wykorzystywać jego zaawansowane funkcje w swoich projektach uczenia maszynowego.
Wybierz JumpStart
Model Stable Diffusion 2 umożliwia tworzenie obrazów z pojedynczej linijki tekstu, co czyni go idealnym narzędziem do generowania treści, takich jak posty w mediach społecznościowych, materiały promocyjne, okładki albumów i inne kreatywne dzieła sztuki.
Aby skorzystać z tego modelu, w programie JumpStart wyszukaj opcję „Stable Diffusion 2” i wybierz ją.

Następnie w sekcji „Wdróż model” kliknij, aby rozwinąć „Konfigurację wdrożenia”.
W przypadku instancji hostingu SageMaker wybierz żądany typ instancji. W tym przykładzie używamy ml.g5.2xlarge
.
W polu „Nazwa punktu końcowego” wpisz demo-stabilityai-stable-diffusion-v2
.
Kliknij przycisk „Wdróż”, aby rozpocząć proces wdrażania.
Należy pamiętać, że wdrażanie większych modeli może zająć trochę czasu. W tym przypadku może to potrwać do 25 minut. Po zakończeniu wdrażania status punktu końcowego zostanie zaktualizowany do „In Service”.

Wybierz „Otwórz notatnik”, aby uzyskać dostęp do notatnika Jupyter z kodem Python.

Oto kod dla pola powiadamianego jako 2.
import boto3
import matplotlib.pyplot as plt
import numpy as np
import json
A oto pudełko nr 3.
endpoint_name = 'jumpstart-dft-demo-stabilityai-stable-diffusion-v2'
def query-endpoint(text):
client = boto3.client('runtime.sagemaker')
encoded_text = json.dumps(text).encode("utf-8")
response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/x-text', Body=encoded-text, Accept='application/json')
return response
def parse-response(query_response):
response_dict = json.loads(query_response['Body'].read())
return response_dict['generated_image'], response-dict['prompt']
def display-image(img,prmpt):
plt.figure(figsize=(12,12))
plt.imshow(np.array(img))
plt.axis('off')
plt.title(prmpt)
plt.show()
Teraz, aby rozpocząć proces, uruchom pierwsze dwa pola.
W trzecim polu wpisz monit i uruchom blok.

Teraz musisz odczekać minutę lub pół, aby zobaczyć wynik.

Jeśli chcesz, jest wiele zaawansowanych opcji do zabawy. A najlepsze jest to, że za każdym razem generuje zupełnie nowy obraz.
Pamiętaj, aby usunąć swój punkt końcowy po użyciu. Ponieważ używamy instancji ml.g5.2xlarge, naliczane są wyższe opłaty, około 1 USD za godzinę w momencie pisania.
Podsumowanie
Wykorzystując możliwości Amazon SageMaker , możesz odblokować nieograniczony potencjał AI generującej obrazy, podsycając swoją kreatywność i rewolucjonizując sposób, w jaki podchodzisz do tworzenia treści wizualnych. Niezależnie od tego, czy jesteś artystą poszukującym nowych dróg ekspresji, marketerem potrzebującym przekonujących wizualizacji, czy projektantem produktu badającym wirtualne prototypowanie, ta technologia oferuje bogactwo możliwości.