Rozwiązanie Stable Diffusion szturmem podbiło świat sztucznej inteligencji generatywnej, umożliwiając użytkownikom generowanie niezwykle szczegółowych i realistycznych obrazów na podstawie prostych komunikatów tekstowych.

Chociaż w sieci dostępne są narzędzia takie jak DreamStudio i Hugging Face, które zapewniają dostęp do Stable Diffusion, uruchomienie ich lokalnie na własnym serwerze oferuje szereg zalet.
Hostując rozwiązanie Stable Diffusion na swoim serwerze, zyskujesz większą kontrolę nad parametrami i dostosowaniami modelu, co pozwala Ci mieć pewność, że generowane obrazy będą lepiej odpowiadać Twoim konkretnym wymaganiom.
Ponadto, uruchamianie modelu lokalnie eliminuje potrzebę polegania na usługach stron trzecich, zapewniając zwiększoną prywatność i suwerenność danych. W tym artykule przeprowadzimy Cię przez proces konfigurowania i uruchamiania Stable Diffusion na Twoim serwerze, umożliwiając Ci odblokowanie pełnego potencjału tego potężnego generatywnego narzędzia AI.
Twórz niesamowite strony internetowe
Z najlepszym darmowym kreatorem stron Elementor
Zacząć terazProces pracy stabilnego modelu dyfuzji
Stable Diffusion należy do klasy modeli głębokiego uczenia się znanych jako modele dyfuzyjne. Są to modele generatywne, co oznacza, że są trenowane w celu generowania nowych danych podobnych do tych, których nauczyły się z danych treningowych.

Model ten nazywa się „dyfuzją” ze względu na jego matematyczne podobieństwo do fizycznego procesu dyfuzji. Działa on poprzez rozpoczęcie od czystego szumu (losowych pikseli) i stopniową korektę tego szumu w kierunku obrazu docelowego w wielu krokach, kierując się podanym tekstem zachęty.
Kluczową innowacją Stable Diffusion jest to, że jest to model dyfuzji utajonej. Zamiast pracować bezpośrednio na przestrzeni pikseli, działa w skompresowanej przestrzeni utajonej, nauczonej przez poprzedni model kodera obrazu do utajonego. Ta skompresowana reprezentacja umożliwia efektywne uczenie się i generowanie.
Ogólnie rzecz biorąc, proces ten wygląda następująco:
- Monit tekstowy jest kodowany w osadzonym tekście za pomocą modelu kodowania takiego jak CLIP.
- Losowy szum jest próbkowany w przestrzeni utajonej.
- Szum jest stopniowo korygowany w kierunku rozkładu obrazu docelowego, w zależności od osadzenia tekstu, poprzez wielokrotne kroki dyfuzji.
- Na koniec odszumiony sygnał ukryty przepuszczany jest przez dekoder w celu wygenerowania obrazu wyjściowego.
Ten iteracyjny proces usuwania szumów pozwala modelowi generować spójne obrazy ściśle dopasowane do opisu tekstu wejściowego. Trening wykorzystuje zaawansowane techniki, takie jak wskazówki bez klasyfikatora, aby poprawić jakość dopasowania obrazu do tekstu.
Uruchamianie stabilnej wersji Diffusion na serwerze lokalnym
Używanie Stable Diffusion na komputerze pozwala wypróbować różne dane wejściowe i tworzyć obrazy, które lepiej odpowiadają Twoim potrzebom. Ponadto możesz dostosować model, używając własnych danych, aby ulepszyć wyniki na podstawie danych wejściowych.
Uwaga: Do stabilnego uruchomienia dyfuzji na komputerze PC wymagany jest procesor graficzny.
Instalacja Pythona i Gita
Aby uruchomić Stable Diffusion, musisz mieć Pythona 3.10.6 na swoim komputerze. Możesz go zainstalować z oficjalnej strony Pythona .
Aby potwierdzić, że instalacja się powiodła, otwórz wiersz poleceń, wpisz „ python
” i naciśnij enter. Powinno to wyświetlić wersję Pythona, którą zainstalowałeś.

Pamiętaj, że to jedyna wersja, którą powinieneś wybrać.
Następnie zainstaluj system zarządzania repozytorium kodu - Git .
GitHub i konto Hugging Face
GitHub to miejsce, w którym programiści przechowują swój kod i wspólnie pracują nad projektami oprogramowania. Używają go do śledzenia zmian i współpracy z innymi.
Z drugiej strony Hugging Face to społeczność skupiona na AI, która zachęca ludzi do wnoszenia wkładu w projekty open-source. To coś w rodzaju centralnego węzła dla różnych modeli, takich jak te do przetwarzania języka naturalnego i widzenia komputerowego. Aby pobrać najnowszą wersję Stable Diffusion, musisz założyć konto, ale omówimy to później.
Stabilne klonowanie interfejsu użytkownika w sieci Web
Ten krok jest kluczowy, ale może być nieco skomplikowany. Wszystko, co musimy zrobić, to pobrać podstawową konfigurację stabilnej instalacji dyfuzji na nasz komputer. Pomocne jest utworzenie folderu (takiego jak „stable-diffusion-demo-project”), do którego można pobrać repozytorium, ale nie jest to obowiązkowe.
Aby wykonać ten krok, będziesz potrzebować Git bash. Po prostu przejdź do folderu, w którym chcesz sklonować stabilny diffusion web UI, używając następującego polecenia:
cd path/to/folder
Następnie należy uruchomić polecenie podane poniżej -
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
Jeśli wszystko poszło dobrze, zobaczysz folder o nazwie stable-diffusion-webui.

Pobieranie stabilnego modelu dyfuzji
Najpierw zaloguj się na swoje konto Hugging Face. Następnie pobierz model Stable Diffusion. Może to potrwać kilka minut, ponieważ jest to duży plik.
Po pobraniu przejdź do folderu „models” w folderze interfejsu internetowego stable diffusion. Wewnątrz znajdziesz folder o nazwie „stable-diffusion” z plikiem tekstowym o nazwie „Put Stable Diffusion Checkpoints here”.
Teraz wystarczy przenieść pobrany model Stable Diffusion do tego folderu.
stable-diffusion-webui\models\Stable-diffusion
Konfiguracja interfejsu użytkownika sieci Web
Następnie musisz skonfigurować narzędzia potrzebne do stabilnej dyfuzji. Może to potrwać około 10 minut.
cd path/to/stable-diffusion-webui
Otwórz wiersz poleceń i przejdź do folderu stable-diffusion-webui, wpisując odpowiednie polecenie.
webui-user.bat
Gdy już tam będziesz, uruchom kolejne polecenie, aby utworzyć środowisko wirtualne i zainstalować wszystko, co będzie potrzebne do przeprowadzenia procesu.
Rozpocznij korzystanie ze stabilnej dyfuzji
Po zainstalowaniu wszystkich niezbędnych rzeczy zobaczysz adres internetowy, taki jak „http://127.0.0.1:7860” w oknie poleceń. Wystarczy go skopiować i wkleić do paska adresu przeglądarki internetowej, aby rozpocząć korzystanie z interfejsu internetowego Stable Diffusion.

Podsumowanie
Uruchamianie stabilnej wersji Diffusion na własnym serwerze uwalnia jej prawdziwy potencjał, zapewniając pełną kontrolę nad dostosowywaniem i dostrajaniem.
Dzięki lokalnej instalacji możesz dostosować model do swoich unikalnych potrzeb, eksperymentować z różnymi podpowiedziami i technikami oraz poszerzać granice generatywnej sztucznej inteligencji.
W miarę jak ta technologia szybko ewoluuje, posiadanie Stable Diffusion lokalnie stawia Cię na czele, dając Ci możliwość tworzenia, innowacji i kształtowania przyszłości generacji wizualnej. Przyjmij możliwości odpowiedzialnie i pozwól swojej wyobraźni wzbić się w tym fascynującym królestwie.