サーバー上で安定した拡散を実行する方法

Rifat WordPressチュートリアル Aug 22, 2024

Stable Diffusion は生成 AI の世界に旋風を巻き起こし、ユーザーが単純なテキスト プロンプトから非常に詳細でリアルな画像を生成できるようにしました。

DreamStudio や Hugging Face などのオンライン ツールでは Stable Diffusion にアクセスできますが、独自のサーバー上でローカルに実行すると、いくつかの利点があります。

サーバー上で Stable Diffusion をホストすることで、モデルのパラメータとカスタマイズをより細かく制御できるようになり、生成された画像が特定の要件にさらに適合することが保証されます。

さらに、モデルをローカルで実行することで、サードパーティのサービスに依存する必要がなくなり、プライバシーとデータ主権が向上します。この記事では、サーバー上で Stable Diffusion を設定して実行するプロセスをガイドし、この強力な生成 AI ツールの可能性を最大限に引き出す方法を説明します。

素晴らしいウェブサイトを作成します

最高の無料ページビルダーElementor を使用

今すぐ始める

安定拡散モデルの作業プロセス

安定拡散は、拡散モデルと呼ばれるディープラーニング モデルのクラスに属します。これらは生成モデルであり、トレーニング データから学習したものと同様の新しいデータを生成するようにトレーニングされます。

このモデルは、拡散の物理的プロセスと数学的に類似しているため、「拡散」と呼ばれています。純粋なノイズ (ランダム ピクセル) から開始し、提供されたテキスト プロンプトに従って、多くのステップを踏んで徐々にそのノイズをターゲット イメージに向けて修正します。

Stable Diffusion の重要な革新点は、潜在拡散モデルであることです。ピクセル空間で直接動作するのではなく、以前の画像から潜在へのエンコーダー モデルによって学習された圧縮された潜在空間で動作します。この圧縮された表現により、効率的な学習と生成が可能になります。

大まかに言えば、プロセスは次のように機能します。

  1. テキスト プロンプトは、CLIP などのエンコード モデルを使用してテキスト埋め込みにエンコードされます。
  2. ランダムノイズが潜在空間でサンプリングされます。
  3. ノイズは、複数の拡散ステップを通じて、テキストの埋め込みを条件としたターゲット画像分布に向かって徐々に修正されます。
  4. 最後に、ノイズ除去された潜在変数はデコーダーに渡され、出力画像が生成されます。

この反復的なノイズ除去プロセスにより、モデルは入力テキストの説明に厳密に一致する一貫性のある画像を生成できます。トレーニングでは、分類器を使用しないガイダンスなどの高度な手法を利用して、画像とテキストの位置合わせの品質を向上させます。

ローカルサーバー上で安定した拡散を実行する

コンピューターで Stable Diffusion を使用すると、さまざまなテキスト入力を試して、ニーズに合った画像を作成できます。さらに、独自のデータを使用してモデルを調整し、入力に基づいて結果を強化できます。

注意: PC 上で安定した拡散を実行するには GPU が必要です。

Python と Git のインストール

Stable Diffusion を実行するには、コンピューターに Python 3.10.6 がインストールされている必要があります。公式Python Web サイトからインストールできます。

インストールが成功したことを確認するには、コマンド プロンプトを開き、「 python 」と入力して Enter キーを押します。これにより、インストールした Python のバージョンが表示されます。

これは、進めるべき唯一のバージョンであることを忘れないでください。

次に、コード リポジトリ管理システムであるGitをインストールします。

GitHub と Hugging Face アカウント

GitHub は、開発者がコードを保存し、ソフトウェア プロジェクトで共同作業を行う場所です。開発者は、GitHub を使用して変更を追跡し、他のユーザーと共同作業を行います。

一方、 Hugging Face はAI に重点を置いたコミュニティであり、オープンソース プロジェクトへの貢献を奨励しています。これは、自然言語処理やコンピューター ビジョンなどのさまざまなモデルの中心ハブのようなものです。Stable Diffusion の最新バージョンをダウンロードするには、アカウントを作成する必要がありますが、これについては後で説明します。

安定した拡散 Web-UI クローニング

この手順は重要ですが、少し複雑になることがあります。必要なのは、安定した拡散インストールの基本セットアップをコンピューターにダウンロードすることだけです。リポジトリをダウンロードするためのフォルダー (「stable-diffusion-demo-project」など) を作成すると便利ですが、必須ではありません。

この手順を完了するには、Git bash が必要です。次のコマンドを使用して、安定した拡散 Web UI を複製するフォルダーに移動するだけです。

cd path/to/folder 

次に、以下のコマンドを実行します。

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

すべてがうまくいけば、stable-diffusion-webui という名前のフォルダーが表示されます。

安定拡散モデルのダウンロード

まず、Hugging Face アカウントにログインします。次に、Stable Diffusion モデルをダウンロードして入手します。ファイルが大きいため、数分かかる場合があります。

ダウンロードが完了したら、安定拡散 Web インターフェース フォルダー内の「models」フォルダーに移動します。その中に、「stable-diffusion」という名前のフォルダーがあり、「Put Stable Diffusion Checkpoints here」というテキスト ファイルがあります。

次に、ダウンロードした安定拡散モデルをこのフォルダーに移動します。

stable-diffusion-webui\models\Stable-diffusion

Web UI のセットアップ

次に、安定した拡散に必要なツールをセットアップする必要があります。これには約 10 分かかります。

cd path/to/stable-diffusion-webui

コマンド プロンプトを開き、特定のコマンドを入力して stable-diffusion-webui フォルダーに移動します。

webui-user.bat

そこに到達したら、別のコマンドを実行して仮想環境を作成し、プロセスに必要なものをすべてインストールします。

安定拡散の使用を開始する

必要なものをすべてインストールすると、コマンド ウィンドウに「http://127.0.0.1:7860」のような Web アドレスが表示されます。これをコピーして Web ブラウザーのアドレス バーに貼り付けるだけで、Stable Diffusion Web インターフェイスの使用を開始できます。

まとめ

Stable Diffusion を独自のサーバーで実行すると、その真の可能性が解き放たれ、カスタマイズと微調整を完全に制御できるようになります。

ローカル インストールを使用すると、独自のニーズに合わせてモデルをカスタマイズし、さまざまなプロンプトやテクニックを試して、生成 AI の限界を押し広げることができます。

このテクノロジーが急速に進化する中、Stable Diffusion をローカルで利用することで、最前線に立つことができ、ビジュアル生成の未来を創造、革新、形作る力を得ることができます。責任を持って可能性を受け入れ、この魅力的な領域で想像力を羽ばたかせてください。

Divi WordPress Theme