PCでAIアートを作成する最も簡単な方法は何でしょうか?Fooocusというアプリケーションです。Stable DiffusionはPCでAIアートを作成するのに最適な方法とよく言われますが、Fooocusはシンプルなセットアップで、より深く探求したい人にも満足のいく奥深さを提供します。
Stable Diffusionは2年前に登場し、PCでAIアートを作成する手段として活躍しました。David Wolski氏がStable Diffusionの使い方に関するチュートリアルで紹介しているテクニックをいくつか使ってみましたが、セットアップがとにかく複雑に感じました。Fooocus(そう、3つの「o」です)は、wingetのようなツールと同じく、基本的にワンクリックでセットアップできます。何をするか指示すれば、Fooocusがそれを実行します。Windowsで動作する完全無料のアプリで、追加費用は一切かかりません。ただし、実行するにはかなり高性能なPCが必要です。
念のためお知らせします。AIアートを実行する方法は数多くあり、確かに確立されている方法の多くは非常に優れています。Google BardとMicrosoft Copilot(旧称Bing Image Creator)はどちらも、クラウド上で実行しながらAIアートを自動生成します。また、どちらもダウンロードして使用できる詳細な作品を提供しています。
しかし、適切なハードウェアを使用すれば、ローカライズされたAIアートの実行速度はほぼ同等で、画像の品質も同等かそれ以上と言えるでしょう。さらに、被写体の選択もより自由になり、サイズを変更したり、編集したり、他の画像をソースアートとして使用したりすることも可能です。そしてもちろん、すべて無料です。Fooocusは、プレミアムAIアートのパイオニアとして長年認められているMidjourneyからヒントを得ています。ユーザーの指示をそのままAIアートに変換するのではなく、ユーザーが好むものを裏で推測し、それに応じてリクエストを最適化します。
ゲーマーの方、あるいは高性能なPCをお持ちの方は、Fooocusを試してみる価値があります。特別なハードウェア要件はありませんが、SSDに数十GBの空き容量があること、そしてディスクリートGPU(NVIDIA推奨ですが必須ではありません)がほぼ必須です。
Fooocusのダウンロードと設定方法
Fooocusはオープンソースであり、そのコードはGitHubで公開されています。GitHubではコードが精査・検証されています。このFooocusのダウンロードリンクは、開発者Illyasviel氏のFooocus GitHubページへのリンクです。実際のダウンロードリンクはIllyasviel氏のページを下にスクロールすると見つかります。ダウンロードリンクは1.8GBの.7zファイルです。(ダウンロードフォルダからFooocusを実行したくない場合は、PC上の別の場所に移動してください。)

マーク・ハッハマン / IDG
通常、.7zファイル形式は7Zipで解凍する必要がありますが、PC側で「Run.bat」バッチファイルをクリックすれば解凍できます。この方法では約5.5GBのデータが抽出されます。解凍には時間がかかりそうに見えますが、私のシステムでは約10分で完了しました。
Fooocus は少し変わっていて、「run」バッチファイルをクリックすると、汎用モデルに重点を置いた設定がすべて完了します。しかし、後から戻って「run_anime」バッチファイルをクリックすると、アニメ向けに最適化された別の設定が実行されます。「run_realistic」でも同様です。

マーク・ハッハマン / IDG
ただし、ダウンロードするとWindows Smartscreenの警告が表示される可能性があります。FooocusはMicrosoft Windowsではあまり知られていないアプリケーションなので、ダウンロードを手動で承認する必要があります。

マーク・ハッハマン / IDG
そうすると、Foooocus は実行に必要なソフトウェアインフラストラクチャをすべてダウンロードします。そのため、さらに数ギガバイトの容量と数分間のダウンロード時間が必要になります。ダウンロードは、AIアプリケーションのインターネットリポジトリである HuggingFace.com から行われます。
実行中は、このコマンド ライン画面が表示されます。

マーク・ハッハマン / IDG
すぐにFooocusインターフェースが表示され、Webブラウザ内で起動します。これはAIアプリケーションでは珍しいことではありません。ただし、空白部分が多いので、簡単に説明します。基本的にはこれで完了です。
Foucusの使い方:スタイルとプロンプト
下記のFooocusのウェブインターフェースが表示されたら、準備完了です。画面下部にプロンプトボックスがあり、シーンに何を含めるかを決めることができます。「生成」をクリックすると生成プロセスが開始され、アートが作成されます。画面一番下にある小さな「詳細設定」チェックボックスは、ぜひクリックしてください!クリックすると豊富なスタイルオプションが開き、私のサンプルの多くでは有効になっています。

マーク・ハッハマン / IDG
もちろん、「猫」のようなヒントでも構いませんが、これまでに見たことのないものではありません。「海賊帽をかぶった猫」は、少し変化を加えます。「ハンバーガーレストランで海賊帽をかぶった猫」はさらにクリエイティブです。
ご希望の場合は、プロンプトで「不吉な」や「壮大な」など、ご希望のスタイルを指定することもできます。もちろん、これは解釈次第です。Fooocus は、デフォルトで写真のようなスタイルを好みます。

マーク・ハッハマン / IDG
システムに GPU が搭載されている場合は、Fooocus は可能であれば自動的に GPU にロードし、プロセスを大幅に高速化します。
「生成」をクリックすると、Fooocus は画像を複数回(デフォルトでは30回)繰り返し生成し、各ステップで精緻化と強化を行います。私は2台のシステム(GeForce RTX 3090を搭載した第13世代 Core デスクトップと、RTX 4090を搭載した第14世代 Intel Core HX ノート PC)でFooocus を実行しましたが、デフォルトの「速度」設定で画像の生成に約10秒もかかりませんでした。「品質」または「超高速」を選択して繰り返し処理のステップ数を調整できますが、必ずしも必要ではありません。
プロンプト生成はいくらでもできますが、限界があります。「土星の環の上を歩く猫」という画像では、認識できるような結果は得られませんでした。しかし、これはあくまで実験です。そして、Fooocusは著名人や公人を対象にトレーニングされているため、NSFWコンテンツに対して過度な制限を設けることはありません。ドナルド・トランプとジョー・バイデンがキスをしているところを想像したいなら、もちろん可能です。唇の動きをうまく理解できないというAIの奇妙な点を除けば、かなりリアルに見えます。

マーク・ハッハマン / IDG
デフォルトでは、Fooocus はプロンプトに基づいて画像のペアを作成し、それらを Fooocus ディレクトリ内の日付ごとに整理されたフォルダーに保存します。
繰り返しになりますが、Fooocusの強みの一つは、被写界深度や芸術的な影響など、細かい設定を入力せずに、生成された画像を美しく見せるための裏側での処理をしてくれることです。ただし、「設定」タブの「詳細」チェックボックスをオンにすれば、生成された画像の縦横比を調整できます。また、「ネガティブ」プロンプトを出すこともできます。例えば、Fooocusにスパゲッティの皿を描いてほしいとします。「ネガティブ」プロンプトボックスに「ミートボール」と入力すれば、ディテールが追加されることはありません。
「スタイル」タブは、簡単には説明できないような方法で出力をカスタマイズする簡単な方法です。昔のサタデー・イブニング・ポストの表紙を飾るような画像が欲しいですか?「広告ファッションエディトリアル」チェックボックスをクリックしてください。各スタイルには、選択したスタイルで描かれた猫の小さなイラストが表示されており、そこから選ぶことができます。たくさんの種類から選ぶことができます。(例えば「Terragen」を選択すると、素敵な風景風の背景が表示されます。)プロンプトボックスで独自のスタイルを指定することもできます。グスタフ・クリムト風のバイキングの王女(またはエリザベス女王!)が欲しい場合は、ぜひ試してみてください。
AIアートを微調整するためのプロンプトの微調整方法についてはここでは詳しく説明しませんが、試してみる価値があるかもしれない高度な機能を1つご紹介します。それは「Low-Rank Adaptations(LoRA)」です。これは完全にオプションなので、扱いたくない場合はここで止めて構いません。どうぞお楽しみください!
高度な作業: 追加の LoRA のダウンロード
Fooocusのフィルターオプションを既に試してみたことがあるかもしれません。LoRAは、特定の種類のアートに特化したツールです。LoRAは必ずしも必須ではありませんが、特定の効果に重点を置きたい場合は、LoRAを追加するとモデルの選択肢が広がります。最近見たLoRAの1つは、特に照明と照明効果に焦点を当てています。
言い換えれば、LoRAはFooocusのブラウザ拡張機能のようなプラグインです。私がLoRAを探すのに使っているサイトはCivitai.comで、そこからたくさんのLoRAをダウンロードできます。(無料アカウントに登録し、コンテンツの設定をいくつか選択する必要があります。LoRAのオプションの中にはNSFW(不適切なコンテンツ)が含まれているものもありますが、フィルタリングで除外できます。)

マーク・ハッハマン / IDG
いくつかコツがあります。まずは、Foocus が動作するベースモデルである「SDXL」でモデルをフィルタリングする必要があります。また、LoRA を適切なディレクトリ(例:Fooocusmodelsloras)にダウンロードまたはコピーする必要があります。
追加のLoRAをダウンロードしたら、Fooocusのアドバンスメニュー(モデルタブ内)で「オン」にして、AIアートの出力に活用できます。繰り返しになりますが、何がうまく機能し、何が機能しないかを見極めるには、ある程度の実験が必要です。
AIアートは決定論的であることを覚えておいてください。つまり、(デフォルトでは)モデルは毎回ランダムなサンプル(シード)から開始します。つまり、AIアートにはランダム性の要素が含まれているということです。良い結果を得るには何度か試す必要があるかもしれません。もしそうなら、Fooocusのドキュメントを詳しく読んで、印刷用やデスクトップの背景用にアートを拡大する方法、編集方法などを学ぶことができます。
以上です。とにかく、いろいろ試して楽しんでください!