日々適当

hibitekitou

生成AI

pc |2023-12-31

使う使わないはともかく、画像系の生成AIについて知っておく必要はあるかなと思い、ちょっと自分なりに整理しておく。

Stable Diffusion
開発元はStability AI社で2022年にOSSで公開されたもの。モデルによって商用利用可能・不可能が分かれる模様。
とはいえ学習元が著作権上不適切なものを利用しているんじゃないかってことで、なかなか問題があるらしい。
これを利用したサービスがいくつか生まれていて、Novel AIとかWaifu Diffusionとかとか。問題があるもの、その程度が低いもの、さまざまらしい。
Midjorney(ミッドジャーニー)
Discord Inc.が開発しているDiscord上で利用するアプリらしい。有料プランで商用利用可能。
やはり学習元の権利関係の問題はありそうだし、生成された画像の権利にもちょっと面倒そうなことがあるように見える。
DALL-E3
Open AI社が提供しているChatGPTに追加された画像生成サービス、らしい。 ChatGPTから利用するには有料版に入る必要があるらしい。商用利用可能ということ。無料で使うならBingからの利用となるけど、商用利用は不可みたい。
Adobe Firefly
Adobeの生成AIサービスで、商用利用OKよってAdobeの名で言っているし、当然ながらAdobeアプリとの親和性高し(組み込まれてる)。Adobe Stockから学習しているようで、しかしそこに画像を提供している人への通知なく始めたってことで問題視されているけど、PhotoshopyやIllustratorから利用できるインパクトは絶大だと個人的には思う。

などなど。

無料で使いたければStable Diffusionってことになりそうだけど、具体的にどうするかってぇとどうすんだろ。
去年の今頃、ローカルに環境作ってみたけど、その時に比べて今時ははるかに簡易にかついい感じのUIがついた環境の構築を今はできるらしい(Stable Diffusion Web UI(AUTOMATIC1111)っていうWebアプリケーション)。

とかなんとかしていると、ComfyUI[GitHub]ってものがあることを知りました。Stable DiffusionのノードツリータイプのGUIを用意してくれるツールで、ローカルでWebサーバーを走らせ、そこでGUIを提供してくれます。Windows(NVIDIA)環境だとかなり簡単に環境構築できるようだけど、Mac環境だとターミナルを使って幾つかのコマンドを叩くような処理が必要になりますが、まあでも簡単に入りましたな(PythonのSSLに関するエラーでちょっと躓いたけど、それはまた別の話。インストールの参考としてはこちらが良さげ? ComfyUI Local Install and ComfyUI Manager On Apple Silicon M1/M2/M3 Mac Full Tutorial[YouTube])。

メモとして。
Civitai Models | Discover Free Stable Diffusion Models
にいろいろモデルがあるとネット情報を漁っていると記されているのだけど、あくまで趣味の範囲で触っているのがいいのだろうなと思うなど。サムネイルに惹かれて Jib Mix Realistic XL をとりあえず入れてみました(Path to ComfyUI/models/checkpoints/ に入れるようです)

また、ノードの組み方がよくわからんという人は、ComfyUI_examplesからやりたいことが書いてあるページに移動して、そこに表示されているComfyUIのノードツリーの画像を自分が操作しているComfyUIの画面の中に放り込むとそのツリーが再現される模様。pngの中にツリーの情報を持たせているらしい。

ということで出力されてくる絵のクオリティは高いなぁと思いつつ、足の数とかその胴体どうなってんのって異形のものが出力されてきて、それを抑えるにはどうすりゃいんだ?ってノウハウが数十分触った程度でわかるわけもなく、まあでも年賀状の元ネタを一個取得できたのでそれでいいことにします。

コメント ( 0 )|Trackback ( )
 
コメント
 
コメントはありません。
コメントを投稿する
ブログ作成者から承認されるまでコメントは反映されません
 
名前
タイトル
URL
コメント
コメント利用規約に同意の上コメント投稿を行ってください。

数字4桁を入力し、投稿ボタンを押してください。