Stable DiffusionでAI絵を作成していると、
どうしても細かいところで
AIさんと私のイメージが違う点も出てきます。
特に英語で呪文を表現する場合、「:D」(笑顔)などの絵文字が出てくると
翻訳機能だけでは探し出すのは困難です。
んで、それならAIさんが絵をどのように文字列データとして認識するのか?
それが分かるとAIのクセも解析しやすくなります。
リコリス公式絵のtagger分析
オリジナルTVアニメーション「リコリス・リコイル」公式サイト
1girl, nishikigi chisato, lycoris uniform, two-tone dress, ribbon, pleated dress, blonde hair, red ribbon, solo, hair ribbon, dress, red eyes, red dress, short hair, grey dress, socks, blue ribbon, shoes, bangs, neck ribbon, black socks, bob cut, red belt, smile, belt, looking at viewer, open mouth, full body, brown footwear, loafers, hand on hip, kneehighs, school uniform, long sleeves, :d, hand on own chest, shirt, white shirt, collared shirt
nishikigi chisato, lycoris uniform
AIさんも理解していますね。
collared shirt
(襟付きシャツ)
このワードを探すのに時間がかかったので、もっと早くこの機能が知りたかった。
two-tone dress
なるほど、これを使えば良かったのか(でも、再現度は低かった(;´Д`)
一方で、定番のAI語よりも、
私が個人的にもっと再現度が上がるのでは?というのがあるので、
需要はあまりないでしょうが、
AI錬金術師の端くれとして(儲けちゃいませんが)記しておきます。
looking at viewer
(カメラ目線)
↓
looking at center
(中央を見る。実写だとこっちがいいかも)
small double button
(ダブルボタン……左右にボタンがあるホテルマンっぽい服)
cheerleder's skirt
(スカートをプリーツから、幅広プリーツへ。ただし、他もスタイルが引っ張られる)
いずれ呪文も不要で、脳波だけで
絵が作れる時代になると思います。
以上です。