ほぼ日記

絵を自動分析して呪文を作成してくれるtagger

Stable DiffusionでAI絵を作成していると、
どうしても細かいところで
AIさんと私のイメージが違う点も出てきます。

特に英語で呪文を表現する場合、「:D」(笑顔)などの絵文字が出てくると
翻訳機能だけでは探し出すのは困難です。

んで、それならAIさんが絵をどのように文字列データとして認識するのか?
それが分かるとAIのクセも解析しやすくなります。

リコリス公式絵のtagger分析

オリジナルTVアニメーション「リコリス・リコイル」公式サイト

1girl, nishikigi chisato, lycoris uniform, two-tone dress, ribbon, pleated dress, blonde hair, red ribbon, solo, hair ribbon, dress, red eyes, red dress, short hair, grey dress, socks, blue ribbon, shoes, bangs, neck ribbon, black socks, bob cut, red belt, smile, belt, looking at viewer, open mouth, full body, brown footwear, loafers, hand on hip, kneehighs, school uniform, long sleeves, :d, hand on own chest, shirt, white shirt, collared shirt

nishikigi chisato, lycoris uniform
AIさんも理解していますね。

collared shirt
(襟付きシャツ)
このワードを探すのに時間がかかったので、もっと早くこの機能が知りたかった。

two-tone dress 
なるほど、これを使えば良かったのか(でも、再現度は低かった(;´Д`)

一方で、定番のAI語よりも、
私が個人的にもっと再現度が上がるのでは?というのがあるので、
需要はあまりないでしょうが、
AI錬金術師の端くれとして(儲けちゃいませんが)記しておきます。

looking at viewer
(カメラ目線)

looking at center
(中央を見る。実写だとこっちがいいかも)


small double button
(ダブルボタン……左右にボタンがあるホテルマンっぽい服

cheerleder's skirt
(スカートをプリーツから、幅広プリーツへ。ただし、他もスタイルが引っ張られる)

 

いずれ呪文も不要で、脳波だけで
絵が作れる時代になると思います。

脳信号で文字入力 重度声帯まひでも1分間29字、米大学 - 日本経済新聞

脳信号で文字入力 重度声帯まひでも1分間29字、米大学 - 日本経済新聞

米カリフォルニア大学サンフランシスコ校の研究チームは、脳とコンピューターを電極でつなぎ、声を出さなくても脳の電気信号を文字に変換する技術を開発した。脊髄損傷患者...

日本経済新聞

 

以上です。

名前:
コメント:

※文字化け等の原因になりますので顔文字の投稿はお控えください。

コメント利用規約に同意の上コメント投稿を行ってください。

 

  • Xでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最新の画像もっと見る

最近の「日記」カテゴリーもっと見る

最近の記事
バックナンバー
人気記事