引き続いて、Generative Deep Learning [1] の 4章 Conditional GAN (CGAN)のサンプル (cgan.ipynb)[2]を何とか実行。多少パラメータをいじることで、やっとそれらしい結果を得られた。
cgan.ipynbは、セレブ顔画像セットを Blond_Hairであるかどうかでラベル付きで学習し、生成する画像をブロンドにするかどうかをラベルで制御できるようにするというもの。
前回のサンプルまではそのままで動いたが、cgan.jpynbは2か所ほど手を加える必要があった。
変更点1: トレーニングデータ不足を補うため、下記のようにrepeatメソッドを追加。これをしないと学習の途中でデータが尽きたといって止まってしまう。
![](https://blogimg.goo.ne.jp/user_image/6c/a9/6a9b0b2be8b538bdd45e08c71b81799f.png)
変更点2: ブラウザとjupyter labの負荷軽減のため途中経過の画像出力の頻度を制限。これをしないと、ブラウザあるいはjpyterのサーバがクラッシュすることがある。
![](https://blogimg.goo.ne.jp/user_image/44/19/6bc4721363acb49ef0e2380270d6c4c2.png)
実行環境は、メモリが16GBでCPUが Core i5 10600 (3.3GHz) 6 コア 12 Thread.
前回のWGANがRTX A2000だと無理だったので、最初からあきらめてCPUでの実行とした。
最初は、動かすための前記変更だけを行ったサンプルコードの場合。
全部で2000epoch のうち、500epochごとの進捗がこちら. おなじlatent空間の点からlabelだけ変えて生成した画像を並べている。
501/2000
![](https://blogimg.goo.ne.jp/user_image/0b/e5/83505267b3781b35b6e2e5ee82562509.png)
1001/2000
![](https://blogimg.goo.ne.jp/user_image/04/87/accba930966407d3000da3904deca51e.png)
1501/2000
![](https://blogimg.goo.ne.jp/user_image/49/4a/abd86641a40f94bc23d5227da3494619.png)
1991/2000
![](https://blogimg.goo.ne.jp/user_image/45/dc/345bdafd957edc16bab63cff5db072ff.png)
そして、学習完了後に生成画像がこちら。なお、latent空間の点はお互いにばらばら。
![](https://blogimg.goo.ne.jp/user_image/2d/4f/d9e2c299a5297a412ffb89cff7657cd8.png)
金髪か否かで生成し分けているのだが、どうだろう。 言われればそうかもしれないが、よくわからない。そもそも、顔イメージそのものが学習しきれていないように思うがどうだろう。
ちなみに、学習にかかった時間は120分30秒
まず試したのがcriticの回数をepockあたり3回から5回に増やすこと。
501/2000
![](https://blogimg.goo.ne.jp/user_image/79/72/ac4e0aa61b2bbf08906265dd6ee7640b.png)
1001/2000
![](https://blogimg.goo.ne.jp/user_image/66/69/b162c026d48e53d328b566821d3bcc11.png)
1501/2000
![](https://blogimg.goo.ne.jp/user_image/7a/b3/1a5aa801642eec35ad4769d09b4e7a0e.png)
1981/2000
![](https://blogimg.goo.ne.jp/user_image/63/9c/2b36e55cf080cf4b7dee488d4883cee7.png)
Generate imagesの結果
![](https://blogimg.goo.ne.jp/user_image/2f/8f/ed81c9105570f5eb71adf833cd07fcea.png)
所要時間 3時間6分 (186分)
次に、criticをepockあたり5回で、さらにepochの回数を倍の4000にした。
1001/4000
![](https://blogimg.goo.ne.jp/user_image/41/55/96203bea9ba7bf442f825a598dce8226.png)
2001/4000
![](https://blogimg.goo.ne.jp/user_image/57/24/c2920bfcc3474cfa429be277526b8ae7.png)
3001/4000
![](https://blogimg.goo.ne.jp/user_image/72/89/f5cdefaa991e70b63aeca1c77c852423.png)
3951/4000
![](https://blogimg.goo.ne.jp/user_image/21/41/e0fc1b103937826fe7024b0e8dd0f7f2.png)
Generate imagesの結果
![](https://blogimg.goo.ne.jp/user_image/33/4d/50e54935893d29dd019bdb13c4504cb1.png)
所要時間 6時間12分(372分)
ばらばらのlaten vectorから作った画像を並べた Generate images の結果だと分かりにくいが、同じlatent vectorからlabelだけ変えて作った画像を並べた3951epochでの画像をみると、Blond Hair という属性を学習して画像を作り分けられるようになったと言えるだろう。
CGANサンプルの実行にはかなり時間がかかりしんどかった。学習に費やされる時間が長かったのはもちろんだが、エラー終了してしまって無駄になった時間がさらに長かった。延々とCPUを走らせて、そろそろ終わりかなというところブラウザがクラッシュとかなると、ちょっと辛い。
いろいろと試すには大容量VRAMを搭載したGPUが必須かな...
24GBを積んだP40ならヤフオクでも3万円で出品されているけれど、パッシブ冷却だからパワフルな送風ファンが必須。AI実験用のサブPCは、古いタワーなので 送風ファンのスペースが足りなくてP40は使えない。メインPCは、そのつもりで買った大型ケースなので送風ファンごと収まるけれど、AIの実験でメインPCが長い時間使えなくなるのが不便。それが理由でAI実験環境にサブPCに移したのだからなぁ。
[1] Generative Deep Learning, 2nd Edition by David Foster, Released May 2023, Publisher: O'Reilly Media, Inc. ISBN: 9781098134181
[2] https://github.com/davidADSP/Generative_Deep_Learning_2nd_Edition
cgan.ipynbは、セレブ顔画像セットを Blond_Hairであるかどうかでラベル付きで学習し、生成する画像をブロンドにするかどうかをラベルで制御できるようにするというもの。
前回のサンプルまではそのままで動いたが、cgan.jpynbは2か所ほど手を加える必要があった。
変更点1: トレーニングデータ不足を補うため、下記のようにrepeatメソッドを追加。これをしないと学習の途中でデータが尽きたといって止まってしまう。
![](https://blogimg.goo.ne.jp/user_image/6c/a9/6a9b0b2be8b538bdd45e08c71b81799f.png)
変更点2: ブラウザとjupyter labの負荷軽減のため途中経過の画像出力の頻度を制限。これをしないと、ブラウザあるいはjpyterのサーバがクラッシュすることがある。
![](https://blogimg.goo.ne.jp/user_image/44/19/6bc4721363acb49ef0e2380270d6c4c2.png)
実行環境は、メモリが16GBでCPUが Core i5 10600 (3.3GHz) 6 コア 12 Thread.
前回のWGANがRTX A2000だと無理だったので、最初からあきらめてCPUでの実行とした。
最初は、動かすための前記変更だけを行ったサンプルコードの場合。
全部で2000epoch のうち、500epochごとの進捗がこちら. おなじlatent空間の点からlabelだけ変えて生成した画像を並べている。
501/2000
![](https://blogimg.goo.ne.jp/user_image/0b/e5/83505267b3781b35b6e2e5ee82562509.png)
1001/2000
![](https://blogimg.goo.ne.jp/user_image/04/87/accba930966407d3000da3904deca51e.png)
1501/2000
![](https://blogimg.goo.ne.jp/user_image/49/4a/abd86641a40f94bc23d5227da3494619.png)
1991/2000
![](https://blogimg.goo.ne.jp/user_image/45/dc/345bdafd957edc16bab63cff5db072ff.png)
そして、学習完了後に生成画像がこちら。なお、latent空間の点はお互いにばらばら。
![](https://blogimg.goo.ne.jp/user_image/2d/4f/d9e2c299a5297a412ffb89cff7657cd8.png)
金髪か否かで生成し分けているのだが、どうだろう。 言われればそうかもしれないが、よくわからない。そもそも、顔イメージそのものが学習しきれていないように思うがどうだろう。
ちなみに、学習にかかった時間は120分30秒
まず試したのがcriticの回数をepockあたり3回から5回に増やすこと。
501/2000
![](https://blogimg.goo.ne.jp/user_image/79/72/ac4e0aa61b2bbf08906265dd6ee7640b.png)
1001/2000
![](https://blogimg.goo.ne.jp/user_image/66/69/b162c026d48e53d328b566821d3bcc11.png)
1501/2000
![](https://blogimg.goo.ne.jp/user_image/7a/b3/1a5aa801642eec35ad4769d09b4e7a0e.png)
1981/2000
![](https://blogimg.goo.ne.jp/user_image/63/9c/2b36e55cf080cf4b7dee488d4883cee7.png)
Generate imagesの結果
![](https://blogimg.goo.ne.jp/user_image/2f/8f/ed81c9105570f5eb71adf833cd07fcea.png)
所要時間 3時間6分 (186分)
次に、criticをepockあたり5回で、さらにepochの回数を倍の4000にした。
1001/4000
![](https://blogimg.goo.ne.jp/user_image/41/55/96203bea9ba7bf442f825a598dce8226.png)
2001/4000
![](https://blogimg.goo.ne.jp/user_image/57/24/c2920bfcc3474cfa429be277526b8ae7.png)
3001/4000
![](https://blogimg.goo.ne.jp/user_image/72/89/f5cdefaa991e70b63aeca1c77c852423.png)
3951/4000
![](https://blogimg.goo.ne.jp/user_image/21/41/e0fc1b103937826fe7024b0e8dd0f7f2.png)
Generate imagesの結果
![](https://blogimg.goo.ne.jp/user_image/33/4d/50e54935893d29dd019bdb13c4504cb1.png)
所要時間 6時間12分(372分)
ばらばらのlaten vectorから作った画像を並べた Generate images の結果だと分かりにくいが、同じlatent vectorからlabelだけ変えて作った画像を並べた3951epochでの画像をみると、Blond Hair という属性を学習して画像を作り分けられるようになったと言えるだろう。
CGANサンプルの実行にはかなり時間がかかりしんどかった。学習に費やされる時間が長かったのはもちろんだが、エラー終了してしまって無駄になった時間がさらに長かった。延々とCPUを走らせて、そろそろ終わりかなというところブラウザがクラッシュとかなると、ちょっと辛い。
いろいろと試すには大容量VRAMを搭載したGPUが必須かな...
24GBを積んだP40ならヤフオクでも3万円で出品されているけれど、パッシブ冷却だからパワフルな送風ファンが必須。AI実験用のサブPCは、古いタワーなので 送風ファンのスペースが足りなくてP40は使えない。メインPCは、そのつもりで買った大型ケースなので送風ファンごと収まるけれど、AIの実験でメインPCが長い時間使えなくなるのが不便。それが理由でAI実験環境にサブPCに移したのだからなぁ。
[1] Generative Deep Learning, 2nd Edition by David Foster, Released May 2023, Publisher: O'Reilly Media, Inc. ISBN: 9781098134181
[2] https://github.com/davidADSP/Generative_Deep_Learning_2nd_Edition