Tips的に色々

仕事から趣味に至るまで徒然なるままに

AIの現在地は3

2023-08-05 19:17:09 | パソコン
嘘を嘘と見抜けない人は(AIを使うのは)難しい。

その分野に詳しくなければ嘘だと分からないような尤もらしい文章を生成するからね。あと、従来のフェイクデータに加えてAIが作成したフェイクデータもWebに溢れてるし。

これからの時代、Webのデータをそのまま機械学習に利用するのは非常に危険、GPT-4がどんどんアホになっている(意訳)という話が真しやかに囁かれてるくらいだし。

ChatGTPが登場したのが2022年11月30日。これ以降の学習モデルには、文章なら「間違いがある/ない」「フェイクである/ない」「人間が書いた/AIが作成した」、論文なら「査読済みである/ない」「実証済みである/ない」「フェイクである/ない」、画像なら「オリジナルである/2次創作である/フェイクである」「人間が描いた/AIが作成した」を示すパラメータまで含めたデータを学習させなきゃ、とんでもない能力低下を招く。

てかもう低下してる。たまにBingと押し問答してる笑

でもそれを確認するのは人間でも難しい訳で、簡単な話ではない。AIで判別しつつ学習できるようになればいいんだけど、現状では鶏が先か卵が状態に陥っている。

まぁBingはネットの検索結果をそのまま使っているからそういう問題が起こっているだけで、元となっている言語モデル(GTP-3.5)自体は汚染されてないけど、ChatGTP以降の言語モデルはどうやってデータが学習に適しているかどうかを判別しているのか気になる。

その結果はどの言語モデルが優秀かで分かる訳だけど、可能であればそのプロセスこそが知りたい。企業秘密だから100%無理なんだろうけど。

--------
tsutaya0225あっとgmail.com