2023年8月5日のブログ記事一覧-Tips的に色々

AIの現在地は3

2023-08-05 19:17:09 | パソコン

嘘を嘘と見抜けない人は（AIを使うのは）難しい。

その分野に詳しくなければ嘘だと分からないような尤もらしい文章を生成するからね。あと、従来のフェイクデータに加えてAIが作成したフェイクデータもWebに溢れてるし。

これからの時代、Webのデータをそのまま機械学習に利用するのは非常に危険、GPT-4がどんどんアホになっている（意訳）という話が真しやかに囁かれてるくらいだし。

ChatGTPが登場したのが2022年11月30日。これ以降の学習モデルには、文章なら「間違いがある／ない」「フェイクである／ない」「人間が書いた／AIが作成した」、論文なら「査読済みである／ない」「実証済みである／ない」「フェイクである／ない」、画像なら「オリジナルである／2次創作である／フェイクである」「人間が描いた／AIが作成した」を示すパラメータまで含めたデータを学習させなきゃ、とんでもない能力低下を招く。

てかもう低下してる。たまにBingと押し問答してる笑

でもそれを確認するのは人間でも難しい訳で、簡単な話ではない。AIで判別しつつ学習できるようになればいいんだけど、現状では鶏が先か卵が状態に陥っている。

まぁBingはネットの検索結果をそのまま使っているからそういう問題が起こっているだけで、元となっている言語モデル（GTP-3.5）自体は汚染されてないけど、ChatGTP以降の言語モデルはどうやってデータが学習に適しているかどうかを判別しているのか気になる。

その結果はどの言語モデルが優秀かで分かる訳だけど、可能であればそのプロセスこそが知りたい。企業秘密だから100％無理なんだろうけど。

--------

tsutaya0225あっとgmail.com

読む価値がない独り言

2023-08-05 13:54:21 | プログラミング

JSONの拡張子は.jsonなのに、

YAMLの拡張子は.ymlなんだよな。

何かもやもやする……。

と思って調べたら公式には.yamlが標準！

.ymlは一般の（DOS遺産の）3文字表記に会わせただけのものらしい。

言ってみれば.jpgと.jpegの関係と同じ。

なんかスッキリした笑

--------

tsutaya0225あっとgmail.com

goo blog お知らせ

	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】goo blogスタッフの気になったニュース
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！