ほんの気持ちのエーゴです。@ goo

Just a little bit of English *almost* everyday!

いきなり話題にし始めた生成ソフト

2023-07-05 21:05:05 | Current Topics トレンディな話題
巷では、ChatGPTなど生成ソフトをめぐって毎日のように話題にしていますね。もういきなりですよね。私の周りでも、今年の初めに一斉にメリケン人の間でその言葉が出たと思ったら、同じ週にはもう全員が試しているって感じでした。そのすぐ後に日本でワイワイ言い始めましたが、なにか臭いませんか???w

そもそも生成ソフトってなんやねん?という説明はもう必要ないですね。
使い方によりけりですが、エーゴに関して言えば、これを作文で使ったとして素晴らしいものができたとしても、その時の先生に対してはごまかせるかもしれませんが、実力アップにはつながらないです。基本が分かってなければ。
それと、私の分野で言えば、生成ソフトって結局人間が情報を与えているからそれを倍速以上のスピードでまとめているだけで、情報与えれば与えるほど、餌を爆食いして成長する化け物のようなもので、だから私は化け物に餌を与えたくなくて、人が使っているのはみたことあるけれど、1度も使っていません。w

ということで、専門家は何を言っているのかというビデオ。全てを翻訳していると、人間の私には時間がかかるので、要点だけまとめます。w
このビデオはどこから見つけたのか覚えていないのですが、富を構築するとかなんとかいうアダム・タガートさんとかいう人がインタビューしているものです。なぜかニュースレターが送られてくる。w w w
インタビューした相手(ディラン・パテルさんとお読みするんでしょうか)は、もう典型的ですね、エンジニアといったらインド系のお兄さんが多いです。私の個人的見解ですが。彼はセミコン業界のエキスパート、リサーチアナリストのようです。

*****
まず、AIとは、ディランさんがいうには、ブルートフォース(力ずくの方法)だっていうんですね。この人の説明、同じことを繰り返していて、ちとわかりにくいです。w
で、色々喋ってるんですが、どのくらいすごいかというと、例えば、バート(Bert)と呼ばれるググルが2018年に開発したアルゴリズムは、1枚の紙の上に50個の番号を書いて、その紙(全部違う番号)を重ねていったものがニューヨークシティからシカゴまで行くような処理能力のスピード(50個x枚数分)だというのですが、それが2020年リリースのGPT3は月まで行くくらいだと言います。それで、もっとクレージーなのが、GPT4モデルで、月までの往復距離を22倍にしたようなものらしいです。

私の生徒さんは理系が多いので、この手の話もよく聞いたり調べたりするんですが、ブルートフォースってのは何かというと(間違ってたらご指摘ください)、例えばパスワードがここにあって、それを推測する何兆もの数字の組み合わせを秒速でするってんですね。これがハッカーの元っぽいです。

で、どうやら、GPTなどは、例えばなんか詩を書いてくれる?と頼んだら、持っているデータを吐き出すんだと。

詩の例が出たところで、アダムさんが聞くには、AIにはその感情を理解することができるのか、それとも犬を訓練するみたいなものなのかと。

それに対する答えは、チャットGPTは最初に関連のある言葉を4文字出したら、そこから関連するものを4文字というように、少しずつ、少しずつ吐き出していくんだと。(そういえば、GPTが吐き出すときは一定のリズムで止まりながらザンザンって感じで文章を出してましたね。)

では、どうやってAIは次の言葉を推測するのか?
AIはただ次々とデータを出していっているだけなので、自分が(w)何をやっているかなんてのはわからない。
感情があって行ってるんじゃなくて、感情を表す言葉を学習しているので、それに関する次の言葉を出し続けているだけだと。感情が備わってそれを書いているんじゃなくて、感情に関わる言葉を学習していてそれを出しているんだというんですね。これがいじめに関する言葉なら、それに関連した言葉が次々と出てくる。全部インターネットにありますから!(私、あってたじゃん!!!)

ここで、私が考えるに、ネット上にはウィキからコメントからTwitterから、もうありとあらゆるデータがあるんですよ。それを月往復22倍のスピードですから、あっという間に色々出せるでしょう。関連したものはあっという間に続々と出てくるわけですね。要するに既存の今まで人間が出したデータを活用しているってことでしょう?

ここで、この人の説明まわりくどいんで、適当に端折ります。w
AIが吐き出したものに対して、今度は人間がフィードバックを与えますね。すると、最初のデータに対してより細かいデータがインプットされるんですよ。それはエーゴでreinforcement learning、日本語にすると強化学習と呼んでるようです。
(ここまでで、1時間以上喋ってるこの人の最初の16分ぐらいをまとめました。
いやあ、もうちょっとまともに話して欲しいわ〜〜〜。



最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。