goo blog　サービス終了のお知らせ　

パソコン悪戦苦闘記録

ChatGPTの大ブレークは人間のフィードバックからの強化学習の成果

#フィードバック

#不用意発言

自宅PC

2023年04月22日

　今日は土曜日なので会社は休みです。ですが、歯の治療の続きのため、今日も列車で、会社近くの歯科医院まで行ってきました。
　歯の治療の帰り、図書館に立ち寄り、ある雑誌をパラパラっと眺めてきました。

　雑誌には、ChatGPTを取り上げている記事があり、ササっと流し読みしました。
　その記事の中で、特に、

ChatGPTは「攻撃的な回答、間違った情報を回避するための訓練を受けている。」

という部分が目を引きました。
　
　というのは、GPT-3までの従来のGPTは、ユーザーの意図に沿うという点では、以下のような限界があったというのです。
１　ユーザの明示的な指示に従わないことがある。
２　存在しない、あるいは誤った事実を基にした誤った出力をすることがある。
３　有害、不快または攻撃的なコンテンツが含まれている。
　

　ChatGPTにおいては、その課題を克服し、信頼性を高めるために、人間の判断を盛り込んだ追加的な学習を施しているのが特徴のようです。
　開発元のOpenAIは、これを
　「人間のフィードバックからの強化学習」
　　（その頭文字をとって「RLHF」）
と呼んでいます。

　その強化学習、RLHFは、

【１】　様々なパターンによる問いかけに的確に答える
【２】　差別、偏見を含む不用意な発言をしないよう、出力にフィルターをかける

ようにするのが目的です。
　
　そのための学習データは、アウトソーシングによって、人手をかけて集めたようです。

　ChatGPTが今のように大ブレークしたのは、上記の訓練
（人間のフィードバックからの強化学習）の成果、たまものでしょう。

　人間様であっても、不用意な発言をしてしまい、大きな問題となることがたまにあります。
　（某氏の「女性がたくさん入っている会議は時間がかかる」発言など）
　
　なお、ChatGPTの回答にウソ情報が含まれることについては、まだ発展途上のようで、こらからの進化に期待したいものです。

Samsung microSDカード 512GB EVO Plus microSDXC UHS-I U3 Nintendo Switch 動作確認済最大転送速度13...

最大転送速度 : 130MB/秒 ※対応カードリーダー使用時(対応カードリーダーについてはITGマーケティングの...

Samsung SSD

それでは、また次の記事で
■■■■ goosyun ■■■■

名前:

コメント:

※文字化け等の原因になりますので顔文字の投稿はお控えください。

※コメント利用規約に同意の上コメント投稿を行ってください。

　

コメント利用規約に同意する

サービス終了に伴い、10月1日にコメント投稿機能を終了させていただく予定です。

最近の「自宅PC」カテゴリーもっと見る

つれづれ電脳記に新記事掲載

つれづれ電脳記に新記事掲載

はてな新記事「ブログページのデザイン（テーマ）を変更」

はてな新記事「ブログページのデザイン（テーマ）を変更」

2025年7月29日

はてなブログの見出しと目次の設定方法

はてなブログの見出しと目次の設定方法

2025年7月26日

「事業者による消費者データの収集」はてなブログ

「事業者による消費者データの収集」はてなブログ

2025年5月15日

はてなブログ「記事にURLを貼り付けてリンク設定」

はてなブログ「記事にURLを貼り付けてリンク設定」

2025年5月10日

はてなブログでリンク貼り付けのショートカットキー

はてなブログでリンク貼り付けのショートカットキー

2025年5月7日

パソコン悪戦苦闘記録

画像編集ソフトPhotoshop Elementsを使って、写真合成なども楽しんでいます（下手の横好き）。

プロフィール画像

ADVANCE

2000年（H12)から始まる私のパソコン歴、PCやデジタル機器の操作に悪戦苦闘している記録です。Windowsばかりでなく、Linuxも触ったことがありますが、なかなか・・・。

145フォロワー

最近の記事

つれづれ電脳記に新記事掲載

はてなブログに新記事掲載

2025年8月1日

はてな新記事「ブログページのデザイン（テーマ）を変更」

2025年7月29日

はてなブログの見出しと目次の設定方法

2025年7月26日

UbuntuでDocomoのd-WiFi無料通信サービスの設定

2025年6月9日

カテゴリー

バックナンバー

2025年

8月 7月 6月 5月 4月 3月 2月 1月

2024年

12月 11月 10月 9月 8月 7月 6月 5月 4月 3月 2月 1月

2023年

12月 11月 10月 9月 8月 7月 6月 5月 4月 3月 2月 1月

2022年

12月 11月 10月 9月 8月 7月 6月 5月 4月 3月 2月 1月

2021年

12月 11月 10月 9月 8月 7月 6月 5月 4月 3月 2月 1月

2020年

12月 11月 10月 9月 8月 7月 6月 5月 4月 3月 2月 1月

2019年

12月 11月 10月 9月 8月 7月 6月 5月 4月 3月 2月 1月

2018年

12月 11月 10月 9月 8月 1月

2017年

12月 9月 2月 1月

2016年

12月 11月 10月 9月

2014年

8月 7月

2005年

7月 6月 5月

人気記事

Linuxシェルスクリプトの特殊文字とエスケープ

2023年8月20日

デスクトップとOneDriveの同期停止の手順

2020年4月5日

REGZAテレビへの複数のハードディスクの接続設定方法　録画データを消さずに追加増設できるのか

2019年12月6日

Wordのフィールド一括解除、知らなかったぁ！

2023年3月24日

【Wordマクロ】ボタンのクリックでマクロを実行、その作成手順～Word文書上にボタンを配置してマクロを登録

2018年11月25日