KDDIは、情報通信研究機構(NICT)と大規模言語モデル(LLM)に関する共同研究を開始した。
同研究では、NICTがこれまでに蓄積してきた600億件以上のWebページのデータなどと、KDDI総合研究所が開発してきた、生成AIが事実と異なる内容などを生成するハルシネーションを抑制する技術やマルチモーダルAI技術を活用する。
これらを基に、LLMを活用する上で課題となるハルシネーションの抑制や、地図画像および付随する建物情報などのマルチモーダルデータの取り扱いを可能にする技術を研究開発する。
なお、同研究は、総務省・NICTが令和5年度補正予算を活用し推進する「我が国における大規模言語モデル(LLM)の開発力強化に向けたデータの整備・拡充及びリスク対応力強化」における共同研究の第1弾。
LLMの利用にあたっては、事実と異なる内容や脈絡のない文章などが生成されるハルシネーションや、地図情報の活用が難しいことなどが課題になっている。
同研究では、NICTが長年蓄積した膨大なWebページのデータや、そこから作成したLLMの事前学習用データなどを活用し、共同研究を進める。
KDDIは、日本語汎用LLMの傾向に合わせたハルシネーション抑制技術の高度化や、地図画像および付随する建物情報などのマルチモーダルデータをLLMで取り扱う技術を、KDDI総合研究所のハルシネーション抑制技術やマルチモーダルAI技術を基に研究開発する。
これらの技術により、特定の目的のための対話システムや雑談システムにおける、LLMの信頼性向上につながる。
また、LLMによる位置関係の把握などが可能になるため、例えば通信事業者のお客さま応対に適用することで、問題が発生している設備やエリアの迅速な把握が可能となり、通信品質の改善につながることが期待される。<KDDI>
<各社の役割>
KDDI:ハルシネーション抑制技術およびマルチモーダルAI技術の高度化・評価
NICT:LLM開発のための学習データの開発・提供、LLMの事前学習の実施およびその評価
これらを基に、LLMを活用する上で課題となるハルシネーションの抑制や、地図画像および付随する建物情報などのマルチモーダルデータの取り扱いを可能にする技術を研究開発する。
なお、同研究は、総務省・NICTが令和5年度補正予算を活用し推進する「我が国における大規模言語モデル(LLM)の開発力強化に向けたデータの整備・拡充及びリスク対応力強化」における共同研究の第1弾。
LLMの利用にあたっては、事実と異なる内容や脈絡のない文章などが生成されるハルシネーションや、地図情報の活用が難しいことなどが課題になっている。
同研究では、NICTが長年蓄積した膨大なWebページのデータや、そこから作成したLLMの事前学習用データなどを活用し、共同研究を進める。
KDDIは、日本語汎用LLMの傾向に合わせたハルシネーション抑制技術の高度化や、地図画像および付随する建物情報などのマルチモーダルデータをLLMで取り扱う技術を、KDDI総合研究所のハルシネーション抑制技術やマルチモーダルAI技術を基に研究開発する。
これらの技術により、特定の目的のための対話システムや雑談システムにおける、LLMの信頼性向上につながる。
また、LLMによる位置関係の把握などが可能になるため、例えば通信事業者のお客さま応対に適用することで、問題が発生している設備やエリアの迅速な把握が可能となり、通信品質の改善につながることが期待される。<KDDI>
<各社の役割>
KDDI:ハルシネーション抑制技術およびマルチモーダルAI技術の高度化・評価
NICT:LLM開発のための学習データの開発・提供、LLMの事前学習の実施およびその評価