goo何気無い日々が心地よい安寧

何気無い日々が続く様に。生きていく事の大変さがカナン。ある種空気の様な存在になりたいもの。

⁂ LINE 「英語に匹敵する」超巨大言語モデルを日本語で開発へ 201125

2020-11-25 21:41:51 | 気になる モノ・コト

LINE、『英語に匹敵する』超巨大言語モデルを日本語で開発へ 用途に特化しない汎用型
  LINE より 201125

 LINEはネイバーと共同で、日本語に特化した超巨大言語モデルの開発と、その処理に必要なインフラ構築への取り組みを発表、

 発表によると、今回構築するのは、日本語による汎用型の超巨大言語モデルです。AIによる自然な言語処理や表現を可能とする超巨大言語モデルは、現時点で英語のみが存在・商用化されており、日本語に特化したモデルの構築は今回が初。

 また、従来の言語モデルは各ユースケース(Q&A、対話、等)に対し、自然言語エンジニアが個別に学習する必要のある「特化型」でした。
 一方、本モデルでは汎用型言語モデルの採用を目指す。この汎用型言語モデルは、OpenAIの「GPT」や、Googleの「T5」に代表されるモデルで、新聞記事や百科事典、小説、コーディング等といった膨大な言語データを学習させたモデルを構築、そこに文章の書き出しや、プログラミングコードの一部などの「文脈」を与えることで、それらしいと判断した文字列を生成できるという。

 今回、日本語に特化した汎用型言語モデルを開発するにあたり、175億以上のパラメーターと100億ページ以上の日本語データを学習データとして利用。
 この取り組みにより、日本語におけるAIの水準が格段に向上し、日本語AIの可能性が大きく広がることが想定されるとLINEは説明。

 なお、これまで英語以外での超巨大言語モデルについては、ごく少数の取り組みが発表されるに留まっているといい、この理由の1つについてLINE側は、高度なインフラ環境の必要性を挙げます。
 超巨大言語モデルの処理には数百ギガバイトものメモリーが必要だといい、世界でも指折りの性能を持つスーパーコンピューターなど、高度なインフラ環境が必要だといいます。

今回はLINEはネイバーと共同で、700P(ペタ)FLOPS以上の性能を備えた世界でも有数のスーパーコンピュータを活用し、超巨大言語モデルの土台となるインフラの整備を年内に実現予定。

 また、開発した超巨大言語モデルは、新しい対話AIの開発や検索サービスの品質向上など、AIテクノロジーブランド「LINE CLOVA」をはじめとするLINE社のサービスへの活用のほか、第三者との共同開発や、APIの外部提供についても検討します。

◎発表の全文は下記の通りです。
 LINE株式会社(所在地:東京都新宿区、代表取締役社長:出澤剛)はNAVERと共同で、世界でも初めての、日本語に特化した超巨大言語モデル開発と、その処理に必要なインフラ構築についての取り組みを発表いたします。
超巨大言語モデル(膨大なデータから生成された汎用言語モデル)は、AIによる、より自然な言語処理・言語表現を可能にするものです。日本語に特化した超巨大言語モデル開発は、世界でも初めての試みとなります。

従来の言語モデルは、各ユースケース(Q&A、対話、等)に対して、自然言語処理エンジニアが個別に学習する必要がありました(特化型言語モデル)。

一方、汎用言語モデルとは、OpenAIが開発した「GPT」※1や、Google の「T5」※2に代表される言語モデルです。
新聞記事や百科事典、小説、コーディングなどといった膨大な言語データを学習させた言語モデルを構築し、その上でコンテキスト設定を行うためのFew-Shot learning*1を実行するだけで、さまざまな言語処理(対話、翻訳、入力補完、文書生成、プログラミングコード等)を行うことが可能となり、個々のユースケースを簡単に実現できることが期待されます。
*1:ブログの書き出しや、プログラミングコードの一部などを与えること。それをもとに、最もそれらしいと判断した文字列を生成します。たとえば、与えた言葉(「おはよう」)に対して、これまで学習した中から最もそれらしいと判断した文字列(「おはようございます」等)を返すといったことが考えられます

今回、日本語に特化した汎用言語モデルを開発するにあたり、1750億以上のパラメーターと、100億ページ以上の日本語データを学習データとして利用予定です。これは現在世界に存在する日本語をベースにした言語モデル*3のパラメーター量と学習量を大きく超えるものとなります。パラメーター量と学習量については、今後も拡大してまいります。

本取り組みにより、日本語におけるAIの水準が格段に向上し、日本語AIの可能性が大きく広がることが予想されます。

現在、超巨大言語モデルは世界でも英語のみが存在・商用化*2しており、他言語の開発についても、ごく少数の取り組みが発表されているのみとなります。その理由の一つとして、高度なインフラ環境の必要性があげられます。
超巨大言語モデルの処理には数百ギガバイトものメモリーが必要と考えられており、世界でも指折りの性能を持つスーパーコンピュータなど、高度なインフラ環境が必要です。
*2 OpenAIが開発し、Microsoftがライセンスを保有する「GPT-3」

今回LINEはNAVERと共同で、当モデルを迅速かつ安全に処理できる700ペタフロップス以上の性能を備えた世界でも有数のスーパーコンピュータを活用し、超巨大言語モデルの土台となるインフラの整備を年内に実現予定です。

英語にて実現している精度に匹敵する、またはそれ以上の、日本語の超巨大言語モデルを創出してまいります。
開発された超巨大言語モデルは、新しい対話AIの開発や検索サービスの品質向上など、AIテクノロジーブランド「LINE CLOVA」をはじめとするLINE社のサービスへの活用のほか、第三者との共同開発や、APIの外部提供についても検討予定です。

※1:OpenAI「GPT(Generative Pre-trained Transformer)」
米国の技術開発会社OpenAIが2019年2月に発表した、文章生成に強い能力を持つ汎用型言語モデルに関する論文。
その後2019年11月には15億のパラメーターをもつ汎用型言語モデル「GPT-2」をリリース。2020年5月に1750億のパラメータを持つ「GPT-3」の構想が発表され、 翌月にベータ版を公開、8月には商用化した。「GPT-3」は「GPT-2」と比較して圧倒的なデータ量を持つことにより、長文の文章生成能力が飛躍的に向上(キーワードからメール文生成や、話し言葉の質問から流暢な回答文を生成する、など)し、世界的に注目を浴びている。

※2:Google 「T5(Text-to-Text Transfer Transformer)」
GPTと同じくトランスフォーマーと呼ばれる自然言語処理技術を用いるが、文章生成よりも翻訳、質疑応答、分類、要約などの文書変換処理を目的とした構成を採用している。入力(タスク)と出力(回答)の両方をテキストのフォーマットに統一して、転移学習を行うことで、全てのタスクを同じモデルで解く。学習データを変更することで、同じモデルでさまざまなタスクが解けるとされる。

【LINE CLOVAとは】
AIテクノロジーブランド「LINE CLOVA」は、「CLOVA Chatbot」「LINE AiCall」などのAI技術やサービスを通して、生活やビジネスに潜む煩わしさを解消すること、社会機能や生活の質を向上させることで、より便利で豊かな世界をもたらしたいと考えています。「ひとにやさしいAI」が自然なカタチで生活やビジネスの一部となるような、「これからのあたりまえ」を創出するべく、引き続きAI技術のさらなる向上や、ビジネスの連携を進めてまいります。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

🚶‍♀️…隠元橋…右岸46.2km↩️ 🔭🌓他 201125

2020-11-25 21:07:00 | 📖 日記
🚶‍♀️…右岸河川敷…隠元橋前(14°)…右岸堤防道…右岸46.2km碑↩️
🚶‍♀️12042歩2kg
夕方)🚶‍♀️…🦷定検◎&🔭📷🌓火星🪐木星

曇天:スッキリしない天気 洗濯物x
 🌇夕方になり月と惑星見え出すスッキリ夜空🌌 十日余の月,火星と🪐木星の2ペア⁈
夜空に映える。 
📷持って歯科検診へ!遠回り往復で🔭📷
 今夜と明晩は月と火星接近中



右岸河川敷49km付近






火星と月


🪐と木星



コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

🔢 世界で最も長寿企業が多い国,日本がダントツ首位

2020-11-25 19:19:00 | 🔟 番付色々🆚

世界で最も“長寿企業”が多い国、日本がダントツ首位!「創業400年超え」日本最古の上場企業とは?
今日知っておきたい旬な話題を厳選したWorld Trend News。201125

【経済】「長寿企業」が多い国は?

日経BPコンサルティングの「世界の長寿企業ランキング」によると、創業からの年数が100年以上の企業の数で、日本が世界1位となった。
世界の創業100年以上の企業のうち、日本企業は41.3%に当たる3万3,076社で、2位のアメリカ(1万9,497社)を大きく上回った。

日本の長寿企業を業種別に見ると、最も多いのは製造業で、小売業、卸業と続いた。

日経BPコンサルティングによると、最も創業が古い日本の上場企業は1586年創業の松井建設で、2番目は住友金属鉱山(1590年創業)、3番目は養命酒製造(1602年創業)だという。




非上場企業なら更に古い世界最古も!


コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

⚠️新型コロナの感染力を増大するタンパク質発見  201125

2020-11-25 17:50:00 | 気になる モノ・コト

新型コロナの感染力を増大するタンパク質発見 新薬へ期待 名大ら
  財経新聞 より 201125

 ヒトや動物にウイルスが感染するとき、ウイルスの持つ「スパイクタンパク質」が細胞の表面の受容体と結合して、それを足掛かりに細胞に入り込む。新型コロナウイルス(SARS-CoV2)のスパイクタンパク質は、ACE2受容体と結合することがこれまでの研究により明らかになっている。

 名古屋大学などの研究グループは、ACE2とは別のニューピロリン1(NRP1)という第2の受容体を新たに発見した。さらにNRP1が新型コロナウイルスのスパイクタンパク質と結合すると、感染力が強くなることが分かった。新型コロナ感染症の新たな治療薬の開発につながることが期待される。

 本研究は名古屋大学大学院招聘准教授および英国ブリストル大学の准教授である山中洋平氏が率いる、ブリストル大学、オーストラリアのクイーンズランド大学、エストニアのタルトゥ大学、スイスのチューリッヒ大学からなる国際研究チームによって行われた。研究結果は13日付の「サイエンス」に掲載された。

 研究チームは新型コロナウイルスと、2003年に小さな流行を引き起こしたコロナウイルス(SARS-CoV)の違いを検討した。どちらのウイルスのスパイクタンパク質もACE2受容体と結合して感染することがわかっている。しかし新型コロナウイルスだけが、細胞が持つNRP1という受容体と結合することが判明。さらにNRP1と結合するときに必要なCendRモチーフを作ることができるのも、新型コロナウイルスだけだった。

 そこで、新型コロナウイルスの感染にNRP1がどのように影響するかを調べた。培養細胞に遺伝子導入し、ACE2のみ持つ細胞、ACE2とNRP1を持つ細胞、NRP1だけを持つ細胞などを作成。それらに対するウイルスの感染を調べたところ、NRP1だけでは感染できず、ACE2とNRP1両方が存在すると感染力が増大することがわかった。

 さらに詳しく調べるために、NRP1とスパイクタンパク質の繋ぎ目となる分子Cend Rモチーフに結合する場所をモノクローナル抗体でブロックした。するとウイルスの感染力は低下することがわかった。またNRP1とスパイクタンパク質の結合部分を塞いでしまう物質を与えると、ウイルスの感染力が低下。これらより、スパイクタンパク質がACE 2と結合し、さらにNRP1とも結合することで感染力が増大することがわかった。

 今後このNRP1とスパイクタンパク質の繋ぎ目となるCendRモチーフを阻害する物質を開発していけば、新型コロナウイルスの感染能力を下げられる抗ウイルス薬の候補として期待できる。そしてこの抗ウイルス作用は、新型コロナウイルス感染症だけでなく、他の感染力が強い新規のウイルス感染症に対応できる薬の開発につながることも期待される。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする