ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

AI記者について聞いてきた!

2017-10-21 09:46:43 | Weblog
10月20日、
InfoTalk#106 「この記事、AI記者が書きましたー人工知能による文章自動生成の近未来」

に行ってきたので、内容メモメモ




■「この記事、AI記者が書きました―人工知能による文章自動生成の近未来」
1.自己紹介&データセクション紹介
・ビジネスに役に立つか→わからない
 成果が出た時点でプレスリリース

・テクノロジーハイプサイクル:日本語版
 ソーシャルアナリティクス:ピークだったことが 10年前
  →あとに幻滅期
 ディープラーニングはピーク
 ビッグデータ:最悪期
 ソーシャルアナリティクス:ちょっと上がった

・IoTプラットフォームがこれから

・データセクションのお話
 技術だけでは延びていかない

 視聴者分析にSNS:男女とか Twitter分析
 IoTデータ売買市場
 ドローンの解析
 太陽光パネル
 ビッグデータファンド
 ソーシャルメディア分析:都知事選挙 年齢層
 ソーシャルセンサー
  目撃情報を拾ってくる:ディープラーニング

2.「事例」この記事、AI記者が書きました
 文章生成:どのようなイメージをもっていますか?
 中部経済新聞創刊70周年 人工知能が記事書いた
  →過去記事をあつめて
 アイドルのTwitter代行
  意図を伝えて書かせる
 海外事例
  AIと人間が役割分担
  AI記者の進化が読者を増やし、ニュースルームを効率化する
  1つのデータソースでマルチユース
 日経のAI記者 10秒でまとめる

・共通する特徴
  (1)データから記事生成:データに入っていない記事は書けない
  (2)速報に適している
  (3)記事を構成する文をパターンで表現できる

Q&A:
 著作権は?
 IoTデータは誰が買うの?


3.「方法」文章生成はこんな仕組み

 文章生成を試してみたことがある人
  Sec2Secのチャットボット:意味がない

・ポイント
(1)書きたい内容の文をどのようにAIに生成してもらうか
(2)作成された記事候補の評価


・(1)書きたい内容の文をどのようにAIに生成してもらうか
 複数のフォーマット変換
 試合数:機械学習によってはデータ不足になる

 タグ情報をデータから抽出
  1.データ抽出
  2.タグ抽出
  3.文章の生成
  4.記事OUT

 マルコフ連鎖
 RNN,LSTM
 極大部分文字列:「接戦を制した」→ノードにする
 最初の単語だけで、書きたい文の内容は指示できない

 ワードサラダ

 タグを指定したうえで、文章生成

 Sec2Secでも、入力にタグ情報を入れる方法ある

 タグをベースにする→タグを定義
 学習できない場合→人手で定義 定義を書く

 起承転結の4つのブロック
 →何万通りの中から、どれがいいか選ぶ

(2)作成された記事候補の評価
 電通のAIコピーライター「AICO]、その実力はいかに?
 実は書くことよりも、記事を評価できることのほうが重要ではないのか?
 →GANモデルみたいなの

・まとめ
 限定的な分野とテンプレ的な記事であれば、学習や評価に手を書けることによって
 AI記者が活躍できる

・Q&A
 キャッチコピー、広告は自動生成している
 化粧品を買いたい女性の気持ち:60種類しかない
 ユーザーにぶつけてみる:会員にメール→15分ぐらいでわかる
 
 →プログラムベースでできる。で、AIにする必要は?

・人間が理解できる文章のパターンは、決まっている
 ディープラーニングにする必要はないのでは?

・アテンション

・意味的な間違いをどれくらい指摘できる?

■学校からのアナウンス
・大学院説明会
・次回は11月17日




【所感を追加:Q&Aについて】

・著作権の問題
 「著作権法47条の7」を適用しているんだと思う。詳しくは
コラム:機械学習パラダイス(上野達弘)
http://rclip.jp/2017/09/09/201708column/


・キャッチコピー、広告は自動生成している
 ルールが見つかれば、ルールベースのほうが早い。
 質問者の場合は、化粧品・通販で、ターゲット女性と絞られているので、
 場面が少なく、そのためルールが見つけやすい

 一般に記事は、女性だけでなく、男性も読み、
 それが家庭で読む場合、学校で読む場合、会社で読む場合・・・など、いろいろなケースがある
 これらのケースを詳細化し、組み合わせを考えて場面を形成し、
 各場面のルールを導こうとすると、組合せ爆発する。

 ところが、読者と、読むケースというのは、昨日と今日で、そんなに変わらない。
 そこで、そういう詳細化による分析をしないで、
 どうも、こういうときに、これが受けるらしいというのがわかれば、
 それを使ったほうがいいことになる。これができる技術が機械学習。

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« FinTechがもたらすイノベー... | トップ | Javaのリリース方法とバージ... »
最新の画像もっと見る

Weblog」カテゴリの最新記事