ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

セマンティックコンピューティング研究開発機構のシンポにいってきた

2013-06-26 19:06:34 | トピックス
ISeC(あいせっく:セマンティックコンピューティング研究開発機構)の

言葉を作り、知を創る
グローバル化時代とビッグデータ化時代の情報技術
ISeC10周年記念シンポジウム

にいってきた!その内容をメモメモ



■情報基盤技術としての日本発セマンティック技術を目指す

・Making Big Data Smarter!
 SEMANTIC TECHNOLOGY & BUSINESS
 コンファレンス スローガン

 セマンティックコンピューティングコンファレンス

・セマンティック・テクノロジー
 表層的処理、計算を超えて

・セマンティック技術の現状
  多くの領域で関心
  部分的でアドホック
  将来に向けて件子な共通基盤必要
  自然言語は意味を表現、伝達するのに重要
  意味を扱うセマンティック技術の中核
  人間と共にコンピューターがあるレベルで意味を理解しあう

・Google セマンティックサーチ
  Knowledge Graph
  GoogleはFreeBaseという会社を2010年に買っている

・IBM ワトソン Jeopardyで勝った
  Webからのマイニング
   →目的思考:ほかに応用するには、別の知識

・ISeCのアプローチ
  セマンティック計算の基盤として、人間とともに
  コンピューターでも意味がわかる共通言語
   CDL Concept Description Language)

・中粒度を単位とする構造化言語
 1.単語の粒度をノードとして関係を結ぶ
    UNL
    CDL

 2.談話ユニットをノード
   構造化言語
   図式言語:セマンティックオーサリング
   直接的記述

・セマンティックWebあるいはLODとの違い
  三つ組み構造であらわす:関係-応用領域ごとに違う
   →オントロジーマッピングが難しい

  ISeC:自然言語にリンク
   →マッピングがいらない

・機械翻訳
  トランスファー
  ピボット:中間言語(ピボットランゲージ)を使う
    →UNL→CDL
       CWL
・W3CでCWL:活動中止してしまっている
  →英語の国は、関心うすい

・CDL:44個の関係:十分か証明できないけど、経験上十分
・セマンティックロール(英語に依存)

・意味
 表層に近いレベル

・町田健の共通言語論
  言語構造基礎論 文の意味と構造
  言語世界地図

・グローバル化時代における日本発情報基盤技術の重要性
  クラウド、巨大データベース・・・アメリカ強い
  英語国は感心少ないので日本貢献する可能性

・CDL
  人手コーディング、編集
  自動化:デペンデンシーアナライズ 87%

・半自動
  WSD:デモ

・セマンティックサーチ
  意味が近い部分グラフを出す
   →RDBになおすと早い




■ISeC技術の構造
横井俊夫氏

ISeC技術のアプローチ
 言葉からの知へのアプローチ

 2つのアプローチあり
  Xビッグデータ、マイニング 
  ○言葉を作るというアプローチ
   →合成的にアプローチ

 「言葉を作る」というアプローチ
  (1)明晰に書き表し、正確に読み取る
  (2)効率よく検索でき、必要な情報へと効率的に変換
  (3)翻訳
  (4)マルチモーダルメディア
  (5)処理・理解の仕組み

・要素技術の構造

人間側
  知のコミュニケーションメディア
    テキスト知の構造化技術
    間テキスト知の構造化技術
機械側
  知の処理理解プラットフォーム
    事象・事物
    事象間
    行為

役割分担
  知のコミュニケーションメディア
    構造化言語
    利子基地図
  知の処理理解プラットフォーム
    UNL
    図式言語
    プロセス型知識

それぞれ独自の技術
 UNL
   グローバルに知を共有化
   知識処理のためのコンピューターへのインターフェース言語
   →コンピューター用の言語。人は母語で話す
     生成技術

 構造化言語
  情報の伝達構造(談話構造を含む)に基づいて構造化をデザインされた言語
  構造化テキストを読むと通常の言葉に

 図式言語
  セマンティックWebのオントロジー技術
  →セマンティックオーサリング

 知識地図
  共時的な関連図(マップ)と通時的な変遷図(シナリオ)がある

 プロセス型知識
  プロセス文書におけるプロセス知の理解処理を行うシステム環境を構成



■UNL 知を共有化するe国際共通技術
 内田氏


知識創造:コンピューターのための言語
 人間がやるのと同じことができる言語
 機械翻訳より、多言語処理(機械翻訳も含まれる)
 図、テーブル形式

UNL
1996年 国連大学
  26の言語
2001 UNDL財団に開発を移管

UNL
人工言語:ハイパーノードをもつ意味ネットワーク
   ノード:概念
   アーク:概念間の関係
   ノードは属性子で注釈される
構成
   語彙
   構文
   意味

UNLではどのように情報を表現するのか
  情報を客観と主観に分けて表現
  客観的情報はUWとリレーションで表現
リレーション:42くらい
アトリビュート
  時制など
UW:一番重要。概念を表す
  フォーマルに言葉の意味を定義
  あいまい性があるときは、上位概念や格関係を使用して概念を束縛
UNLオントロジー
  UWシステム
  意味的共起関係
  UW定義:意味をUNLで記述→内容検索で推論

UNLエクスプローラー
  Access Online www.undl.org/unlexp/

UNL IMS:テーブルの知識→同じ形で推論

デモ:UNLエクスプローラー

構造化言語
知を構造化する言葉の構造化技術

構造化言語とは
 知の構造化技術の高度化
  ↓
 言葉の構造化技術
  ↓
 ヒトのために構造化をデザイン
  →知のコミュニケーションメディア→構造化言語
  ↓
 構造化はコンピューターのためにも役立つ

知の構造に密着させる
 通常の言語
   →先行する音声言語→線状化言語
  ↓
 知の操作
   →四次元と1次元の相互作用
  ↓
 大きすぎる変換の距離
   →不確定不安定不明瞭
   →低機能で非効率
  ↓
 距離をちじめる
   ↓知の構造に密着
 対象分野ごとの専用メディア
   ↓
 汎用メディア
   →構造化言語

構造化すべき構造とは
  言語における情報の表現機能
   →言語化に関する汎用性
  言語のもうひとつの機能→伝達機能

  情報伝達機能の構造化

  情報伝達構造を構造化する

情報伝達機能
  質問応答構造:3つのもので構成
   対象
   問い
   答え
    2種類
     事物ー事象間
     事象ー事象間

  参照構造

  範囲構造

言語学の知見との対照
  整合性と結束性
  結束性表現
  文章理解過程における予測
  文の断続関係
  断続関係表現

構造化言語の表記法(以下を具体的な図で表現)

  質問応答構造
    <対象>-<問い>-<答え>
    ノード4種類
     ブロック化
     グループ化
     トピックノード
     ブレインノード

  参照構造が導入された構造化テキスト
  事象間関係を問う質問応答構造
  情報伝達構造によって構造化されたテキスト

構造化テキストを読む
  連体修飾形式に読む
  複文形式に読む
  連文形式に読む(文をきる)

線状化テキストの明晰性
 (1)構造化テキストとして明晰
 (2)線状化によって非明晰さが生じない

構造化テキストの伝達様式とテキスト例
(1)印象深さ重視
(2)正確さ重視
(3)厳格さ重視

英文構造化を和文構造化に翻訳

これからの展開
 構造化言語として
  (1)構造化クレーム(あらたなパテントマップ)への普及
  (2)明晰日本語ライティングのためのマニュアル作成
 ISeC技術として
  (1)プラットフォーム技術との連携
     ・構造化UNL
  (2)ライティング環境の整備
     ・構造化テキストのエディタ





■図式言語-セマンティックオーサリング-
橋田氏@産総研

セマンティックオーサリング
・オントロジーに基づくコンテンツ作成
  ・オントロジーで定義されたクラスと関係(属性)
   のインスタンスとしてのノードとリンクからグラフを作る

 グラフに基づく発想支援
   マインドマップなど

 グラフがいい
   グラフはわかりやすい
     論理構造がすぐわかる→加工が容易:要約
   グラフは作りやすい
   グラフは質が高い(和歌山大 八木下ら1998)
     見落としが少ない
     考えが深まる(推論連鎖長い)

談話グラフ
  ノード
  リンク:20から40個程度
 →連結グラフにならないと腑に落ちない

共同セマンティックオーサリング
 オントロジーに基づくグループウェア
   グラフの共同編集
   セマンティック

従来のサービスの比較
  従来のメールやSNS
   時間とともにながれていってしまう
   ビッグデータの源泉
  共同セマンティックオーサリング
   半永久的
   ビッグデータの生成を防止

assemblogue
 共同セマンティックオーサリングのSNS
 分散SNS
  各利用者のコンテンツはPLRにより本人管理
 PLRとともにアセンブローグ(株)が提供
 →ユーザーが管理:大学などでもできる

PLR
 パーソナルなデータをほかの事業者に管理させる
  Dropboxなど

集められないビッグデータ
 個人の全データを集められるのは本人だけ
  Googleでさえ個人の医療データを集められない
 個人データを集中管理するのではなく、必要なデータを
 随時アクセス可能にしておく
  各個人が本人のデータをPRLで管理

プライバシーのリスクと通信の秘密に関する懸念
  個人情報の漏洩
  検閲や言論統制:アメリカでも

グラフを見せないセマンティックオーサリング(SA)
  意味的スペルチェッカー
    テキストの意味構造
    木構造テキスト:単文または名詞句

ヘルスケアデータ連携
  地域の医療機関同士のデータ連携:現在7000億円!
  オントロジーに基づくデータ連携    

技術的課題
  ・照応、共参照の扱い
  ・提示(プレゼン)
  ・ビジネス・サービスのモデル



■知識地図  知のダイナミズムを捕らえるマップ化・シナリオ化技術


・FGCS出発点の問題意識
・1990年にいたるシナリオ
   第五世代コンピューター
    日本:ハードウェアとDRAM
       電電公社民営化→配当が政府へ→基盤センター
・ITサービス、ビジネスモデルとアーキテクチャ
  この絵はシナリオ:時間軸がある

・抽象から具体はない

テレコムとITプラットフォーム
  マップ形式

ICTサービス・家電、プラットフォーム戦略地図
  みんな、図の感じが違う

ITシナリオ俯瞰図

・テキストとして記述される事柄概念を地形図メタファー
 に基づいて地図として構造化し、地図の変遷を
 タイムチャート上にシナリオ状に構造化したのが知識地図

・知識地図、シナリオ図

・知識地図のよる戦略企画の全体像

  社会シナリオ
  技術シナリオ
  自社固有の条件→近未来(未来の断面図)
  業界シナリオ
  隣接業界シナリオ
   ↓
   知識地図(スナップショット、断面図)

・書き方について
 すごい勢いでいったので省略



■プロセス型知識の抽出と活用

言語知を抽出する技術

モデルができてもシステムできない
  →知識を集める必要

・プロセス型知識
 規格規則
 論理
 政策的戦略的手続き
 プロセス管理

プロセス型知識の特徴
・プロセス知識の特徴
  断片的知識集合
  矛盾の内包
  汎用性とあいまい性
  適用可能性判断の困難性
・問題解決最適プロセス
  目的別動的合成
  環境従属性
  不完全な改善策と妥協

プロセス知識の抽出・活用技術

プロセス文書中の文のタイプ
  概念定義
  行為、行為者
  対照、状態
  道具、方法
  時間、場所
  関係
  状態遷移

プロセス知識記述モデル
 ハイパーグラフモデル
  行為節点
  状態節点
  状態遷移リンク
  トリガーリンク
  用語リング
  関係リング
 ハイパー関係

例:IAEA
  用語リンクを消すとわかりやすい

節点・リンクの特徴
  (細かいので省略)

フレーム辞書
  解析するのにつかう
  フレーム型:どういう格助詞がつながるかを書いてある

用語辞書

従来の構文解析意味解釈との違い
 動詞と行為動詞と状態動詞に分解
 さまざまな名詞句に潜む動詞など→明示的に

プロセス知識ベースの活用
・知識発見/プロセスの視覚的支援
・一般知識とその事例の収集管理
  事業の失敗・成功例とイノベーション戦略
・戦略・対策の不完全性、あいまい性、矛盾の発見
・作文支援
・プロセス型知識以外にも適用できる?
  知識の最小単位とその関連
   単文では捕らえられない
   オブジェクトでは広すぎる




このあと討論(省略)

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「スクラム」のはじまりはじまりの、竹内先生・野中先生の論文を読む2

2013-06-26 15:41:19 | トピックス
アジャイルのスクラムについて、その大元となった、竹内先生・野中先生の論文

 The new new product development game
 Hirotaka Takeuchi and Ikujiro Nonaka

が、なぜか、韓国の浦項(ぽはん)工科大学のサイトに落ちていたので、
よんで、まとめてみたメモメモ(直訳ではなく、パワポに落とせるカタチで)

ごめん、きょうが論文の始まり部分。
前回のイタリックの部分は、概要でした(^^;)




はじめに1
新製品開発のルールが変わった
多くの会社は以下のことを見出している
高品質、低価格、競合市場の差別化以上のものがある
スピードと柔軟性
この変化は、新しい製品を販売、利益の源泉としているときに、強調される
例:スリーエム
  700のUSの会社
このスピードと柔軟性の強調は、新製品開発マネージメントの異なるアプローチ
従来;シーケンシャル、リレー競技
例:NASAのPPPシステム
それに変わって:全体的・ラクビーアプローチ
ユニットとして、ボールをパスして
→今日の要求よく満たす
古いアプローチにおいて、製品開発プロセスは、リレー競技のように動く
1つの機能スペシャリストグループがバトンを、次のグループに渡す
フェースごとにプロジェクトがシーケンシャルに動く
概念設計、フィージビリティテスト、製品設計、開発プロセス
パイロットプロダクション、最終的な製品製造
この方式において、機能は、専門化され、セグメント化される
マーケの人:顧客の要求調査・・
R&Dの人:デザイン
製造の人:それを形にする
その他の人:レースのほかのステージでバトンを運ぶ



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SEMATの勉強会にいってきた!

2013-06-26 11:55:20 | トピックス
その内容をメモメモ




1.SEMAT Japan Chapter紹介
鷲崎先生

SEMAT
・2009年9月創設
  ・カーネルを読んでる人:ほとんど
・開発手法、プラクティスと理論を結びつける
・SEMAT作った人
 ヤコブソンさん:ユースケース
 メイヤーさん:契約による設計
 リチャードソーリー:OMGの代表
・めざすところ
 カーネルと記述言語
 コミニティ ICSE(いくしー)併設WS、地域支部
・日本で言った人(設立メンバー)
  鷲崎先生:
   現場とアカデミアが手を携え、理論的基礎を
  平鍋さん:
   アジャイルを日本に。
   アジャイルはコンテキスト重要→現場の言葉
  川口さん(楽天):
   アジャイル、スクラム
   よいエンジニアの共通言語探し
  久保秋さん(アフレル)
   もともとは組み込み
   人間がやらなくていいことは、自動化
   モデルと実装をつなぐ技術
  森崎先生(静岡大学)
   SEMATカーネル
   課題を共有する場
  高橋さん(YAHOO)
   鷲崎先生と似てるので割愛
・活動:SEMATのアイデアの啓蒙、検証、拡張

SEMATとは(背景的なところ)
・ヤコブソンさんの歴史
  Unified Process’98
    ユースケース駆動
    反復型
    アーキテクチャ中心

  EssUP’08
    UPの軽量化、アジャイル開発の影響
    プロセスカスタマイズ、カードのアイデア(タンジブルなものに)
    Lv1:カーネル
    Lv2:Essential Practice
      アーキテクチャ、反復、ユースケース、
      コンポーネント、プロダクト
    Lv3:Advanced Practice
      プロダクトライン、アスペクト指向

’09SEMAT行動宣言(行動の呼びかけ)
  署名者を募っている
   →本部のWebサイトにいくと、名前入れれば、署名できる

’10 ビジョン声明
  ソフトウェア開発におきえる共通基盤:カーネル
    シンプルな言語
  カーネルとLangageは、エッセンスとしてOMG
カーネル
  「仕事で扱うこと」と「行うこと」
  カーネルのカードの日本語版ができた!
    →ヤコブソンさんの承認最終段階

Moving Forward:その先へ!
・プラクティス
   カードの使い方とか、ツールとか
・理論
   一般性理論
   プラクティスに特化した研究
・コミニティ
   USは法人つくろうとしている
   Essence本、論文誌特集号

SEMATの基本概念と活用上の留意点
山本先生
・知識体系の体系がいる?
 プリンシプル 3つ
    活動可能性
      従来:ドキュメント中心
      SEMAT:αによる健全な進捗状況
    拡張性
      従来:よい手法を悪い手法で置き換える
    実務性
      従来:プロセスの記述

・α(あるふぁ)
   健全な進行状態を示すのがα
    →ドキュメントがどうなっているかではない
α
・進捗と健全性
・成果の達成、ゴールからつぶしていく
・どのカードから動かすかという選択
  →全域的であり個別的

αカーネル
3つの層
  カスタマー
    機会
    ステークホルダー
  ソリューション
    要求
    ソフトウェアシステム
  エンデバー
    作業
    作業方法
    チーム

カーネルαの状態
 αはライフサイクルを持っている
  (ながい、省略)
  →状態は、個別的に流れるのであろう。

主な図形要素
  α
  状態
  活動空間
  活動
  作業成果物

状態中心の考え方
  →状態が識別できないと・・
  →日本はプロセス中心

最終的には、アクティビティを定義しないといけない

現在のαを認識、将来のαを考えて、プラクティス選択

状態のチェックリストがある

αカード
 α定義カード
 α状態カード

カードだけあれば、可視化できる

留意点
・ソフトウェア開発以外にもSEMATの応用分野
・運用
・活動空間の構成法
・後ろ向きの状態遷移の扱い

要求状態管理モデル
  山本先生の考えをしゃべっていただいているのだが、
  ごめん、わかんなかった(>_<!)

SEMATの活用
・活動の具体化
  プラスティス定義表

プラクティスの作成手順
  メソッドを構成する適切なカーネルαを選択
  必要があれば、下位αを追加
  αに作業成果物を追加
  活動空間をプラクティスで具体化することにより、活動組織化


プラクティス
------------------------------------------
      |  α   |  成果物   |
------------------------------------------
  作業対象|      |        |
      |      |        |
------------------------------------------
      | 活動空間 |  活動 |
------------------------------------------
  作業内容|      |        |
      |      |        |
------------------------------------------

活動空間:目的 活動:手段

活動の支持手順
・チェックポイントを用いて現在の状況を確認
・将来の状態を確認
・将来上体が持つ活動の完了基準を確認
・作業と成果物を具体化することにより活動手順

SEMATのPDCA
 AをAdaptに変えていることが大切

タスクボード
  →αカードの配置で現状を可視化

ガバナンス・フレームワーク
  倫理が必要

SEMATカーネルの拡張次元
  詳細化
  適用化
  大規模化

留意点
・状態とその達成条件の明確な定義
・プロセス中心から、状態中心の思考への転換

SEMATと保証ケース
・保証ケース(アシュアランスケース)の説明
 http://www.dependable-os.net/tech/D-CaseEditor/

・SEMATカーネルと保証ケース
  補完できる?
 αを保証ケースで
 リスク分析活動-リスクα状態のチェックリスト

 ・・・ごめん、あたまとんだ・・・
 ???よくわからん???

語彙のオントロジーを作っていこうとしている

キャンプ表明
・ソフトウェア工学の課題
・現場の課題

強粘着でないので、壁に貼ったら大変なことに!
  →机の上に近いものをおいていく。
   クラウドソーシングで
 結果はFacebookで!

カテゴリー
・スキル系:伝わらない
・ステークホルダー
・理解が伝わらない
・意識が低い
・コミュニケーション
・プロセス/手法
・テスト・品質
・アカデミアと現場の乖離
・開発ツール
・KKD
・契約とビジネス
・エンジニリングと契約のギャップ
・目的と手段
(鷲崎先生がきれいにまとめてくれたんだけど、
 それ、うつしてない・・・ごめん)


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

6月25日(火)のつぶやき

2013-06-26 04:35:37 | ネットワーク

「グーグルの従業員からホームレスへ-シリコンバレーに広がる貧困」 goo.gl/tx6GJ

1 件 リツイートされました


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする