ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

トレジャーデータ日本進出

2013-05-21 18:40:31 | AI・BigData
ビッグデータ界に、「黒い目をした外国企業」が、とうとう参入!

オールインワン型のクラウド型ビッグデータサービス
クックパッドや博報堂も愛用中!トレジャーデータ日本進出
http://ascii.jp/elem/000/000/790/790038/

博報堂は、トレジャーデータさんなんですか。

電通は、富士通さんと協業しますよね

富士通と電通、ビッグデータを活用したマーケティング領域の事業で協業
クラウドサービスの活用により、企業のマーケティング活動を革新
http://pr.fujitsu.com/jp/news/2013/05/16.html?nw=pr


富士通と、トレジャーデータ。
トレジャーデータが勝ったら、富士通涙目ですよね(^^;)


  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ビッグデータには、3段階あると思う。日本のSIerは、一番儲かる部分をやってないよね!

2013-05-21 15:50:41 | AI・BigData
唐突ですが、ビッグデータには、3段階あるとおもうんです。
前に2種類と書いたが、後者のほうがさらに2段階に別れる)
レベル低いほうから

第一段階(BIによる予想)
 BIツールを使って、データを可視化、BIキューブによるスライシング・ダイシング・ドリル(ドリルダウン・アップ)を行う。データはETLツールを使う。現場でのデータ活用としては直感的で有効、将来データについては、直感的に予想することになる。

第二段階(統計と機械学習による予測)
 ビッグデータを統計的に解析し、重回帰、機械学習(SVM等)によって予測していく。
 基本的に、相関を求めるのであって、
 潜在因子については、せいぜい因子分析程度の一つ奥の潜在因子を調べる程度
 表面的な現象を中心に予測する。

 そのため、現在の環境が変化した場合、使えないリスクもある。


第三段階(SEM,ベイズ・シミュレーションを利用した未来の創造)
 データから、潜在的因子を見つけ出し、その心の奥に潜んだ心理的構造に迫る。
 この心理的構造を解明し、潜在的な心のニーズ、満たされない欲望に対し、
 「あなたの気持ちをわしづかみ!」にする商品、サービスを出していく。
 そしてシミュレーション(マルチエージェントなど)によって、
 それらのサービス、商品の有効性を確認していく。
 未来の創造のためにビッグデータを使う

注意したいのは、この3段階は、使っている理論の難しさ、複雑さであって、
儲かるかどうかという話ではない。

第一段階は、現場に直結する。なので、すぐに効果が(でるものなら)でる。

第二段階は、データサイエンティストか、マーケティング部が中心となる。
 現場直結ではないので、利益の出るタイミングは遅れる

第三段階は、マーケティング部が新製品開発を行うのに有効となる
 新製品が出る前、効果が現れないこともあるが、
 新製品が当たれば、利益はでかい!


SIerの人たちが、今扱っているのは、
 第一段階は、BI・OLAPツールとして
 第二段階が、いわゆるビッグデータとして最近売り出している。
  ただ、「ビッグデータ解析」といえばRということからわかるように、
  第三段階には、いたっていない。

  その根拠だが、第三段階のSEM(共分散構造分析)をRで行うのは、
 めんどうくさすぎる。
  つまり、SEMなど、潜在因子を扱うには、パス図を書いたりすることが必要になってくるのだが、
この図が、Rでは、異様に書きにくいのだ
 ってか、コマンドラインで図のデータは入れにくいだろ、JK

 で、たとえば、共分散構造分析だと、この図が書きやすいのが、SPSSのAMOS

 そうSPSS

 そう、IBMが買収した会社(^^)v

 ・・・日本は・・・ここまで、行ってないってことだね、
 Rで話が付くということは・・・




 今、大学等で研究が進んでいるのが、第三段階の、潜在因子の構造分析とシミュレーション、
観測されないデータを説明する結晶化などなのだが、ここまでは、日本のSIerは、行っていない
可能性がある。IBMが、共分散構造分析を意識してSPSSを買収したとすれば、IBMは、
第三段階を意識しているのかもしれない。

 そして、第一段階、第二段階だけでは、市場全体としてはパイが大きくならないので、
 ゼロサムであり、ビッグデータ市場にも限界があることは、

「インフラエンジニア」は最強の職種である-データサイエンティストではなく
http://blog.goo.ne.jp/xmldtp/e/68fb22cd16168f0f335ef01154324f4f

 で示したとおり。

 第三段階まで行かないと、ビジネスとしては限界が来るのだが、
 日本のSierはその段階にいたっていないのだ・・

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

パターンの理論的な発見法としてのグラウンデッド・セオリー

2013-05-21 12:32:34 | トピックス
鷲崎先生のつぶやき
https://twitter.com/Hiro_Washi/status/336202237984526338



チームワークに対するGrounded Theoryによる分析。最近、Grounded Theoryの適用をよく見かけるなあと思ったら、そういえばXP2013での論文でした(対象は全くことなりますが)http://xp2013.org/program/academic/perspectives-on-productivity-and-delays-in-large-scale-agile-projects/

というのがあった。
鷲崎先生といえば、パターンだけど、
パターンの理論的な発見法として、グラウンデッド・セオリーは有効だと思う。




パターンは、帰納的ではあるのだけど、パターンを「見出す」という点では、仮説導出に近い。
仮説導出の手法は、主に教育、介護、看護などの世界で、グラウンデッドセオリーが使われる。

グラウンデッドセオリーは、Wikipediaによれは(赤字の部分引用

1.分析したいものをよく読み十分に理解し、観察結果やインタビュー結果などを文字にして文章(テキスト、データ)を作る。

2.データへの個人的な思い入れなどは排除し、できるだけ客観的に、文章を細かく分断する。

3.分断した後の文章の、各部分のみを読み、内容を適切に表現する簡潔なラベル(あるいは数字、コード)をつける。このラベルは、抽象度が低い、なるべく具体的な概念名とする。

4.次に、似たラベル同士はまとめ、上位概念となるカテゴリーを作り名前をつける。これらの作業を「オープン・コーディング」という。

5.ある1つのカテゴリーと複数のサブカテゴリーを関連付け、現象を表現する。サブカテゴリーとは現象について、いつ、どこで、どんなふうに、なぜ等を説明するものである。これらの作業を「アクチュアル・コーディング」という。

6.アクチュアル・コーディングでつくった現象を集め、カテゴリー同士を関係づける。これが、社会現象を説明する理論となる。

*注:上記説明はWikipediaによる、一般的なグラウンデッドセオリーの方法で、このほかに、木下先生による、M-GTAがある。こっちのほうが、判りやすい本がでているので、やりやすい。


 システム開発の個々・具体的な内容・記録の文章を細分化し、まとめたり、まぜまぜして、最終的に仮説を作る。この仮説が、いろいろな開発で利用できるのであれば、パターンとなっていくと思う。

 ここまでの流れが、ちゃんと理論化されているのが、グラウンデッド・セオリーってことになる。




 ただ、日本では、そもそも、開発現場を社会学的に観察して、法則化したりしていない。
 (エスノメソトロジーは、要求工学で使われるのであって、開発現場をエスノメソトロジーを使って観察した論文は、あまり見当たらない)
 そのため、グラウンデッドセオリーを利用することも「日本のソフトウェア工学では」すくない(IEEE Xploreで Grounded Theory と引くとわかるけど、海外では、よく使われる)。
 なので、開発現場から理論的に仮説を出してくることもあまりないわけだ。
 その結果、パターンは、ヒューリスティックに作られ、データに基づいたものには、なりにくい。
 こうなると、パターンは根拠を明示しにくいので、パターンの論文は、パターンを中心に扱う学会のみで議論され、一般の論文誌には通しにくいと思う。

 グラウンデッドセオリーからパターンが導かれ、それが、論文誌で通るようになると、かなり現場と近いものが、アカデミックでも扱えるようになる。
 昨日「大学のソフトウェア工学の授業が、なぜ役立たないか、わかった!」で書いたように、大学では概念を扱っているが、現場から仮説導出することはない。この現場のケースからの仮説導出ができるようになると、(パターンだけでなく)日本のソフトウェア工学も代わってくると思う。



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

”SDNツールを呉越同舟で開発へ「OpenDaylight」・・・”って、何?

2013-05-21 10:00:47 | ネットワーク
今、別件で資料探してて(その資料は見つかった)、
そのとき、ふと開いたら、
日経コンピューター 2013年5月2日号(いまのより1つ前の号)
の12ページに

SDN用ツールを呉越同舟で開発へ
「OpenDaylight」プロジェクトが始動

ってあったんだけど、これ、なに?

見てみましょう。

Open daylight
http://www.opendaylight.org/

(以下太字は上記サイトより引用)
どうもLinuxファンデーションによる、
オープンソースの

a common, robust Software-Defined Networking platform

をつくるという話らしい。

How To Participate
http://www.opendaylight.org/developers/how-participate

から、メーリングリスト、Wiki、Getting Start Guideにいける
リンクが見える

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする