ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

マイクロソフトが分析ツールに本気だしたら、ベンチャなんて一気につぶれる

2014-04-22 19:32:29 | Weblog
4月18日に行ってきた、

Microsoft SQL Server2014 発売記念フォーラム
ビジネス成長を支えるデータ基盤とビッグデータ活用

のメモメモ、まずは、

一億総データサイエンティスト時代に向けて

について




・マイクロソフトが分析ツールに本気だしたら、
 ベンチャなんて一気につぶれる

・マイクロソフト→パソコンがある世界
  2000年:PC50%超える
  →統計学でデータ解析

・医学部で統計学が必要な理由
  根拠に基づく医療
 経験と勘→もんだいだよね!と80年代から知られる
   心筋梗塞→不整脈
    不整脈の薬、どれがいいかを調べたい
    →プラセボをしらべたら・・プラセボのほうがいいじゃん(>_<!)
   意外と人間の反応複雑・・・

  エビデンスド・ベースド・マネジメント

・医学における統計学
  何によって死ぬ?→がんが多い 集計だけでわかる
  減らすアイデア:喫煙、野菜不足、過剰塩分(生活習慣病)
    →ただしい知識だけでは。。。
  行動科学:心理、環境
    寿命の延び:塩分摂取量変わった→冷蔵庫
    たばこ:反抗心→きみたちが
      戦略さをひっくり返せる
        →ソーシャルマーケティング:フィリップことラー
  Hal varian(2009)
   10年
   データサイエンティスト→統計家といっている!!

・さいえんてぃすと
  暗闇からはじめちゃだめ
  →先人があけてくれている穴を探す
   いろんな人が別々に・・・つながる!
・データ分析者の必読書
  Research Design

・リサーチデザインを知らないと
 わが社のデータを分析したいんですが
  なるほど、あなたの仮説を教えてください

・仮説指向の限界
   多くのデータがあるのに、仮説の部分しか見ていない
   YESかNOかに頭が反応→上司がいうと、引っ込めなくちゃならない

・かつては正しかった理由
   パンチカードの時代
   いまはすべてできる

・仮説ではなく、問いを
   オープンクエスチョン
   具体的
     解析単位 :望ましさを比べる単位
     アウトカム:望ましさを具体的に定義
     説明変数 :望ましさを左右しうる特徴
  分析→基本的に比較

・分析方針は比較軸→望ましいものと望ましくないものの比較軸

・アウトカム(成果)を重視
   アウトプット:中間結果でも。。
   アウトカム:ゴールに対して

・アウトカムの定石
 ブランドイメージ→利益:わからない

・解析単位の定石

・仮説ではなく説明変数を

・ECサイトのログ解析を例に

・全ての説明変数を多変量解析

・分析結果からアクションへ
  動かせないアウトカム→動かし得る説明変数:相手を変える
  動かせないアウトカム→動かせない説明変数:狙いをずらす
  動かせないアウトカム→動かない説明変数*
              →制御下にある説明変数:最適化
 *季節、天候など

・今、自分が行っていること
  一番低い人に合う
  すごいお金をかけても、迷惑メールに

・世界史上最も統計学で儲けた国
  日本:「KAIZEN]
   →デミング
 デミング以前の日本の工業
   GHQ:電話不安定すぎ
    →セミナー→かいぜん

・If Japan Can... Why Can't We?
  1つは数学能力高かった
    塵劫記:1627年に吉田光由で執筆
  もうひとつの答え:QC7つ道具
    管理図、パレート図・・・
   意味のある視覚化
   型をきめて体で覚える
   現場レベルで全員が迅速に

まとめ
 科学の型を利用しよう
 仮説ではなくオープンな問いを
 データとサイエンスが当たり前の国へ




このあと、

本気で始めるクラウド&ビッグデータ活用

ということで、デモ中心のセッションがあった。

こんなかんじ

--------------------

ビッグデータの活用
マイクロソフトのビッグデータ活用ビジョン
・ビッグデータの民主化
  非構造化、構造化データ SQL Server
  使うには:Office365・・・

・活用例
  流動人口データ解析:Agoop
  スマホアプリログ解析:ビデオリサーチインタラクティブ
  SNS分析サービス:ジー・サーチ
  生産情報の見える化:マイスター

・デモ1
 POWER BI
 Power Map
   ヒートマップ
   棒グラフ
  →コーディングいらない
 池袋駅前

・でも2
 消費者スマホ利用行動分析
  ぱずどら、Lineつよし
 ゲームユーザー、30台以上は女性つよし!

・でも3
 Twitterのログ情報をとってきて・・
 気分、感情・・・
 イメージのみ(200件しか取れていない)

・でも4
 Visio
 工程表の上で可視化
 CAD図面
 →壁に出すとか

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

認定情報処理技術者制度(高度の上)について、聞いてきた!

2014-04-22 16:08:34 | Weblog
ぎゃあ、今気づいた!(いままで下書きにしてた!)
ずっと昔4月2日に
SEA Forum:「ソフトウェア技術者資格制度」の是非を考える
を聞いてきたので、その内容をメモメモ




<<話の内容>>
派遣法改正がらみのテーマ
楽にはならない
チカラのある人:資格制度が役に立つのでは・・・
認定情報技術者制度CITP
ITスキル標準レベル4以上
レベル5:課長さんクラス
ソフトウェア技術者の国際標準

資格制度検討のきっかけ
情報技術は魅力ある分野として認識されていない
情報処理技術者はネガティブに 3K
情報技術者の社会的地位が低い
   →プロフェッションの可視化
高度な能力を持つ情報技術者の可視化と社会的地位の向上
   国際標準に準拠した資格制度
   グローバルに通用、国際ルール
プロフェッショナルコミュニティの形成
   ピアレビューによる評価
社会や産業界に対するいっそうの貢献

認定情報技術者制度の意義
 (省略)

日本の情報処理技術者の推移
  日本の技術者219万、うち情報処理技術者89万
  ITベンダー 79万6千人
  利用者側   26万8千人
 高度=30万人(レベル4以上、ハイレベル)

IT人材の質に対する不足感
  →高度IT人材のニーズ
    量に対する過不足感は、短期的な変化の影響を受けやすい

企業における高度IT人材のニーズは大きい

情報処理試験
・ITパスポート、基本情報は下がっている
  →IT人材自身も高度に関心

ISO/IEC 24773:2008
・各種のサーティフィケーション、クオリフィケーションの認定
  サーティフィケーション;更新性があるもの
  クオリフィケーション ;更新性がない
資格制度の評価基準

→こんぱりぞんフレームワーク

ISO/IEC JTC1/SC7/WG20で改訂作業が進行中
情報処理学会からエディタを派遣して改訂作業に参画

IFIPとIP3
  IFIP:日本は情報処理学会
    IP3:高度IT人材資格制度(国際的な相互認証)
    →ISO/IEC24773等に適合
    →IP3の認定取得を通じて

認定情報技術者制度
2本立て
(1)個人認証:個人が書類審査(直接方式)
(2)企業認定:社内資格制度が一定レベル以上であることを保証(間接方式)
    →WG20やIP3でも説明・了解済み

個人認証の審査
・申請者
  知識
    情報処理技術者(高度試験)
  業務実績
    最近の業務2件
  プロフェッショナル活動
・推薦者
  上長から

・企業認定
  書面確認と実地審査
 企業認定基準
   企業内制度における仕組みにかかわる項目
   企業内制度における、資格認証の要件にかかわる項目
 企業認定での企業内人材の資格認定

・スケジュール
  2013年度 個人認証の試行
  2014年度 個人認証(直接方式)の本番運用
    →レベル4から
     企業認定(間接方式)の試行を開始
  2015年度 企業認定(間接方式)の本番運用を開始

・最近の関連トピックス
 IT融合人材育成連絡会
 スキル標準のあり方に関する研究会
 技術士制度の改革

<<パネル討論>>
・よくわかんなくなってきたので省略

  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDNの素朴な疑問:経路が無限ループにならないことって誰が保証するの(STPみたいなの)

2014-04-22 12:49:54 | ネットワーク
昨日、

SDN/Openflowって、こういうことできる?(共通問題と思いついた構成:合ってるか不明)
http://blog.goo.ne.jp/xmldtp/e/bbe4e267b720b7507b9edc375926a7db

を書いていて思ったんだけど・・・

スイッチ間を2本の線で結ぶことがある。
冗長性をもたせるためで、1本が切れても大丈夫なように・・・
しかし、2本の線、両方とも使ってしまうと、
スイッチ間でパケットが無限ループしてしまう。
そこで、2本のうち、1本の線は事実上、使っていない。

L2のスイッチにおいて、このパケットの無限ループを検知しているのが
STP(スパニングツリープロトコル)
スイッチでは、これを作ってくれている。

ちなみに、L3では、RIPのようなディスタンスベクタ型の
場合は、ネットワーク全体の情報を持たない。
OSPFのようなリンクステートではAS内のネットワークリンク
は持つ。しかし、その外はわからない。
そこで、ツリーではなく、TTLで無限ループを避ける。

で、ここで問題。SDNは、この無限ループ防止を誰がどのようにやるの?
SDNコントローラー?自分で無限ループ防止プログラムを書くの?

・・・どうするんだろう・・・

と思って調べたら

シスコのデータセンターファブリック技術の進化
http://gblogs.cisco.com/jp/2014/01/evolution-of-fabric-technology-in-cisco-data-center/

う、おこちゃまなウィリアムのいたずらには、刺激の強すぎる言葉ばかりで・・・
・・・ついていけてない・・・

※自分へのメモ、あとでみる

Cisco Japan Blog
http://gblogs.cisco.com/jp/category/sdn/



  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

高まるインメモリデータベースへの期待

2014-04-22 08:47:47 | Weblog
4月18日に行ってきた、

Microsoft SQL Server2014 発売記念フォーラム
ビジネス成長を支えるデータ基盤とビッグデータ活用

のメモメモ、次は

高まるインメモリデータベースへの期待
~本格化する市場競争と検討時の留意点

について




ITRの紹介/宣伝

概要
 各ベンダ、インメモリDB売る

論点
・企業ITの現状と課題
・国内市場におけるインメモリデータベースの現状と課題
・インメモリ・データベースの選択時の留意点

投資動向に見るIT戦略のトレンド
・2012、2010年度比較
・コスト削減→売上増大
  ・顧客サービス、プライバシー、セキュリティー、ワークスタイル
  ・DB、システムも新しいチャレンジ

企業におけるITシステムの今後のデータ量
・分からない人が割りと多い(2割)
・増えてる
  →情報系(コラボ、コミュニケーション)
   全体的に増えている
・主要なIT動向の重要度指数
  IT基盤の再構築
  ビジネスプロセスかしか
  ナレッジマネジメント
  コンテンツ共有
 →BIGデータ中位、BYODは遅い
 →伸び率はBIGDATAが一番

ビジネス貢献のための迅速なデータ提供
  3V:量、更新頻度、多様性

ビッグデータ活用
  4A:収集、蓄積、分析、活用
 →ためてても、なにもいいことがない

--------------------

インメモリDB 
調査:2013年10月
回答者:200人、

RDBMSの課題
・DWH
 データボリューム
 セキュリティ
 クエリ性能
・OLTP用途
 トランザクション(41.5% 複数回答)
 データボリューム

ERP:データの変化ない?
→売り上げ貢献

インメモリデータベース導入状況
23%は導入、1年以内19%
  →興味ないのは1割のみ
  →一部にインメモリ導入もある

インメモリDBの期待
 クエリ性能の向上、トランザクション、データローディング向上
  →案外忘れられてるのが、データローディング

インメモリデータベースを利用したいアプリケーション
  顧客管理、SFA、データ分析、B2B・・・
  →基幹は皆無、よりフロントのシステム

期待値精度
 OLTP 2~10倍
 DWH 10~50倍
 →1万倍とかいうひと・・システム全体、とくにOLTPではあり得ない

利用したいインメモリDBベンダー
・マイクロソフト
・オラクル
・IBM
・富士通
 →SAPは12%
システムの数では、MSのほうが多い?
 →シェアは金額
良くマイクロソフト1番が出てくる

・SATA,SAS ミリ秒
・フュージョンIOなどのフラッシュストレージ マイクロ病
・DRAM ナノ秒
  →20年間でDRAM1000分の1の価格
   DRAMをストレージに使える
   永続性:DRAMは電源切ったら中のデータとぶ→問題点
   いろんなところにボトルネック:ネットワークとか

利点と課題
・RDBMSの課題I/O性能
  →ハードディスクのシーク/レイテンシー

・これまでの解決策
  より高速なハード(SATA→SAS)
  複数台分散
  インデックス
  メモリへキャッシュする
  フラッシュストレージ
  インメモリデータベース使う

・インメモリデータベースの課題
  DRAM必要(まだ高い)
  専用のIMDBMS

・懸念
  運用管理コストの増加
  ハードウェアコスト
  ソフトウェアコスト
 →新たに用意

・懸念点に対して
  運用コスト
   →現在利用しているRDBMSと互換性たかい
  初期導入コスト
   必要なところ
   TCO
   代替案
     RDBMSチューニング
     ストレージの高速化
     Hadoopの検討

  データ制限:10T

  可用性・耐障害性
    ログ、スナップショット

 問題
 Times TenとOracle DBとの問題
   言語はまったく一緒でない、データタイプの差異

-------------
今後、選択すべきインメモリDBは?

  RDBMSとの互換性→RDBMSとの統合
    開発環境、開発方法、
    既存のアプリ(HANAの高速性能を出すには、置き換え必要だった)
  インメモリ早い。でも高い→どこに使うか

結論
・インメモリDBをどう使うかが重要
  →インメモリかどうかは、意味を持たない
・ビジネス上のメリットをいう





  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする