9月9日の、AWS Cloud Storage & DB Day 2014に行って来た内容のメモメモ!で、書き忘れていたのがあったので、
きょう、こっそり追加。
AWSおよびパートナーサービスを使った、データの集約および活用設計パターン
あまぞん、荒木氏
データ集約システム構成例
・データ:社内
・外にあるデータ:IoT→どうやって集めるか
データ集約の基本方針
・あらゆるデータの発生源に対応する
既存のアセットを最大限に活かす
AWSのメリットを享受する
AWSのデータ関連サービス
データ
→ストレージ(S3,ぐれーしゃー)
→データベース
→データウェアハウス
→バッチ
→NoSQL
→自動化(データパイプライン)
主力3サービス
S3
オリジナルデータの保存
中間データの保存
ElasticMapReduce
データのバッチ処理
非構造化→構造化
RedShift
ビジネスアナリティクス
SQLアクセス
S3
・非常に耐久性の高いオンラインストレージ
暗号鍵を管理できるようになった
EMR
・Hadoopクラスタのサービス
1時間単位の従量課金
クラスタのサイズを後から変えられる
アルゴリズムによって違う→同じデータを
別のクラスタで処理してA/Bテスト
・終わったら終了
RedShift
・データウェアハウスサービス
運用管理の手間がほぼない
初期費用0、低価格
SQL
エコシステム使える
データロード
・FlyData
・Attunity
・DataSpider
・Talend
違った特色
JDBC/ODBC
S3からのLoadをネイティブで持っている
FlyData Sync For MySQL
バイナリログを吸い出して、S3になげる
トランザクションデータMySQL
統計処理RedShift
BIツールとの連携
JDBC/ODBC
多くのベンダーがつないでくれている
Tableau
→可視化に強いベンダー
ビッグデータのソリューション
スケーラブルにアプローチ
・ビッグデータの一般的なアプローチ
・ビッグデータのストリーム処理
蓄積された過去のデータ
今のデータ
Amazon Kinesis
・フルマネージドなリアルタイムデータ処理
DynamoDB
・高速、予測可能なパフォーマンス
AWSを付き合ったIoTアーキテクチャイメージ
・リアルタイムに流れるデータ処理
・用途によったデータ変換とデータ保存
・ユーザーエクスペリエンス部分
VPC(バーチャルプライベートクラウド)
→デフォルトVPC
専用線をつなぎこむことも
VPC内のシステム構築のために
サブネット:
ログインする必要ないものは、目的別に分けない
ログインする必要のあるものは、細かく分ける
AWSのAPI使用にはインターネット接続が必要
EIP
NATインスタンス
オンプレミス側インターネット船
→AWSのリソースは原則ホスト名
AWS Direct Connect
ポートを用い、専用線
建屋→構内接続
cloud hubのHubとしてのVPC
→AmazonにVPNをあつめる
ネットワークキャリアによる拡張
閉域網へのアクセス手段
LTE,3G,フレッツ
パートナーキャリア
KDDI
NTTコミュニケーション
KUH
Tokaiコミュニケーション
S3へのファイルコピー
バケット
マルチパート
ファイル名の分散
ツール:
attunity cloud beam
ExpeDat Gateway
cloud berry
インスタンスへのファイルコピー:高速
Tsunami UDP
ASTERIA
Skeed
ブロック
AWS StrageGateway
DRBD,DRBD-proxy
DataKeeper
転送先最適化サービス
AWS OFA(オバマ・フォー・アメリカ)
→CloudOptを利用
システム設計
インフラ
データ集約
データ活用
AWS専用線アクセス体験ラボ
受講するトレーニング
VPCダイレクト
トレーニング1 10/2
トレーニング2 10/21
実機ハンズオン 11/5
随時開催
まとめ
データをどこかに保存する AWS
体験ラボ
きょう、こっそり追加。
AWSおよびパートナーサービスを使った、データの集約および活用設計パターン
あまぞん、荒木氏
データ集約システム構成例
・データ:社内
・外にあるデータ:IoT→どうやって集めるか
データ集約の基本方針
・あらゆるデータの発生源に対応する
既存のアセットを最大限に活かす
AWSのメリットを享受する
AWSのデータ関連サービス
データ
→ストレージ(S3,ぐれーしゃー)
→データベース
→データウェアハウス
→バッチ
→NoSQL
→自動化(データパイプライン)
主力3サービス
S3
オリジナルデータの保存
中間データの保存
ElasticMapReduce
データのバッチ処理
非構造化→構造化
RedShift
ビジネスアナリティクス
SQLアクセス
S3
・非常に耐久性の高いオンラインストレージ
暗号鍵を管理できるようになった
EMR
・Hadoopクラスタのサービス
1時間単位の従量課金
クラスタのサイズを後から変えられる
アルゴリズムによって違う→同じデータを
別のクラスタで処理してA/Bテスト
・終わったら終了
RedShift
・データウェアハウスサービス
運用管理の手間がほぼない
初期費用0、低価格
SQL
エコシステム使える
データロード
・FlyData
・Attunity
・DataSpider
・Talend
違った特色
JDBC/ODBC
S3からのLoadをネイティブで持っている
FlyData Sync For MySQL
バイナリログを吸い出して、S3になげる
トランザクションデータMySQL
統計処理RedShift
BIツールとの連携
JDBC/ODBC
多くのベンダーがつないでくれている
Tableau
→可視化に強いベンダー
ビッグデータのソリューション
スケーラブルにアプローチ
・ビッグデータの一般的なアプローチ
・ビッグデータのストリーム処理
蓄積された過去のデータ
今のデータ
Amazon Kinesis
・フルマネージドなリアルタイムデータ処理
DynamoDB
・高速、予測可能なパフォーマンス
AWSを付き合ったIoTアーキテクチャイメージ
・リアルタイムに流れるデータ処理
・用途によったデータ変換とデータ保存
・ユーザーエクスペリエンス部分
VPC(バーチャルプライベートクラウド)
→デフォルトVPC
専用線をつなぎこむことも
VPC内のシステム構築のために
サブネット:
ログインする必要ないものは、目的別に分けない
ログインする必要のあるものは、細かく分ける
AWSのAPI使用にはインターネット接続が必要
EIP
NATインスタンス
オンプレミス側インターネット船
→AWSのリソースは原則ホスト名
AWS Direct Connect
ポートを用い、専用線
建屋→構内接続
cloud hubのHubとしてのVPC
→AmazonにVPNをあつめる
ネットワークキャリアによる拡張
閉域網へのアクセス手段
LTE,3G,フレッツ
パートナーキャリア
KDDI
NTTコミュニケーション
KUH
Tokaiコミュニケーション
S3へのファイルコピー
バケット
マルチパート
ファイル名の分散
ツール:
attunity cloud beam
ExpeDat Gateway
cloud berry
インスタンスへのファイルコピー:高速
Tsunami UDP
ASTERIA
Skeed
ブロック
AWS StrageGateway
DRBD,DRBD-proxy
DataKeeper
転送先最適化サービス
AWS OFA(オバマ・フォー・アメリカ)
→CloudOptを利用
システム設計
インフラ
データ集約
データ活用
AWS専用線アクセス体験ラボ
受講するトレーニング
VPCダイレクト
トレーニング1 10/2
トレーニング2 10/21
実機ハンズオン 11/5
随時開催
まとめ
データをどこかに保存する AWS
体験ラボ