ひしだまの変更履歴

ひしだまHPの更新履歴。
主にTRPGリプレイの元ネタ集、プログラミング技術メモと自作ソフト、好きなゲームや音楽です。

第10回Cassandra勉強会のUstの感想

2010-08-20 22:08:18 | PG(NoSQL)

2010/8/19の第10回Cassandra勉強会
には参加できなかったので(苦笑)、一人遅れて(さびしく)Ust(cassandra-study-10th)を見てみたので、その感想など。
しかしこうやって後からでも勉強会の内容が見られるのはUstのおかげ。ありがたい(笑)


まずは『CassandraとHBaseの比較して入門するNoSQL』。
・おー、@yutuki_rさんの声、かっこいいなw
・KVSはキーと値のみであり、CassandraやHBaseはKVSとは言わない。そうだよねー、自分も改めなきゃ(苦笑)
・列指向DBでは、行キーからカラム・タイムスタンプまでを全部合わせて“キー”。
・@yutuki_rさんが「CAP原理」派だったかw

・HBaseのRS(RegionServer)は分断して少数派になったと判断したら自分で停止する。複数分断したら全員が少数派と判断して全滅する^^;

・CassandraのHintedHandOffは、本来データを保持すべきノードが応答しない時にデータを預かる。HintedHandOffがあるので、クラスターが分断されまくって1ノードになったとしても稼動する。
・回復時のマージで不整合が発生する可能性がある→Cassandra0.7のVectorClockで回避できるかも

HBaseとCassandraの比較図は@yutuki_rさんの得意技だ(笑) この図は良い図だよね。今回自分が認識したのは、
・HBaseは自動分散、Cassandraは手動分散
・CAS操作:Cassandraは0.7から可能

・Cassandraは結果整合性であり、古いデータを返す事がある(クラスターの台数が少なくてもけっこう発生する。これに対しては、「古いデータが返ってきたこと無いよ」という質問も)。
・Cassandraもネットワークによっては応答が遅い。以前の勉強会では10秒くらいかかったこともあると報告されていた。
・HBaseは5ノード以上でないと安定しない(アプリにとって過剰なハードウェアになる可能性がある)。
・HBaseは構成要素が多い(HMaster・RegionServer・ZooKeeper・HDFS)のでクラスターを作るのが大変。

・最も苦手とする機能を作ってみる→地雷原を見つけられる→勉強会の発表のネタが増える
…自分も障害対応は格好のホームページのネタだと思う(爆)

スライドもGoogleグループのCassandra勉強会で公開されているらしいが、このグループには入ってないんだよな~。うーむ^^;
#てーか、Googleのアカウントってどうしてたかな(爆)


次はLucandra(ルサンドラ)とSolandra。
Lucene(ルシーン)のJavaベースの検索エンジンのインデックスをCassandraで管理する。専用のPartitionerを使う。

いろんな種類の検索インデックスを作るので、単純なKVSでなく、Cassandraのような列指向DBの方が向いているということかな?

Solandra
Solr(ソーラー)…Luceneベース
Solandra…Lucandraベース


おっと、togetherもあったのか。→第10回Cassandra勉強会 #cassandrajp #casstudy10th
後で見なければ!



最新の画像もっと見る

2 コメント

コメント日が  古い順  |   新しい順
Unknown (豊月)
2010-08-20 23:53:39
>複数分断したら全員が少数派と判断して全滅する^^;
この件ですが、あくまで連続で分断が起きたら、です。分断が起きるとZK達は多数派、少数派の判断をして生き残った方は分母の数を変更します。
分母が変更された後に再度分断が起きれば無事ですが、分母変更前にまた分断が起きるとまずい事になります
返信する
分断のタイミング (ひしだま)
2010-08-21 20:57:38
あぁ、そういうタイミングの問題なんですね。それは勘違いしていました。ありがとうございます。
返信する

コメントを投稿