そもそも、ApacheDrillって何なの？ - 夢とガラクタの集積場

こんにちは。

とりあえずZookeeperの中身をざっと見て、一段落したので次のネタに移ります。
＃中身を一覧化するのは時間がかかるので気長にということで＾＾；

というわけで（？）、最近ビッグデータ／リアルタイム処理に続く
第３の処理形態として語られているApache Drillを見てみます。

とりあえず情報が載っているサイトは下記あたりのようです。

上記のサイトをざっと眺めてみると、こんなことが書かれていました。

・そもそもApache Drillって何か？
→　Google Dremel（GoogleFSとBigTableに保存されている巨大なデータ集合のクェリを高速化）の
　　オープンソース版

・どんなことができるのか？
→　大量に蓄えたデータに対してアドホックに高速なクエリを実行出来る。

・どんな要素があるの？
→　重要な要素としては下記の４つだそうな。

結局何ができるプロダクトかというと、
データを特定の場所にどんどん蓄積していって、
任意のタイミングでその時点のデータに対して高速なクエリを実行可能なプロダクト・・・
ということになりそうです。

GoogleではDremelを用いて様々なデータ集計結果を素早く確認できているそうな。

とりあえず、クラスタが小さい状況でどこまで確認できるかは微妙ですが、
これからソースの場所（実はそもそも公開されていないのかもしれませんが）や
環境構築の方法（まだ無いのかもしれませんが）についてまとめてみようとは思います。