Apache Spark Streamingの論文を読んでみます（１章

Spark

こんにちは。ここ何回かでApache Spark自体の機構は大体わかりました。そのため、今度はApache Sparkを基にしたストリーム処理基盤であるApache Spark Streamingについても確認してみます。読んだ論文は以下です。「Discretized Streams: A Fault-Tolerant…

2013-09-24

Resilient Distributed Datasetsに関する論文まとめ（１章〜５章

Spark

こんにちは。Resilient Distributed Datasetsに関する論文「Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing」（http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf）について、概念と動作概…

2013-09-23

Resilient Distributed Datasetsに関する論文を読んでみます（５章

Spark

以下論文を読んでみようの続きで、今回は第５章です。「Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing」（http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf）内容としては、「Implementati…

2013-09-17

Resilient Distributed Datasetsに関する論文を読んでみます（４章

Spark

こんにちは。以下論文を読んでみようの続きで、今回は第４章です。「Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing」（http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf）内容としては、「…

2013-09-16

Resilient Distributed Datasetsに関する論文を読んでみます（３章

Spark

こんにちは。以下論文を読んでみようの続きで、今回は第章です。「Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing」（http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf）内容としては、「Sp…

2013-09-11

Resilient Distributed Datasetsに関する論文を読んでみます（２章

Spark

こんにちは。以下論文を読んでみようの続きで、今回は第２章です。「Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing」（http://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf）内容としては、「…

2013-09-09

SpringXD＝リアルタイム解析やバッチ処理同士をつなぐ汎用、分散、拡張可能なデータ統合基盤？

SpringXD

こんにちは。最近色々手を出し過ぎな気もしますが、気になったものがあったのでちとまとめてみます。それは、Spring XDです。 http://www.springsource.org/spring-xdぱっとトップページを見てみるとやたらと使えそうに見えたので、実際にチュートリアルを…

2013-09-08

Resilient Distributed Datasetsに関する論文を読んでみます（１章

Spark

こんにちは。前回、前々回でApache Spark、Spark Streamingの概要がわかりました。ですが、内部で使用している共有分散メモリ機構であるResilient Distributed Datasets(RDDs)が鍵となる割に概要しか資料からはわからなかったため、論文を読むことでもう一…

2013-09-02

Apache Spark Streaming＝大規模準リアルタイムストリーム処理？

Spark

こんにちは。Sparkについて調べてみよう企画第２段（？）です。１回目はまずSparkとは何かの概要資料を確認してみました。その先はRDDの構造を説明している論文と、後Spark Streamingというストリーム処理基盤の資料がありました。とりあえず、そんなわけ…

2013-09-01

Apache Sparkってどんなものか見てみる（その１

Spark

こんにちは。Kafkaを試している最中で微妙ですが、最近使えるのかなぁ、と情報を集めているのが「Apache Spark」です。MapReduceと同じく分散並行処理を行う基盤なのですが、MapReduceよりも数十倍速いとかの情報があります。・・・んな阿呆な、とも思った…

2013-08-25

VMWare ESXi 5.1update1をIntel マザボのPCにインストールした記録

VMWare

こんにちは。最近Stormで複数のバージョンを確認する等１台のマシンでは不便で仕方がない状態になってきたため、「Vagrant-Vsphere」を使ってこのあたりの環境をお手軽に管理しようと思い立ち、家でサーバ用途として使っていたマシンにVMWare ESXi 5.1upda…

2013-08-20

StormのMLで流れていた情報まとめ（2013/07〜2013/08）

Storm

こんにちは。情報が確定では無かったり、内部の話になってすぐどうという話ではない情報をちょくちょくMLから拾ってきていますが、このまま死蔵するのも何なので、記事として残しておきます。・・・さすがに、最近は新規の情報は減ってきたのでペースは以…

2013-08-18

StormのMasterSourceをビルドしてみる

Storm

こんにちは。最近外を移動する際に日陰を移動できるルートを確認しながら移動する癖がつきつつある今日この頃です。別に日光に当たったからと言って黄色い汁になって溶けてしまったりはしないんですが、まぁ一応ｗさて、前回Storm0.8.2系のビルド手順を確…

2013-08-13

Clojure勉強日記（その２８　データ型（その２

Clojure

前回はまって１回では終わりませんでしたが、続けます。前回データ型を定義して動くことが確認できたので、今回は実際の中身を実装してみる形になりますね。まず、実際にCryptoFilterの中身を実装したコードが以下のようになりました。 src/reader/crypto.c…

2013-08-11

Storm0.8.2をビルドしてみる

Storm

こんにちは。ここ数日暑過ぎて半分溶けている感覚がする今日この頃です。溶ける・・・とは全く関係ないのですが、最近Stormのコア側に一部修正を入れて試してみたいことがあったので、ビルドをした時の手順をまとめてみます。対象バージョンはまずは現状の…

2013-08-09

Clojure勉強日記（その２７データ型（その１

Clojure

徐々に抽象度・・・というか単体では動かしにくいコードが揃ってきましたが、とりあえず続けます。前回はプロトコルを使って既存の型に新たなメソッドを追加する方法を見てきました。次は、Clojureで新たな型を作りたくなったらどうするか？を実現する「デ…

2013-08-04

Apache Kafkaを動かしてみる

Kafka

こんにちは。これまで以下のような記事で実際にKafkaとは何か、や実際にビルドしてみていまいちうまくいかないとかを繰り返してきましたが、本家サイト側でついに最新版である0.8.0（β）のバイナリリリースが公開されたということもあり、実際に環境を構…

2013-08-02

Clojure勉強日記（その２６インタフェース／プロトコル

Clojure

1.インタフェース Javaの場合前回の投稿のようなケースをどうするかというとインタフェースを切って、実装クラスを追加することで拡張する方式を取ります。インタフェースは以下のような利点があります。実体クラスは複数のインタフェースを実装することが…

2013-07-11

Clojure勉強日記（その２５抽象化に向けたプログラミング

Clojure

こんにちは。今回からまた話題が変わります。「抽象化」というJavaでもよくつかわれる技法がClojure独自の抽象化方式でどう表されるのか・・という内容です。元々、Clojureはproxyとgenclassを用いて「Javaの抽象化をうまく利用できる」という方針でした。…

2013-07-06

Apache Kafkaのレプリケーション

Kafka

こんにちは。前回に続いて、Apache Kafkaのネタです。今期の最新バージョンからレプリケーション機能が追加されたとのため、レプリケーション機能の設計を実際に確認してみます。 https://cwiki.apache.org/confluence/display/KAFKA/Kafka+Replication レ…

2013-07-03

Apache Kafka 0.8.0の新機能／変更点

Kafka

こんにちは。最近Clojureのお勉強投稿ばかりでしたが、Kafkaについて肝心なことを見落としていたので記述しておきます。Kafkaは現在0.8.0が最新バージョンで開発が進められています。かつ、0.8.0で大きく信頼性が向上しているようなので、実際何が新しくな…

2013-06-28

Clojure勉強日記（その２４ SnakeGameをClojureで書いてみる（その３

Clojure

こんにちは。いよいよ大詰め。今まではコマンドライン上でしか動作しなかったゲームをGUI上で表示してみます。■snake.clj：Graphicの塗りつぶし処理 ; Fill-Points (defn fill-point [graphic pt color] (let [[x y width heignt] (point-to-screen-rect pt…

2013-06-27

Clojure勉強日記（その２３ SnakeGameをClojureで書いてみる（その２

Clojure

こんにちは。では、SnakeGameの状態更新部分を進めていきます。今回、状態が更新されるタイミングは以下の３つです。ゲームを開始する。ターンごとにヘビが位置を更新する。リンゴが食べられていたらヘビの長さを伸ばし、リンゴを再配置する。ヘビの向き…

2013-06-24

Clojure勉強日記（その２２ SnakeGameをClojureで書いてみる（その１

Clojure

こんにちは。今まで確認してきた状態管理のAPIを使い、「SnakeGame」を作ってみます。と言いつつ、そもそもSnakeGameを起動するところからしてはまったのでそこから（汗まず、前提として「https://github.com/stuarthalloway/programming-clojure」からダウ…