Hadoopを10分で試す(まとめ)
Hadoopを使ってみたい!
新しく何かを始めようと思った時、面倒だなぁと思うことは多いものです。書籍やブログをみて「これは役立ちそうだ」と思っても、ちょっと試すことにさえにも辿り着けず、頓挫しているものがTODOリストやPocket(旧Readitlater)に大量にあります。
#書いていて嫌な気持ちになってきた、、、
Hadoopはそんな面倒なものの一つかもしれません。書籍を読んで「よし、やってみるか」という強い決意を持ったすぐ後に、
「試すにはマシン用意しないといけないのかなぁ」
「いや、EC2でいけそう。アカウントどうしようか」
「なんか仮想マシンでもできそうって書いてある」
という第一の壁があります。
運良く壁を乗り越えたあと、
「ソフトはどこからダウンロードすればいいだっけ?」
「コマンドラインでやるの?」
「設定面倒そうだなぁ」
いつやるの?ー>「今でしょ」「今度でいいや!」
というパターンになっていまうことが多いです。良質な書籍も記事も多いのですが、いかんせん最初の壁が高い印象があります。
Hadoopを10分で試す
先月書いたブログ、「Hadoopを10分で試す」シリーズでは、あらかじめ用意されている仮想マシンイメージを使い、最初の敷居を下げることを目的として書いてみました。過去に挫折したことがある方は週末にでも是非!
Hadoopを10分で試す(1)Clouderaの仮想マシンをインストール
Hadoopを10分で試す(2)Clouderaの仮想マシンを日本語化
Hadoopを10分で試す(3)HueからHiveとImpalaのクエリを実行する
Hadoopを10分で試す(4)CDH4.3にバージョンアップ
Hadoopを10分で試す(5)Cloudera Quickstart VM 新版リリースと日本語化
Hadoopを10分で試す(7)再びHueからHiveとImpalaを使う
Hadoopを10分で試す(8)HueからSolrを使う-その2
注意
「よし、やってみよう」と言う方は(5)から始めるのが良いでしょう。(仮想マシンイメージのバージョンが新しくなったので)
(1)と(2)は(5)と並行して参照する程度、(3)は重要ですが(4)は不要です。