Tech Blog 〜ぞうの日記

HadoopやLinux関連の技術的な内容の紹介です

Hadoopを10分で試す(まとめ)

Hadoopを使ってみたい!

新しく何かを始めようと思った時、面倒だなぁと思うことは多いものです。書籍やブログをみて「これは役立ちそうだ」と思っても、ちょっと試すことにさえにも辿り着けず、頓挫しているものがTODOリストやPocket(旧Readitlater)に大量にあります。
#書いていて嫌な気持ちになってきた、、、

Hadoopはそんな面倒なものの一つかもしれません。書籍を読んで「よし、やってみるか」という強い決意を持ったすぐ後に、

「試すにはマシン用意しないといけないのかなぁ」
「いや、EC2でいけそう。アカウントどうしようか」
「なんか仮想マシンでもできそうって書いてある」
という第一の壁があります。

運良く壁を乗り越えたあと、
「ソフトはどこからダウンロードすればいいだっけ?」
「コマンドラインでやるの?」
「設定面倒そうだなぁ」

いつやるの?ー>「今でしょ」「今度でいいや!」

というパターンになっていまうことが多いです。良質な書籍も記事も多いのですが、いかんせん最初の壁が高い印象があります。

Hadoopを10分で試す

先月書いたブログ、「Hadoopを10分で試す」シリーズでは、あらかじめ用意されている仮想マシンイメージを使い、最初の敷居を下げることを目的として書いてみました。過去に挫折したことがある方は週末にでも是非!

Hadoopを10分で試す(1)Clouderaの仮想マシンをインストール

Hadoopを10分で試す(2)Clouderaの仮想マシンを日本語化

Hadoopを10分で試す(3)HueからHiveとImpalaのクエリを実行する

Hadoopを10分で試す(4)CDH4.3にバージョンアップ

Hadoopを10分で試す(番外編)

Hadoopを10分で試す(5)Cloudera Quickstart VM 新版リリースと日本語化

Hadoopを10分で試す(6)HueからSolrを使う

Hadoopを10分で試す(7)再びHueからHiveとImpalaを使う

Hadoopを10分で試す(8)HueからSolrを使う-その2

注意

「よし、やってみよう」と言う方は(5)から始めるのが良いでしょう。(仮想マシンイメージのバージョンが新しくなったので)
(1)と(2)は(5)と並行して参照する程度、(3)は重要ですが(4)は不要です。