Tech Blog 〜ぞうの日記

HadoopやLinux関連の技術的な内容の紹介です

HDFSが変わる?HDFSのイレイジャーコーディング対応

※このブログは本家(http://linux.wwing.net)のバックアップコピーです

Hadoop分散ファイルシステムであるHDFSビッグデータ用のストレージ用に広く利用され、ビッグデータにおけるファイルシステムデファクトスタンダードになっていると言っても過言ではありません。最近では暗号化の対応アクセス制御(ACL)NFSv3への対応など、セキュリティの強化や利便性の向上なども進化しています。

このように進化を続けているHDFSですが、現在開発が進んでいる機能のひとつにイレージャーコーディングへの対応というものがあります。

HDFS-7285:Erasure Coding Support inside HDFS

イレージャーコーディングとはソフトウェアエンジニアには耳慣れない言葉ですが、興味深かったのでまとめてみました。

続きを読む

2014年版Hadoopアドベントカレンダーまとめ

2014版Hadoopアドベントカレンダーまとめ

年末なので久しぶりにこちらのブログも更新します。本家はこちらをどうぞ。

Tech Blog | Linux and Hadoop and other technologies

 

今年も各所でアドベントカレンダーが実施されていましたが、昨日のクリスマス、25日でほとんどのカレンダーが終わりましたね。

なお、2014年のHadoop関連アドベントカレンダーは、把握しているだけで以下の3つ。

Hadoop関連(全部俺)Advent Calendar 2014」、睡眠時間を削って書いたので、かなり内容にムラがありますが、ご参考になれば幸いです。

 


Spark, SQL on Hadoop etc. Advent Calendar 2014 - Qiita


Hadoop Advent Calendar 2014 - Qiita


Hadoop関連(全部俺) Advent Calendar 2014 - Adventar

 

Apache Hadoop 2.3.0 公開

Apache Hadoop 2.3.0 公開!

(注)この記事は http://linux.wwing.net のバックアップコピーです

 

昨日、Apache Hadoop 2.3.0 が公開されました!

http://hadoop.apache.org/releases.html#20+February%2C+2014%3A+Release+2.3.0+available

全く貢献できていませんが、公開おめでとうございます!

 

New Releaseに書かれている注目すべき機能はこの3つのようです。

続きを読む

HDFSのヘテロジニアス(非均一)ストレージ構成

9日目です(すみません、土日に書くのは休むことにしました)

ご存知の通り、HDFSはマスターとスレーブ群から構成されます。スレーブノードを大量に用意することで、膨大なデータを蓄積することができます。 現状のHDFSでは、個々のデータノードが持っているストレージの種類や数、個々のストレージの容量などを、ネームノードが知る手段がありません。今後データノードでは、HDDやSSDなどのデバイスを組み合わせて利用したり、ノード毎に異なるハードウェア構成を取ることが増える可能性があります。

続きを読む

(5日目)MRv1におけるフェアスケジューラでのプリエンプション

元記事

 

5日目です

 

3日目に書いたMapReduceのスケジューラでうち、フェアスケジューラには「プリエンプション」という設定ができます。この設定をすることで、例えば緊急度の高くない長時間実行されているタスクを強制的にKillして、すぐに実行する必要があるジョブのタスク用にスロットを空けることができます。

続きを読む

(4日目)HueでCSVデータからHiveのテーブルを作る

元記事

 

4日目です。

本日はHadoopアドベントカレンダー2013立候補がいないようなので、あえて書く@choplinさんが今 (22:30)書いて下さっているとのこと。凄い!ありがとうございます! #決して無理強いはしてないはず、、、、、と信じたい(汗

 

本日のお題はHueとHiveについてです。

Hiveでテーブルを作成してデータをロードする場合には、1) CREATE TABLEを使用してテーブルを作成し、2) LOAD DATA INPATHなどを使ってデータをロードする、というような手順を踏みます。あるいは、既にデータがHDFS上にある場合、外部テーブルを利用することもできます。

 

続きを読む