Tech Blog 〜ぞうの日記

HadoopやLinux関連の技術的な内容の紹介です

Apache Hadoop 2.3.0 公開

Apache Hadoop 2.3.0 公開!

(注)この記事は http://linux.wwing.net のバックアップコピーです

 

昨日、Apache Hadoop 2.3.0 が公開されました!

http://hadoop.apache.org/releases.html#20+February%2C+2014%3A+Release+2.3.0+available

全く貢献できていませんが、公開おめでとうございます!

 

New Releaseに書かれている注目すべき機能はこの3つのようです。

  • Support for Heterogeneous Storage hierarchy in HDFS.
  • In-memory cache for HDFS data with centralized administration and management.
  • Simplified distribution of MapReduce binaries via HDFS in YARN Distributed Cache.

前者2つに関しては、以前ざっと調査した内容をブログに書きましたが、 1)Heterogeneous Storage hierarchyは異なる種類のデバイス(HDD, SSD, RAID...など)を混在させる環境下において期待できそうです。(HDFSのヘテロジニアス対応

逆に同一種類のHDDを使用する場合などは効果が薄いかもしれません。

2)In-memory CacheはHDFSのパフォーマンスの向上に期待です。(HDFSが高速に?キャッシュメカニズムの追加

3)は分散キャッシュの改善でしょうか?

 

上記以外のハイライトは(時間があれば)追記する予定です。リリースノートはこちら

日本人の方のお名前も沢山ありますね。おめでとうございます!