Tech Blog 〜ぞうの日記

HadoopやLinux関連の技術的な内容の紹介です

(2日目)HDFSとMapReduceのハートビートの設定

元記事

 

2日目です。書き溜めた技術情報を書き続けてみるテスト中。

技術ネタ

HDFSのハートビートなど

a) ハートビート(デフォルト3秒: dfs.heartbeat.interval)

1) DataNodeからNameNodeに一定間隔で送付される。以下の情報が含まれる。(容量、使用量、残量、送信実行中の数、xceiver数(コネクション数)、failedVolumesなど。 2) NameNodeからの応答の中に、ローカルブロックの無効化依頼や、それらを他のDNにコピーする指示が含まれる

b) ブロックレポート(デフォルト1時間毎:dfs.blockreport.intervalmsec)

1) ブロック情報。DNが全てのローカルに保存されているブロックについての情報をNNに通知

2) 応答で削除すべきブロックについての情報を返す

c) ブロックスキャナーレポート(デフォルト3週間毎:fs.datanode.scan.period.hours)

2) DNが自分の管理しているブロックに対してチェックを行う(間隔)

MapRecuce のハートビートなど

HDFS同様に、TaskTracker -> JobTrackerは定期的にハートビート通信を行っている。 DataNode -> NameNode 間のハートビートと異なり、値は調整できません。 (詳細は MAPREDUCE-1906 を参照:https://issues.apache.org/jira/ browse/MAPREDUCE-1906) タスクのプロセス(子プロセス)とTaskTrackerの間のチェック方法/間隔です が、

i) 子プロセスが進行状況を報告

ii) TaskTrackerのスレッドが定期的にチェック (3s)。タイムアウトはmapred.task.timeout で調整可能。

Cloudera World Tokyo 2013の資料

さて、本日、Cloudera World Tokyo 2013の資料が公開されたようです。 http://www.cloudera.co.jp/cwt2013-session.html 未公開セッションのうち、一部の資料は講演の方に掲載確認中とのこと。 当日はほとんどセッションに参加できなかったので、公開されたのは非常に嬉しい限り。これを読んで勉強します。

Hadoop Advent Calendar 2013

本日のHadoopアドベントカレンダー2013は garagekidztweetz さんです。無茶振りにも関わらず、快く引き受けていただきました。いつも素晴らしいブログを拝見させていただいています。ありがとうございます。http://d.hatena.ne.jp/garage-kid/20131202/hadoopadventcalendarday2