Hadoopのセキュリティ
Hadoopのセキュリティについての雑記
認証についてはKerberosを使うというのがスタンダードですが、暗号化についても徐々に進んでいます。
ネットワークの暗号化
例えば、ネットワークの暗号化については下記のブログがお勧めです。
http://blog.cloudera.com/blog/2013/03/how-to-set-up-a-hadoop-cluster-with-network-encryption/
ファイルシステムの暗号化
ファイルシステム/ディスクの暗号化は現状対応していないので、LinuxのDevice Mapperを使用したdm-cryptや、eCryptfsの仕組みを利用するしかありません。
ところが先週 Jira に「Hadoop cryptographic file system」というチケット(HDFS-5143)が登録されました。今後どうなるかわかりませんが要注目です。
Sentry
話は逸れますが、Hive/Cloudera Impala用の認可モジュール、SentryもApacheのトッププロジェクトを目指しています。Hadoopがエンタープライズ用途での利用が増えるに従いセキュリティはさらに重要な要件となります。今後の展開が楽しみです。
※本家は linux.wwing.netです