EMR: Hive0.8.1 対応
2012.05.31に、Hive 0.8.1 がAmazon EMRで動作するようになった。
AWS Developer Forums: Support for Hive 0.8.1
1ヶ月半前の2012.04.10にHive 0.7.1.4とPig0.9.2に対応したのでペース速い。
詳細はこちら。
目玉としては
- バイナリデータ、タイムスタンプデータをサポート(HIVE-2380, HIVE-2272)
- export/import機能 ( HIVE-1918 )
- プラグインの開発キット(HIVE-2244)
- SerDeがパーティションに対応( HIVE-2484)
- リモートデバッグ
あたりか。
Hiveのバージョンを指定せずにEMRを起動すると、Hive 0.8.1 + Hadoop0.20.205 になる。
Hiveのバージョンを指定して起動する場合は CLIにて、 --hive-versions を指定する。
実行中のjobflowのHiveバージョンを調べるには、
elastic-mapreduce --jobflow j-xxxxx --print-hive-version
とする。
あと、Hive 0.8.1用のJDBCはこちら。
Amazon Elastic MapReduce JDBC Driver for Hive 0.8.1 : Developer Tools : Amazon Web Services
詳しくは、こちらを参照。