Hadoop導入まとめ

Hadoopインストール
インストール確認（コマンド）
インストール確認（ブラウザ越し）
プログラム実行
エクリプスによる実行／デバッグ
参考サイト

Hadoopインストール

インストール確認（コマンド）

Hadoopの起動

$start-all.sh

Hadoop

hadoop

ファイルの転送（to server）

$hadoop fs -put ファイル名 サーバ側ファイル名

ファイルの転送（to local）

$hadoop fs -get ファイル名 ローカルファイル名

lsコマンド

$hadoop fs -ls
サーバ側のファイル一覧が見れる。

インストール確認（ブラウザ越し）

Webブラウザ

Name Node

http://localhost:50070/

Job Tracker

http://localhost:50030/

プログラム実行

クラスファイル

hadoop

$hadoop クラス名 引数...

jarファイル

$hadoop jar JARファイル 引数...

Eclipseからの実行／デバッグ

デバッグ／実行設定画面

Explorer

Java

Argumentsタブ

Program arguments には、プログラムの引数を設定する。

VM arguments には、次のものを設定する。
 -Xmx1000m
 -Dhadoop.log.dir=hadoopのインストール先/logs
 -Dhadoop.log.file=hadoop.log
 -Dhadoop.home.dir=hadoopのインストール先
 -Dhadoop.id.str=host
 -Dhadoop.root.logger=INFO,console
 -Dhadoop.policy.file=hadoop-policy.xml

Classpathタブ

Add External JARsで次のファイルを対Kあ

hadoop

jsp

Advanced → Add External Folderで次のフォルダを追加

hadoop

参考サイト

Hadoop WordCountメモ(Hishidama's Hadoop tutorial WordCount Memo)