IT樂章: 跑MapReduce測試Hadoop

2013年7月1日星期一

跑MapReduce測試Hadoop

使用 Hadoop 內建的 WordCount 程式來跑看看 Hadoop 的 Map/Reduece。

在hadoop home目錄之下建立wordcount_folder
mkdir wordcount_folder

進入wordcount_folder
cd wordcount_folder/

建立檔案input_file1,input_file2並輸入文字
echo "hello world" >> input_file1
echo "8181 hadoop" >> input_file2
(我這裡登入root才能建立文字檔案)

回 hadoop 主目錄，輸入 $bin/hadoop dfs -put ./wordcount_folder input 指令，將剛剛建立的兩個文字檔當作 Map/Reduce 的輸入檔案，此指令是將檔案放到HDFS上。
bin/hadoop dfs -put ./wordcount_folder input
(這邊用root帳號無法操做，必須回到hadoop帳號，因為我將檔案放在根目錄之下)

使用 hadoop-examples-1.1.2.jar 的wordcount method 來計算輸入檔案的內的每一個字的出現次數
bin/hadoop jar hadoop-examples-1.1.2.jar wordcount input output

打開Browser進入Hadoop管理介面
查看執行結果

IT樂章

總網頁瀏覽量

2013年7月1日星期一

跑MapReduce測試Hadoop

沒有留言:

張貼留言

總網頁瀏覽量

2013年7月1日 星期一

跑MapReduce測試Hadoop

沒有留言:

張貼留言

2013年7月1日星期一