國網中心有推出hadoop for window的版本,是整合型的挺酷的喔!~
http://code.google.com/p/hadoop4win/
目前是在Linux環境下使用Hadoop)。
事前作業:
(1). OS(Linux,such as: Centos、Ubuntu、...etc)
(2). Java (http://www.oracle.com/technetwork/java/javase/downloads/jdk6u37-downloads-1859587.html)
(3). Hadoop (http://hadoop.apache.org/releases.html)
(4). Hbase (http://www.apache.org/dyn/closer.cgi/hbase/)
由於網路上實在太多太多教學了,所以我直接放上我當初設定成功的連結加上一些心得,底下是祖國同胞的連結,我覺得祖國的同胞非常非常的強...,所以我們更要發奮圖強!!~好啦廢話不多說,請照著底下的步驟安裝,
Step 1. 安裝Centos (http://developer.51cto.com/art/201206/342067.htm)
Step 2. 配置Linux的主(maser)、從(slave)架構 (http://developer.51cto.com/art/201206/343293.htm)
step 3. (http://developer.51cto.com/art/201206/343293.htm) <=內容有點多,在這邊主要是
a. iptables -> off (service iptables stop and then chkconfig iptables off)
b. selinux -> disabled
c. 可用Filezilla做為傳輸的工具:設定方式如下
檔案 -> 站台管理員 -> 新增站台 -> 一般設定
c-1. 主機: 連線主機的IP
c.-2 連接埠: 略
c.-3 協定: SFTP
c-4. 登入形式: 一般
c-5. 使用者: root
c-6. 密碼: 登入linux的root密碼即可
step 4. hadoop的配置 (http://developer.51cto.com/art/201206/344046.htm)
step 5. JDK與SSH無密碼配置 (http://developer.51cto.com/art/201206/345057.htm)
step 6. 跑個MapReduce範例吧 (http://developer.51cto.com/art/201206/345334.htm)
-----------------------------以上~打完收工~-----------------------------
step 7. 使用Eclipse作為IDE,這個部分請參考~(使用Eclipse做遠端操作叢集~酷斃了!!)