SUSE上如何搭建Hadoop環境

155次閱讀

共計 3136 個字符，預計需要花費 8 分鐘才能閱讀完成。

丸趣 TV 小編給大家分享一下 SUSE 上如何搭建 Hadoop 環境，希望大家閱讀完這篇文章之后都有所收獲，下面讓我們一起去探討吧！

【環境】：

經常遭遇因為依賴軟件版本不匹配導致的問題，這次大意了，以為 java 問題不大，就用本來通過 yast 安裝的 java1.6 openjdk 去搞了，結果可想而知，問題很多，反復定位，反復谷歌百度，最后一朋友啟發下決定換換 jdk 版本。問題解決了，所以這里貼下我的環境

java 環境： java version 1.7.0_51
Java(TM) SE Runtime Environment (build 1.7.0_51-b13)
Java HotSpot(TM) 64-Bit Server VM (build 24.51-b03, mixed mode)

系統： openSUSE 11.2 (x86_64)

hadoop 版本：Hadoop-1.1.2.tar.gz

【Step1:】創建 hadoop 用戶及用戶組

組：hadoop

用戶：hadoop – /home/hadoop

加權限：vi /etc/sudoers 增加 hadoop ALL=(ALL:ALL) ALL

【Stpe2:】安裝 hadoop

筆者 tar xf 安裝完后是這樣的目錄結構 (供參考)：

/home/hadoop/hadoop-home/[bin|conf]

【Step3:】配 SSH(避免啟動 hadoop 時需要密碼)

略安裝 ssh

ssh-keygen -t rsa -P [一路回車及確認]

cat ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

嘗試 ssh localhost [檢查下是不是不需要密碼啦]

【Step4:】安裝 java

版本見【環境】部分

【Step5:】配 conf/hadoop-env.sh

export JAVA_HOME=/usr/java/jdk1.7.0_17xxx #[jdk 目錄]

export HADOOP_INSTALL=/home/hadoop/hadoop-home

export PATH=$PATH:$HADOOP_INSTALL/bin #[這里是 hadoop 腳本所在目錄]

【Step6:】使用單機模式

hadoop version

mkdir input

man find input/test.txt

hadoop jar hadoop-examples-1.1.2.jar wordcount input output

【Step7:】偽分布模式（單機實現 namenode,datanode,tackerd 等模塊）

conf/[core-site.xml、hdfs-site.xml、mapred-site.xml]

core-site.xml

configuration 
  property 
  name fs.default.name /name 
  value hdfs://localhost:9000 /value 
  /property 
  property 
  name hadoop.tmp.dir /name 
  value /usr/local/hadoop/tmp /value 
  /property 
 /configuration

hdfs-site.xml

configuration 
  property 
  name dfs.replication /name 
  value 2 /value 
  /property 
  property 
  name dfs.name.dir /name 
  value /usr/local/hadoop/datalog1,/usr/local/hadoop/datalog2 /value 
  /property 
  propconfiguration  
  property  
  name mapred.job.tracker /name 
  value localhost:9001 /value  
  /property 
 /configurationerty 
  name dfs.data.dir /name 
  value /usr/local/hadoop/data1,/usr/local/hadoop/data2 /value 
  /property 
 /configuration

mapred-site.xml

configuration  
  property  
  name mapred.job.tracker /name 
  value localhost:9001 /value  
  /property 
 /configuration

【Step8:】啟動

格式化：hadoop namenode -format

cd bin

sh start-all.sh

hadoop@linux-peterguo:~/hadoop-home/bin  sh start-all.sh
starting namenode, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-namenode-linux-peterguo.out
localhost: starting datanode, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-datanode-linux-peterguo.out
localhost: starting secondarynamenode, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-secondarynamenode-linux-peterguo.out
starting jobtracker, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-jobtracker-linux-peterguo.out
localhost: starting tasktracker, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-tasktracker-linux-peterguo.out

jps 查看進程是否全啟動五個 java 進程 jobtracker/tasktracker/namenode/datanode/sencondarynamenode

可以通過下面的操作來查看服務是否正常，在 Hadoop 中用于監控集群健康狀態的 Web 界面：
http://localhost:50030/ – Hadoop 管理介面
http://localhost:50060/ – Hadoop Task Tracker 狀態
http://localhost:50070/ – Hadoop DFS 狀態

【Step9:】操作 dfs 數據文件

hadoop dfs -mkdir input

hadoop dfs -copyFromLocal input/test.txt input

hadoop dfs -ls input

【Step10:】運行 dfs 上的 mr

hadoop jar hadoop-examples-1.1.2.jar wordcount input output

hadoop dfs -cat output/*

【Step11:】關閉

stop-all.sh

看完了這篇文章，相信你對“SUSE 上如何搭建 Hadoop 環境”有了一定的了解，如果想了解更多相關知識，歡迎關注丸趣 TV 行業資訊頻道，感謝各位的閱讀！

正文完

發表至：計算機運維

2023-08-25

轉載說明：除特殊說明外本站除技術相關以外文章皆由網絡搜集發布，轉載請注明出處。

win7共享打印機出現0x000006d9錯誤如何解決

linux是不是開源的

windows谷歌瀏覽器收藏夾位置在哪

如何進行分層遍歷二叉樹問題

如何使用nodejs消費SAP Cloud for Customer上的Web service

久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

SUSE上如何搭建Hadoop環境