共計 3768 個字符,預計需要花費 10 分鐘才能閱讀完成。
這篇文章將為大家詳細講解有關微軟 HPC 群集如何添加 Linux 計算節點,丸趣 TV 小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
本文以 hpc pack 2016 update1 為例
支持的 linux 版本:SUSE Linux Enterprise Server 12,Red Hat Enterprise Linux 7.1,CentOS 6.7,Ubuntu Server 14.04 LTS 和 16.04 LTS
環境介紹
08dc
10.0.0.2 255.0.0.0
hpc01-head.oa.com
windows server 2016 數據中心版
Enterprise 10.0.0.8 255.0.0.0 dns 10.0.0.2
HPC 18.0.0.1 255.0.0.0
linuxnode1
Centos6.7
Enterprise 10.0.0.51 255.0.0.0 dns 10.0.0.2
HPC 18.0.0.3 255.0.0.0
總結的配置步驟如下
為 linux 主機修改主機名
在 windows dns 服務器上添加 linux 主機 DNS 記錄,確保安裝過程中 head 主機可以找到 linux 計算節點
為 linux 主機導入 windows 環境根證書,頭節點證書公鑰,確保證書可以驗證,linux 主機可以正確打開 https:// 頭節點 fqdn(此步驟需重啟生效)
在 linux 主機上面添加頭節點主機名和 FQDN 名稱進入 /etc/resolv.conf,最好使用永久生效方式,確保互相正常解析
通過 FileZilla 或其它工具,將 hpc pack linux aget tar gz,setup.py,頭節點帶私鑰證書拷貝進入 linux 目錄
在 linux 主機安裝 hpc pack agent 代理需要聯網通過 yum install 下載依賴組件,因此需要讓安裝過程 linux 主機可以臨時聯網下載組件
通過 python 命令開始安裝 setup.py,正常情況下 centos 或 redhat 安裝完成后都有這個命令,如果在終端輸入 python 無效,需自行下載安裝
嚴格按照 setup.py 腳本指示安裝代理
檢查安裝過程日志,以及 nodemanager.json,如果出現主機名,需修改為 FQDN,因為主機名稱無法通過 SSL 驗證
一切順利,安裝成功后,經過一杯茶的時間,可以在頭節點看到被添加進來的 linux 計算節點,聯機即可
1. 為 linux 主機修改主機名,最好安裝時指定,否則可以使用 hostname linuxnode01 修改
2. 在 windows dns 服務器上添加 linux 主機 DNS 記錄
3. 導出 windows CA 根證書與頭節點安裝證書,不帶私鑰版本,導出格式選擇 Base 64 編碼
導出完成后得到兩個文件,一個是頭節點安裝證書不帶私鑰的 cer,一個是企業根信任證書的 cer,如果是自簽名證書僅導出安裝證書不帶私鑰的 cer 即可
直接將文件后綴重命名為 pem,便于我們在 linux 上面導入證書
通過 filezilla 工具,拷貝這兩張證書,放置到 centos 或 redhat 的 /etc/pki/ca-trust/source/anchors 路徑下
在 centos 或 redhat 上面進入 bin 目錄下,輸入 update-ca-trust,更新證書列表,會將我們放進 anchors 的證書導入
導入之后重啟操作系統,在瀏覽器欄輸入 https://hpc01-head.oa.com ,出現以下結果,即代表配置成功
如果出現證書不受信任的提示,則一定要重新配置,檢查證書位置,以及是否導入,務必確保地址可以正確打開,因為 linux 里面對于證書要求非常嚴格,如果 SSL 證書不信任,是不允許直接打開 SSL 網站的
但是我們在 linux 上面安裝 hpc pack 代理,最后一步,要通過 json 里面 NamingServceUri 寫出的 https://hpc01-head.oa.com:443/HpcNaming/api/fabric/resolve/singleton/
路徑,去聯系頭節點注冊計算節點,如果這一步信任不做,那么最后一步這個地址是沒辦法打開的,這樣即便 linux 端安裝代理成功了,但是 linux 計算節點也不會顯示在 windows 頭節點中
4. 在 linux 主機上面添加頭節點主機名和 FQDN 名稱進入 /etc/resolv.conf,這一步是為了讓 linux 主機能夠正常解析頭節點主機,其實我們在 linux 上面設置了 dns 后,理論上來說應該就已經可以解析了,ping 頭節點主機名和 FQDN 都可以 ping 通,但是之前曾經有外國朋友提到過這是一個 bug,告知我們仍需添加 /etc/resolv.conf,作為雙保險我們最好還是加上
添加方法使用 linux vi 編輯器
終端中輸入 vi /etc/resolv.conf 打開編輯器 , 輸入完成后鍵入 ESC,然后鍵入:w 保存文檔
此為臨時性修改方法,一旦重啟后即失效,雖可以確保代理安裝過程無誤,但如果有了解 linux 的朋友還是建議使用永久修改方法
添加完成后嘗試在頭節點 ping linux 節點主機名,主機名加域名,在 linux 節點 ping 頭節點主機名,FQDN 名,都能 ping 通即配置成功
5. 通過 FileZilla 或其它工具,將 hpcnodeagent.tar.gz,setup.py,頭節點安裝時帶私鑰證書拷貝進入一個 linux 目錄
hpcnodeagent.tar.gz,setup.py 可以在 hpc pack 頭節點安裝包解壓目錄中找到
HPCcom.pfx 是我們安裝 hpc pack 頭節點時申請的證書,導出那張證書,帶私鑰一起導出
6. 在 linux 主機安裝 hpc pack agent 代理需要聯網通過 yum install 下載依賴組件,因此需要讓安裝過程 linux 主機可以臨時聯網下載組件
hpc pack liunx agent 安裝的時候需要聯機下載一些必備組件,實驗中老王臨時把 HPC 網絡接入了 vmwareNAT 網絡,實際企業環境建議臨時讓其中一個網絡聯網,或臨時新加入一個網卡
如果安裝 linux hpc pack 代理時不能聯網,則會出現以下錯誤
7. 通過 python 命令開始安裝 setup.py,正常情況下 centos 或 redhat 安裝完成后都有這個命令,如果在終端輸入 python 無效,需自行下載安裝
進入 setup.py 所在目錄運行 python 命令
python setup.py -install -connectionstring: hpc01-head -certfile: /opt/HPCcom.pfx -certpassword: 123.com -managehosts
如果怕麻煩可以直接輸入 python setup.py,會彈出 setup.py 幫助內容,直接可以復制粘貼,再修改為我們的內容
嚴格按照 setup.py 說明安裝代理,一個參數和大小寫都不能錯,最好是直接復制示例內容然后修改
在安裝步驟進行到大約這里時
打開 /opt/hpcnodemanager/nodemanager.json,檢視 NamingServceUri 一欄,如果是 hpc01-head 這樣的主機名,請一定把它改成 hpc01-head.oa.com
因為我們在 windows 端綁定的證書名稱是 fqdn 名稱,因此我們導入到 linux 的證書,也只會匹配 fqdn 名稱,如果這里以主機名訪問,則會因為名稱與證書不匹配而無法直接打開網頁,導致沒辦法向頭節點注冊
安裝成功后,經過一杯茶的時間,可以在頭節點看到被添加進來的 linux 計算節點
安裝過程日志排錯
Linux Node
/opt/hpcnodemanager/logs/nodemanager.txt,hpclinuxagent.log
/opt/hpcnodemanager/nodemanager.json
頭節點
安裝目錄 Microsoft HPC Pack 2016 \ Data \ LogFiles \ Scheduler \ HpcScheduler*.bin
使用 hpctrace 將 bin 文件轉換 txt 查看
聯機 linux 計算節點,現在 linux 計算節點已經成功加入到微軟 HPC 群集中,可以正常承載頭節點派發給它的作業任務
支持直接在群集管理器對 linux 節點執行命令
支持使用 clusrun 提交作業直接在 linux 計算節點執行
支持通過群集管理器匯總顯示 linux 計算節點數據
支持通過客戶端程序,portal,提交參數掃描作業至 linux 節點
Linux 計算節點不支持的場景
linux 計算節點僅支持單頭節點的部署,如果采用群集頭節點,則無法使用 linux 計算節點
要在 Linux 節點上運行 MPI 應用程序,您必須在節點上安裝自己的 MPI。包含在 HPC Pack 中的 Microsoft MPI(MS-MPI)僅在 Windows 節點上運行。調度程序必須在 Linux 節點之間建立互信,HPC Pack 2016 Update 1 會自動為用戶生成密鑰對。
不支持 GPU 和 SOA 工作負載 – 目前 HPC Pack 不支持在 Linux 節點上調度 GPU 或運行 SOA 工作負載
除上述場景外,其它體驗均與 windows 計算節點一致
關于“微軟 HPC 群集如何添加 Linux 計算節點”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。