久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

微軟HPC群集如何添加Linux計算節點

163次閱讀
沒有評論

共計 3768 個字符,預計需要花費 10 分鐘才能閱讀完成。

這篇文章將為大家詳細講解有關微軟 HPC 群集如何添加 Linux 計算節點,丸趣 TV 小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

本文以 hpc pack 2016 update1 為例

支持的 linux 版本:SUSE Linux Enterprise Server 12,Red Hat Enterprise Linux 7.1,CentOS 6.7,Ubuntu Server 14.04 LTS 和 16.04 LTS

環境介紹

08dc

10.0.0.2 255.0.0.0

hpc01-head.oa.com

windows server 2016 數據中心版

Enterprise 10.0.0.8 255.0.0.0 dns 10.0.0.2

HPC 18.0.0.1 255.0.0.0

linuxnode1 

Centos6.7

Enterprise 10.0.0.51 255.0.0.0 dns 10.0.0.2

HPC 18.0.0.3 255.0.0.0

總結的配置步驟如下

為 linux 主機修改主機名

在 windows dns 服務器上添加 linux 主機 DNS 記錄,確保安裝過程中 head 主機可以找到 linux 計算節點

為 linux 主機導入 windows 環境根證書,頭節點證書公鑰,確保證書可以驗證,linux 主機可以正確打開 https:// 頭節點 fqdn(此步驟需重啟生效)

在 linux 主機上面添加頭節點主機名和 FQDN 名稱進入 /etc/resolv.conf,最好使用永久生效方式,確保互相正常解析

通過 FileZilla 或其它工具,將 hpc pack linux aget tar gz,setup.py,頭節點帶私鑰證書拷貝進入 linux 目錄

在 linux 主機安裝 hpc pack agent 代理需要聯網通過 yum install 下載依賴組件,因此需要讓安裝過程 linux 主機可以臨時聯網下載組件

通過 python 命令開始安裝 setup.py,正常情況下 centos 或 redhat 安裝完成后都有這個命令,如果在終端輸入 python 無效,需自行下載安裝

嚴格按照 setup.py 腳本指示安裝代理

檢查安裝過程日志,以及 nodemanager.json,如果出現主機名,需修改為 FQDN,因為主機名稱無法通過 SSL 驗證

一切順利,安裝成功后,經過一杯茶的時間,可以在頭節點看到被添加進來的 linux 計算節點,聯機即可

1. 為 linux 主機修改主機名,最好安裝時指定,否則可以使用 hostname linuxnode01 修改

2. 在 windows dns 服務器上添加 linux 主機 DNS 記錄

3. 導出 windows CA 根證書與頭節點安裝證書,不帶私鑰版本,導出格式選擇 Base 64 編碼

導出完成后得到兩個文件,一個是頭節點安裝證書不帶私鑰的 cer,一個是企業根信任證書的 cer,如果是自簽名證書僅導出安裝證書不帶私鑰的 cer 即可

直接將文件后綴重命名為 pem,便于我們在 linux 上面導入證書

通過 filezilla 工具,拷貝這兩張證書,放置到 centos 或 redhat 的 /etc/pki/ca-trust/source/anchors 路徑下

在 centos 或 redhat 上面進入 bin 目錄下,輸入 update-ca-trust,更新證書列表,會將我們放進 anchors 的證書導入

導入之后重啟操作系統,在瀏覽器欄輸入 https://hpc01-head.oa.com ,出現以下結果,即代表配置成功

如果出現證書不受信任的提示,則一定要重新配置,檢查證書位置,以及是否導入,務必確保地址可以正確打開,因為 linux 里面對于證書要求非常嚴格,如果 SSL 證書不信任,是不允許直接打開 SSL 網站的

但是我們在 linux 上面安裝 hpc pack 代理,最后一步,要通過 json 里面 NamingServceUri 寫出的  https://hpc01-head.oa.com:443/HpcNaming/api/fabric/resolve/singleton/

路徑,去聯系頭節點注冊計算節點,如果這一步信任不做,那么最后一步這個地址是沒辦法打開的,這樣即便 linux 端安裝代理成功了,但是 linux 計算節點也不會顯示在 windows 頭節點中

4. 在 linux 主機上面添加頭節點主機名和 FQDN 名稱進入 /etc/resolv.conf,這一步是為了讓 linux 主機能夠正常解析頭節點主機,其實我們在 linux 上面設置了 dns 后,理論上來說應該就已經可以解析了,ping 頭節點主機名和 FQDN 都可以 ping 通,但是之前曾經有外國朋友提到過這是一個 bug,告知我們仍需添加 /etc/resolv.conf,作為雙保險我們最好還是加上

添加方法使用 linux vi 編輯器

終端中輸入 vi /etc/resolv.conf 打開編輯器 , 輸入完成后鍵入 ESC,然后鍵入:w 保存文檔

此為臨時性修改方法,一旦重啟后即失效,雖可以確保代理安裝過程無誤,但如果有了解 linux 的朋友還是建議使用永久修改方法

添加完成后嘗試在頭節點 ping linux 節點主機名,主機名加域名,在 linux 節點 ping 頭節點主機名,FQDN 名,都能 ping 通即配置成功

5. 通過 FileZilla 或其它工具,將 hpcnodeagent.tar.gz,setup.py,頭節點安裝時帶私鑰證書拷貝進入一個 linux 目錄

hpcnodeagent.tar.gz,setup.py 可以在 hpc pack 頭節點安裝包解壓目錄中找到

HPCcom.pfx 是我們安裝 hpc pack 頭節點時申請的證書,導出那張證書,帶私鑰一起導出

6. 在 linux 主機安裝 hpc pack agent 代理需要聯網通過 yum install 下載依賴組件,因此需要讓安裝過程 linux 主機可以臨時聯網下載組件

hpc pack liunx agent 安裝的時候需要聯機下載一些必備組件,實驗中老王臨時把 HPC 網絡接入了 vmwareNAT 網絡,實際企業環境建議臨時讓其中一個網絡聯網,或臨時新加入一個網卡

如果安裝 linux hpc pack 代理時不能聯網,則會出現以下錯誤

7. 通過 python 命令開始安裝 setup.py,正常情況下 centos 或 redhat 安裝完成后都有這個命令,如果在終端輸入 python 無效,需自行下載安裝

進入 setup.py 所在目錄運行 python 命令

python setup.py -install -connectionstring: hpc01-head -certfile: /opt/HPCcom.pfx -certpassword: 123.com -managehosts

如果怕麻煩可以直接輸入 python setup.py,會彈出 setup.py 幫助內容,直接可以復制粘貼,再修改為我們的內容

嚴格按照 setup.py 說明安裝代理,一個參數和大小寫都不能錯,最好是直接復制示例內容然后修改

在安裝步驟進行到大約這里時

打開 /opt/hpcnodemanager/nodemanager.json,檢視 NamingServceUri 一欄,如果是 hpc01-head 這樣的主機名,請一定把它改成 hpc01-head.oa.com

因為我們在 windows 端綁定的證書名稱是 fqdn 名稱,因此我們導入到 linux 的證書,也只會匹配 fqdn 名稱,如果這里以主機名訪問,則會因為名稱與證書不匹配而無法直接打開網頁,導致沒辦法向頭節點注冊

安裝成功后,經過一杯茶的時間,可以在頭節點看到被添加進來的 linux 計算節點

安裝過程日志排錯

Linux Node

/opt/hpcnodemanager/logs/nodemanager.txt,hpclinuxagent.log

/opt/hpcnodemanager/nodemanager.json

頭節點

安裝目錄 Microsoft HPC Pack 2016 \ Data \ LogFiles \ Scheduler \ HpcScheduler*.bin

使用 hpctrace 將 bin 文件轉換 txt 查看

聯機 linux 計算節點,現在 linux 計算節點已經成功加入到微軟 HPC 群集中,可以正常承載頭節點派發給它的作業任務

支持直接在群集管理器對 linux 節點執行命令

支持使用 clusrun 提交作業直接在 linux 計算節點執行

支持通過群集管理器匯總顯示 linux 計算節點數據

支持通過客戶端程序,portal,提交參數掃描作業至 linux 節點

Linux 計算節點不支持的場景

linux 計算節點僅支持單頭節點的部署,如果采用群集頭節點,則無法使用 linux 計算節點

要在 Linux 節點上運行 MPI 應用程序,您必須在節點上安裝自己的 MPI。包含在 HPC Pack 中的 Microsoft MPI(MS-MPI)僅在 Windows 節點上運行。調度程序必須在 Linux 節點之間建立互信,HPC Pack 2016 Update 1 會自動為用戶生成密鑰對。

不支持 GPU 和 SOA 工作負載 – 目前 HPC Pack 不支持在 Linux 節點上調度 GPU 或運行 SOA 工作負載

除上述場景外,其它體驗均與 windows 計算節點一致

關于“微軟 HPC 群集如何添加 Linux 計算節點”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2023-08-25發表,共計3768字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 明水县| 化州市| 北辰区| 渝中区| 海城市| 靖边县| 沾化县| 葫芦岛市| 兰溪市| 江永县| 连城县| 漠河县| 隆德县| 沅江市| 孝义市| 香格里拉县| 礼泉县| 商水县| 阿合奇县| 阳春市| 涿鹿县| 德格县| 榆树市| 双鸭山市| 泗阳县| 临桂县| 昭苏县| 鹿邑县| 鲁山县| 蓬安县| 噶尔县| 盐池县| 扶绥县| 巫溪县| 富源县| 兴安县| 青州市| 赣州市| 普兰店市| 西和县| 宾阳县|