一区二区三区在线-一区二区三区亚洲视频-一区二区三区亚洲-一区二区三区午夜-一区二区三区四区在线视频-一区二区三区四区在线免费观看

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Linux|Centos|Ubuntu|系統進程|Fedora|注冊表|Bios|Solaris|Windows7|Windows10|Windows11|windows server|

服務器之家 - 服務器系統 - Linux - Linux系統上安裝slurm來監控網絡帶寬和控制節點

Linux系統上安裝slurm來監控網絡帶寬和控制節點

2019-07-09 12:5051CTO Linux

這篇文章主要介紹了Linux系統上安裝slurm來監控網絡帶寬和控制節點的方法,slurm本身是一個集群資源管理器,需要的朋友可以參考下

SLURM 是一個類似 Sun Grid Engine (SGE) 的開源分布式資源管理軟件,用于超級計算機和大型計算節點集群,可高度伸縮和容錯。SUN 被賣給 Oracle 后,好用的 SGE 變成 Oracle Grid Engine 并且從 6.2u6 版本開始成為商業軟件了(可以免費使用90天),所以我們不得不另尋其他的開源替代方案,SLURM 是上次在德班高性能會議的時候一位陌生人介紹的,聽上去不錯。
SLURM 通過一對冗余集群控制節點(冗余是可選的)來管理集群計算節點,是由一個名為 slurmctld 的管理守護程序實現的,slurmctld 提供了對計算資源的監視、分配和管理,并將進入的作業序列映射和分發到各個計算節點上。每個計算節點也有一個守護程序 slurmd,slurmd 管理在其上運行的節點,監視節點上運行的任務、接受來自控制節點的請求和工作、將工作映射到節點內部等等。圖示如下:
Linux系統上安裝slurm來監控網絡帶寬和控制節點

監控帶寬
 

復制代碼
代碼如下:

$ apt-get install slurm

它會用字符來顯示文本圖形。
例如:

復制代碼
代碼如下:

$ slurm -i <interface>
$ slurm -i eth1

Linux系統上安裝slurm來監控網絡帶寬和控制節點

 

選項
按 l 顯示 lx/tx 指示燈.
按 c 切換到經典模式.
按 r 刷新屏幕.
按 q 退出.

控制節點
在控制節點和計算結點分別安裝 slurm 包,這個包里面既含有控制節點需要的 slurmctld 也含有計算結點需要的 slurmd:
 

復制代碼
代碼如下:

# apt-get install slurm-llnl

控制節點和計算結點之間需要通信,通信就需要認證,slurm 支持兩種認證方式:Brent Chun’s 的 authd 和 LLNL 的 MUNGE,MUNGE 是專為高性能集群計算打造的,這里我們選用 MUNGE,生成 key 后啟動 munge 認證服務:

復制代碼
代碼如下:

# /usr/sbin/create-munge-key
Generating a pseudo-random key using /dev/urandom completed.
# /etc/init.d/munge start

使用 SLURM Version 2.3 Configuration Tool 在線配置工具生成配置文件,然后把配置文件拷貝控制節點以及各個計算結點的 /etc/slurm-llnl/slurm.conf(是的,控制節點和計算結點使用同一個配置文件)。
有了配置文件和啟動了 munge 服務后就可以在控制節點啟動 slurmctld 服務了:

復制代碼
代碼如下:

# /etc/init.d/slurm-llnl start
* Starting slurm central management daemon slurmctld [ OK ]

把控制節點生成的 munge.key 拷貝到各個計算結點:

復制代碼
代碼如下:

# scp /etc/munge/munge.key ubuntu@slurm01:/etc/munge/

登陸計算節點后啟動 munge 服務(注意需要改變 munge.key 的 owner 和 group 為 munge,否則會啟動失?。┖?slurmd 服務:

復制代碼
代碼如下:

# ssh ubuntu@slurm01
# chown munge:munge munge.key
# /etc/init.d/munge start
* Starting MUNGE munged [ OK ]
# slurmd

在控制節點上(slurm00)測試一下是否順利連接到計算結點(slurm01),并且簡單運行一個程序 /bin/hostname 看看效果吧:

復制代碼
代碼如下:

# sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
debug* up infinite 1 idle slurm01
# srun -N1 /bin/hostname
slurm01

延伸 · 閱讀

精彩推薦
主站蜘蛛池模板: 欧美精品日韩一区二区三区 | 高清在线观看免费入口 | 亚洲成人一区二区 | 深夜在线看 | 九色PORNY丨视频入口 | japanhd粗暴video| 亚州在线 | 亚洲视频免费在线观看 | 男生操女生动态图 | 99视频一区| 国产在线视频自拍 | 日韩精品一区二区三区中文在线 | 色婷婷综合缴情综六月 | 红色一片在线影视 | 校花被老头夺去第一次动图 | 精品国语对白精品自拍视 | 午夜一级免费视频 | www.大逼色 | zzjj中国| 国产大胆歌舞团网站 | 91进入蜜桃臀在线播放 | 波多野结衣伦理在线观看 | 丁香五香天堂 | 日本mv精品中文字幕 | jk制服蕾丝超短裙流白浆 | www日本视频 | 洗濯屋H纯肉动漫在线观看 武侠艳妇屈辱的张开双腿 午夜在线观看免费观看 视频 | 久久精品国产亚洲AV蜜臀 | 四虎影院新网址 | 草草草在线 | 91精品国产品国语在线不卡 | 亚洲香蕉伊在人在线观婷婷 | 99精彩免费观看 | 精品亚洲麻豆1区2区3区 | 欧美日韩中文字幕在线视频 | 国产大乳美女挤奶视频 | 国产资源中文字幕 | 91久久精品国产一区二区 | 久久精品一卡二卡三卡四卡视频版 | yy6080久久国产伦理 | 清纯漂亮女友初尝性过程 |