• 大小: 0.57M
    文件类型: .pdf
    金币: 1
    下载: 0 次
    发布日期: 2021-03-27
  • 语言: 其他
  • 标签: 其他  

资源简介


torque很好用的一款作业管理软件,但是torque的作业调度器过于简单,因此,搭配maui,效果很好。
4.3默认队列设置 fqmgr: create queue dque queue type=execution #qmgr: set server default queue=dque #qmgr: set queue dyue started=true #qmgr: set queue dque enabled=true #qmgr: set server scheduling=true 队列名是dque 5C0 mute node配置 5.1修改 server name(定要内网域名,不然状态会是down) #vi/var/spool/ torque/server name 52启动 pbs mor tpbs mom 53所有节点都执行完后,启动 pbs server # -t quick (关闭pbs s cryer 4pb (启动 pbs serv 54查看节点状态 #pbsnodes-1 free #pbsnoddes - 如果全都显示down,那么可能是 server namc设置有问题。 6.作业管理 6提交qb gsul sccp 30 qs 这里着重介绍第种方式,这样就会涉及pbs脚本的编写。以下摘自网上的两个脚 本 (1)串行计算脚本 #!/bin/sh #PBS-N job name 4PBS-o job log # -e job. err #PBS -q dque cd yourworkdir cho running on hosts hostname echo Time is dale echo Directory is SPWD echo This job runs on the following nodes cat SPBS NODEFILE echo This job has allocated l nodc yourprog 上述脚本利用qsub命令提交后,表小进入 vourworkdir目录 后,提交到dque队列,其作业名为 job name,标准输出和错误输出将分别存在此目 参数后分别设置的是这个作业的名字 job name、标准输出定向到的文件名jbl 录下的job.log和job.er文件中。上述脚木中以APBS开头的儿行的N、-o、-e、 标准错误输出定向到的文件名job.er、作业使用的队列名dque。 作业脚本编写完成后,可以按照下面命令提交作业 结果如卜 20. cluster. local (2)并行计算脚本 4!/bin/sh #PbS-n job name #PBS -o job log #PBS -e job. err #PBS -a douc 4PBS-I nodes=4 cd yourworkdir echo time is date echo Directory is SPWD cho This job runs on the following nodcs cat SPBS NODEFILE NPRoCS-wC-K<SPBS NODEFILE echo This job has allocated NPROCS nodes mpiexec-machinefile SPBS NODEFILE-np SNPRoCS /yourprog 与串行程序的脚木相比,主要不同之处在」在HPBS廾头的1参数后设置: nodes 所需要的进程数,另外请注意需采用 piCCo的命令格式提交并行可执行程序 与串行作业类似,可使用下面方式提交 S gsub par job. pbs 62作业查看qat Sqstat-I Systat 这两条命令都可以查看作业状态,但是加了-1后才能看到 node id的全称,知道 全称才能对作业管理。 Tkey@acluster root]S qstat Job id Na ame User Time Use s Queue -= 一-------- 24. cluster STDIN ke 0 o batch Tkey(@cluster rootS qstat-1 Job id N ame User Time Use s Queue m一 I 24cluster b jtu STDⅠN ey o batch 63作业终止qdel Sqdel 24cluster b 64作业挂起qhod 6.5挂起取消qrls 7MAUI安装 由于 torquc的作业调度器 torquc sched的功能过于简单,因此我们使用MAU来实现作 业调度 7.1下载Maui http:/www.clusterresources.com/products/maui-cluster-scheduler.php 72安装Maui Maui只需在服务节点 server nodc上安装即可 ftar zxvf maul-3.0.0.5.t (注意版本号) cd maui-3.0.0.5/ 配置安装路径及pbs连接(注意实际路径) 4. configure -=/optmaui-300.5-with-pbs-/opV/lorque-300.5 #makc make instal 7.3配置Maui usr/ locali maui/ maui.cfg默认情况就能用,不过可以修改进行髙级运用 7.4添加路径 在etcφ profile后追加Maui路径(注意实际路径)。 #vim /etc/profile MAUF/opt/ maui.2.6p20 [ idu eq0]; then PATH=SPA TH: STORQUE/bin: STORQUE/Shin: SMAUI/bin: SMAUI/sbin else PATH-SPATH: STORQUE/bin: MAUI/bin fi #source /etc/profile (更新 letc/profile使其生效) 7.5启动Maui maui 服务器节点上不用开启 torque sched服务。

资源截图

代码片段和文件信息

评论

共有 条评论