跳转至

易奇超算平台使用手册

登陆系统

在确保vpn开启的情况下,启动终端(mac)或cmd(windows)等命令行工具:输入下列指令登陆服务器:

1
ssh p-hwc-sched-1.biolab.ekicloud.com
首次登陆时会收到如下提示:
1
2
3
4
The authenticity of host 'sched (10.27.12.5)' can't be established.
ECDSA key fingerprint is SHA256:ZNXGHp3Gi3lziOdaCUDRinH4qSt7KyHZyqtRp0C49a8.
ECDSA key fingerprint is MD5:49:91:8c:9d:0b:ac:44:fb:75:4c:2b:f3:43:4f:51:4f.
Are you sure you want to continue connecting (yes/no)?
输入yes之后会提示输入密码:
1
2
Warning: Permanently added 'p-hwc-sched-1.biolab.ekicloud.com,10.27.12.5' (ECDSA) to the list of known hosts.
zhenghy@p-hwc-sched-1.biolab.ekicloud.com's password:
输入个人密码即可完成登陆,登陆后会弹出欢迎界面:
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
Last login: Mon Apr 26 10:24:21 2021 from 10.3.1.102
(C) 2021 Beijing Ekitech Co. Ltd.

===============================================
 - Hostname............: p-hwc-sched-1.biolab.ekicloud.com
 - Disk Space..........: 64G remaining
===============================================
 - CPU usage...........: 0.00, 0.01, 0.05 (1, 5, 15 min)
 - Memory used.........: 832 MB / 7820 MB
 - Swap in use.........: 0 MB
===============================================

注意

登陆节点本身不能执行任务,请不要直接在登陆节点上执行任务

文件存放和工作地址

通常而言,您可以在两个位置存放您的软件和执行您的命令,即您的个人目录"/mnt/home/\(user"和工作目录"/mnt/scratch/\)user" 您存放在obs上的数据文件则存放在只读目录 "/mnt/bucket"中。

/mnt/home/$user目录

该目录是您的个人文件夹,您可以在此保存常用软件和参考数据等内容。您可以通过下面几种命令进入此目录:

1
cd
1
cd ~
1
cd /mnt/home/$user

注意

存放在此处的文件视总大小会产生一定费用,因此不建议长时间在此存放大量文件

/mnt/scratch/$user目录

该目录为共享工作目录,您可以在此执行任务或存放临时文件,此处的文件会被定期清理,因此请及时将需要长期保存的数据存放到obs中。

您可以通过下面的命令进入此目录

1
cd /mnt/scratch/$user

注意

存放在/mnt/scratch/$user目录中的文件清理周期为30天,文件被清理后无法恢复,请及时转移重要文件

/mnt/bucket目录

该目录是您组织的obs网盘挂载地址,您可以在这个只读目录中查看和读取存放在obs中的文件。

向计算节点提交任务

在登陆节点向计算节点提交任务主要包括两种方式,ekbatch和ekrun。

ekbatch会帮助您生成一个任务脚本,并自动帮您提交该任务,任务脚本和运行结果会存放在“/mnt/scratch/$user/ekbatch”中 使用方法如下: 输入ekbatch命令 会有如下提示:

1
2
3
Slurm Job Script Generator for hpc-class
Please set memory for this job.
  Notes: maximum memory you are allowed is 32 >
根据需要输入内存数(如1G)即可。如不输入单位,会使用默认单位MB, 之后会提示输入所需cpu数
1
2
Number of processor cores per node
  Notes: maximum processor cores you are allowed is 16 >
根据需要输入cpu数(如1)接下来,请输入要执行的任务
1
2
Specify the executable of your application.
 >
最后为输入本次任务的名字以便于查看结果
1
Specify a name for your job.
完整过程如下
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
❯ ekbatch
Slurm Job Script Generator for hpc-class
Please set memory for this job.
  Notes: maximum memory you are allowed is 32 >1G
Number of processor cores per node
  Notes: maximum processor cores you are allowed is 16 > 1
Specify the executable of your application.
 > hostname | wait 10 | hostname
Specify a name for your job.
 > show
your job begins running
Submitted batch job 311482

ekrun 命令用于执行需要实时反馈的任务。您仅需在您的命令增加 ekrun 既可以以一个cpu两g内存向超算系统提交一个任务并实时获得反馈。 如 ekrun your job;

您也可以在命令的任何位置输入interact来手动输入所需的内存数和计算核数等信息。如ekrun interact hostname。 执行上述命令会得到如下结果:

1
2
3
4
5
6
❯ ekrun interact hostname
Please set memory for this job:
 > 1
Number of processor cores per node
  Notes: maximum processor cores you are allowed is 32
 >  1

查询您的任务

你可以通过输入ekqueue来查询您当前的任务进行情况,查询结果一般如下图所示:

1
2
JOBID PARTITION                                               NAME     USER ST       TIME  NODES NODELIST(REASON)
311482     guest                               show_20210426-142156  xhliang CF       1:29      1 node-g-202

回到顶部