常见问题

发布时间:2023-11-22     作者:[信息网络中心]程印乾    阅读:306

1、我想用学校的高性能计算平台做计算,从哪里开始?

请访问高性能计算平台:https://hpc.cugb.edu.cn。

简单来讲分为如下几个步骤:1)申请账号;2)登录平台;3)准备数据;4)提交作业

2、为什么从docker hub拉镜像会失败?

答:目前平台暂不支持ubuntu22.04版本,支持的版本如下:CentOS: 6,7,8    Ubuntu: 14.04,16.04,18.04,20.04

3、队列有空闲节点,但任务在排队?

答:高性能计算校级公共平台采用slurm作业调度系统,整个队列中可能有需要占用多节点的高优先级任务正在等待资源,

调度器会一定程度上为这些作业保留资源,以确保它们能够运行。可以命令行执行squeue查看排队情况,当NODELIST(REASON)列显示状态为resource或者priority时,

代表正常排队中,有资源释放排队任务会自动运行。

4、文件不小心误删了怎么办?

答:由于集群采用共享存储,文件删除无法找回,请谨慎执行rm命令。

5、我可以指定计算节点进行作业提交么?

答:可以,#SBATCH --nodelist 是 Slurm 工作负载管理器的一个选项,它允许你指定一个或多个计算节点来运行你的

作业。你可以在你的 Slurm 脚本中使用这个选项,或者在 sbatch、salloc命令行中使用它。例如,如果你想在名为

"comput2" 和 "comput6" 的节点上运行你的作业,你可以在你的 Slurm 脚本中添加以下行:

#SBATCH --nodelist=comput2,comput6

或者,你可以在 sbatch 命令行中使用 --nodelist 选项:

sbatch --nodelist=comput2,comput6 myscript.sh

或者,如果你想在名为 "comput2" 和 "comput6" 的节点上启动一个交互式会话,你可以使用

以下命令:

salloc --nodelist=comput2,comput6

请注意,你只能指定你有权限使用的节点,而且这些节点必须是可用的。如果你指定的节点不可用,或者你没有权限使用它

们,你的作业可能无法启动。

6、我能通过命令行查询我排队作业的预计开始时间么?

答:在使用 Slurm 工作负载管理器的系统中,你可以使用 squeue 命令来查看队列中的作业,但是默认情况下,它并不会显示作业的预计开始时间。然而,你可以使用 squeue 的 -o 或 --format 选项来自定义输出,并包含预计开始时间。

例如,你可以使用以下命令来显示每个作业的作业 ID、用户名和预计开始时间:

squeue -o "%i %u %S"

在这个命令中,`%i`、`%u` 和 `%S` 是格式说明符,分别代表作业 ID、用户名和预计开始时间。

然而,需要注意的是,这个预计开始时间是一个估计值,实际的开始时间可能会因为各种因素(如其他作业的运行时间、系统的负载等)而有所不同。

7、我需要安装软件,能帮我安装一下吗?

答:对于开源软件如果需要root权限,请下载安装程序后放在home目录下联系管理员安装。对于商业软件,请将安装程序及正版授权放在home目录下联系管理员安装。对于可以通过conda安装的软件请自行安装。

8、我的计算程序在台式机和笔记本上运行很慢,在超算集群上运行是不是就会加快?

答:简单的结论是不一定,需要具体问题具体分析。串行程序加速效果不会明显,并行程序如果可以多核并行,性能可能会有所提升。

9、我原来都是在windows上操作软件,不会用Linux,我现在想学习一些基本的Linux操作,满足超算上机需要,应该学哪些内容?

答:首先了解一下Linux的目录结构,Linux的目录以树形组织。

其次学习几个常用的Linux命令,主要是:

pwd –查看当前所在目录

cd –改变目录

cp –复制文件

rm -删除文件

mv –文件重命名

mkdir –创建目录

10、用户的个人数据及其它可以长期保留在平台上吗?

答:不可以。高算平台为校级公共资源,高算中心将定期清理长期占用资源的“僵尸”数据,同时,为了避免不必要的网络或系统风险,请各位用户务必及时备份重要个人数据,以免给您造成损失。

11、充值充多少合适?

答:需要用户根据收费标准和使用习惯自行进行预估;

例如申请32个核心,用满24小时价格最低为32 * 0.08 * 24=61.44元;

一块GPU卡,用满24小时价格最低为1 * 3.6 * 24=86.4元。

12、如果校内转账,从项目的哪个科目报销?

答:建议“其他委托业务费”

13、在发表论文中,如何注明高性能计算平台支持?

答:目前,高性能计算校级平台对支持发表的论文制定了机时费奖励政策,用户在发表论文时,需要注明 “本研究工作得到中国地质大学(北京)高性能计算平台支持” (This work was supported by the High-performance Computing Platform of China University of Geosciences Beijing.),并通过本平台提交成果报告,审核通过后,获得相应机时奖励。



用户服务电话: 010-82322294 / 82322957

用户服务电话: 010-82322294 / 82322957