常见问题
发布时间:2023-11-22 作者:[信息网络中心]程印乾 阅读:569次
1、我想用学校的高性能计算平台做计算,从哪里开始?
请访问高性能计算平台:https://hpc.cugb.edu.cn。
简单来讲分为如下几个步骤:1)申请账号;2)登录平台;3)准备数据;4)提交作业
2、为什么从docker hub拉镜像会失败?
答:目前平台暂不支持ubuntu22.04版本,支持的版本如下:CentOS: 6,7,8 Ubuntu: 14.04,16.04,18.04,20.04
3、队列有空闲节点,但任务在排队?
答:高性能计算校级公共平台采用slurm作业调度系统,整个队列中可能有需要占用多节点的高优先级任务正在等待资源,
调度器会一定程度上为这些作业保留资源,以确保它们能够运行。可以命令行执行squeue查看排队情况,当NODELIST(REASON)列显示状态为resource或者priority时,
代表正常排队中,有资源释放排队任务会自动运行。
4、文件不小心误删了怎么办?
答:由于集群采用共享存储,文件删除无法找回,请谨慎执行rm命令。
5、我可以指定计算节点进行作业提交么?
答:可以,#SBATCH --nodelist 是 Slurm 工作负载管理器的一个选项,它允许你指定一个或多个计算节点来运行你的
作业。你可以在你的 Slurm 脚本中使用这个选项,或者在 sbatch、salloc命令行中使用它。例如,如果你想在名为
"comput2" 和 "comput6" 的节点上运行你的作业,你可以在你的 Slurm 脚本中添加以下行:
#SBATCH --nodelist=comput2,comput6
或者,你可以在 sbatch 命令行中使用 --nodelist 选项:
sbatch --nodelist=comput2,comput6 myscript.sh
或者,如果你想在名为 "comput2" 和 "comput6" 的节点上启动一个交互式会话,你可以使用
以下命令:
salloc --nodelist=comput2,comput6
请注意,你只能指定你有权限使用的节点,而且这些节点必须是可用的。如果你指定的节点不可用,或者你没有权限使用它
们,你的作业可能无法启动。
6、我能通过命令行查询我排队作业的预计开始时间么?
答:在使用 Slurm 工作负载管理器的系统中,你可以使用 squeue
命令来查看队列中的作业,但是默认情况下,它并不会显示作业的预计开始时间。然而,你可以使用 squeue
的 -o
或 --format
选项来自定义输出,并包含预计开始时间。
例如,你可以使用以下命令来显示每个作业的作业 ID、用户名和预计开始时间:
squeue -o "%i %u %S"
在这个命令中,`%i`、`%u` 和 `%S` 是格式说明符,分别代表作业 ID、用户名和预计开始时间。
然而,需要注意的是,这个预计开始时间是一个估计值,实际的开始时间可能会因为各种因素(如其他作业的运行时间、系统的负载等)而有所不同。
7、我需要安装软件,能帮我安装一下吗?
答:对于开源软件如果需要root权限,请下载安装程序后放在home目录下联系管理员安装。对于商业软件,请将安装程序及正版授权放在home目录下联系管理员安装。对于可以通过conda安装的软件请自行安装。
8、我的计算程序在台式机和笔记本上运行很慢,在超算集群上运行是不是就会加快?
答:简单的结论是不一定,需要具体问题具体分析。串行程序加速效果不会明显,并行程序如果可以多核并行,性能可能会有所提升。
9、我原来都是在windows上操作软件,不会用Linux,我现在想学习一些基本的Linux操作,满足超算上机需要,应该学哪些内容?
答:首先了解一下Linux的目录结构,Linux的目录以树形组织。
其次学习几个常用的Linux命令,主要是:
pwd –查看当前所在目录
cd –改变目录
cp –复制文件
rm -删除文件
mv –文件重命名
mkdir –创建目录
10、用户的个人数据及其它可以长期保留在平台上吗?
答:不可以。高算平台为校级公共资源,高算中心将定期清理长期占用资源的“僵尸”数据,同时,为了避免不必要的网络或系统风险,请各位用户务必及时备份重要个人数据,以免给您造成损失。
11、充值充多少合适?
答:需要用户根据收费标准和使用习惯自行进行预估;
例如申请32个核心,用满24小时价格最低为32 * 0.08 * 24=61.44元;
一块GPU卡,用满24小时价格最低为1 * 3.6 * 24=86.4元。
12、如果校内转账,从项目的哪个科目报销?
答:建议“其他委托业务费”
13、在发表论文中,如何注明高性能计算平台支持?
答:目前,高性能计算校级平台对支持发表的论文制定了机时费奖励政策,用户在发表论文时,需要注明 “本研究工作得到中国地质大学(北京)高性能计算平台支持” (This work was supported by the High-performance Computing Platform of China University of Geosciences Beijing.),并通过本平台提交成果报告,审核通过后,获得相应机时奖励。