USTC服务器使用笔记

Wesley13
• 阅读 837

本机系统:Windows 10 (我真是坚持走在用Windows写python的路上不回头。。。)

使用软件:putty(ssh连接) 和 WinSCP(文件管理)

1.登陆

putty软件输入IP地址和端口号, 登陆gwork

2.环境

/ghome下的有一userid命名的文件夹,账号创建即生成,限额20G, 代码及script文件放在这里

/gdata下可以自从创建userid命名的文件夹,限额300G,用于储存job生成的结果。

/gpubg公共数据区

3.使用

调试:从gwork主机sshG101,断开ssh连接的方法,logout

startdocker -u "-it" -c /bin/bash bit:5000/deepo

bit:5000/deepo是一个集中了几乎所有深度学习框架的一个docker 镜像,使用上述命令将进入docker container内部,相当于一个虚拟机,
 你在内部对系统所做的任何操作都将在系统退出后丢失,但对用户根目录下(/ghome/<username>)的文件操作将不会丢失。
 此命令没有用-P命令挂载用户代码和配置目录,系统默认挂载了整个用户根目录,也没有使用-D挂载数据目录,用户可以根据需要挂载。

退出docker的命令:

exit

退出G101后,查看镜像的命令

sudo docker images

如果没有正确得退出docker(如直接关闭terminal),需要利用命令查看docker id,并且关闭

sudo docker pssudo docker stop CONTAINER_ID

调试成功后,编写pbs文件提交,注意windows系统下的换行符需要改成unix模式(可以使用notepad++编辑器)。

pbs中的命令行如下:

startdocker -D <mydatapath> -P <my-proc-config-path> -s <my-script-file> bit:5000/deepo

""" -s 参数后的my-script-file 可以是shell脚本或python脚本,但都需要在第一行加解释器,如
 shell脚本需要加:
 #!/bin/bash
 python脚本需要加:
 #!/usr/local/bin/bash"""

下面是一个pbs文件示例:

#PBS -N myjob1
#PBS -o /home/liulm/myjob1.out
#PBS -e /home/liulm/myjob1.err
#PBS -l nodes=1:gpus=1:S
#PBS -r y
cd $PBS_O_WORKDIR
echo Time is 'date'
echo Directory is $PWD
echo This job runs on the following nodes:
cat $PBS_NODELIFE
cat $PBS_GPULIFE
./myproc"""

-N: job 名

-o: 输出文件路径

-e: 报错文件输出路径

-l: 集群资源分配, 节点数和gpu数(通常一就可以满足要求)

-r:  任务操作类型, -r表示job立即执行

"""

对job的操作指令集合:

qsub myjob1.pbs
#提交作业
qstat -n
#查看作业
qhold job_id
#挂起作业,被挂起的job状态显示为H
qrls job_id
#取消挂起作业,job重新运行
pbsnodes
#查看节点
pbsnodes -l free
#查看空闲节点

 4.自定义docker镜像文件(相当于安装库?)

emmm,步骤比较复杂。

而自己python程序中比较小的packeage可以使用如下方法:

不需要构建镜像。以numpy为例:
1. 下载numpy的源码(一般能从个人PC上拷贝),放入服务器上的某个目录,比如/gdata/xxx/pylib
2. 挂载目录,-v /gdata/xxx/pylib:/data/pylib
3. 将挂载后的目录加入python import的搜索路径,两个方法
   a. 指定容器的PYTHONPATH, 在startdocker的-u里面加入-e PYTHONPATH=/data/pylib,此时/data/pylib的
      优先级可能次于系统自带路径(没测过),import numpy 会导入系统的numpy
   b. 在程序的一开始加入下面两行代码
      import sys
      sys.path.insert(1, '/data/pylib')
      1表示/data/pylib的优先级仅次于程序所在目录
      此时/data/pylib的优先级高于系统自带路径,import numpy 会导入/data/pylib的numpy

5. DGX1服务器使用

slurm构成的小集群, 操作仍在gwork 上,共享文件系统

script格式如下:

my.slurm

#!/bin/bash
#SBATCH --job-name=myjob1
#SBATCH -gres=gpu:4
#SBATCH --output=myjob.out
echo "Submitted from $SLURM_SUBMIT_DIR" on node "$SLURM_SUBMIT_HOST"
echo "Running on node "$SLURM _JOB_NODELIST
echo "Allocate Gpu Units:" $CUDA_VISABLE_DEVICES
##program here##
startdocker {-c <mycd>|-s <myscript>} nvdl.githost.io:4678/dgx/cuda:9.0-cudnn7-devel-ubuntu16.04

操作命令:

sbatch <myscript>
#提交文件
squeue
#查看队列情况
scancel <jobid>
#取消job
点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Stella981 Stella981
3年前
Android蓝牙连接汽车OBD设备
//设备连接public class BluetoothConnect implements Runnable {    private static final UUID CONNECT_UUID  UUID.fromString("0000110100001000800000805F9B34FB");
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这