high perfermance computer usage

news/2024/10/18 18:29:10/

简单记一下hpc的使用:

hpc就是一些科研机构或者大学建立的服务器中心。我这大学的每一位学生,可以轻松使用hpc批量跑数据,也可以新建自己的server跑一些local data,后者每个学生账号最大是32核512G的运行内存,体验非常好,只不过只能使用jupyternote book或者R登录,也可以跑bash,总之非常nice。

新建自己的server跑jupyternote book就比较容易,例如:

from concurrent.futures import ProcessPoolExecutor
from tqdm import tqdm
# python
def my_func(x):return x**2
def run(f, this_iter):with ProcessPoolExecutor(max_wokers=32) a executor:results = list(tqdm(executor.map(f. this_iter), total=len(this_iter))return results
if name == '__main__':this_iter = [1,2,3,4,4,5,6]results = run(my_func, this_iter)# ipynb
from multiprocessing import Pool
from tqdm import tqdm
def my_func(x):return x**2
def run(f, this_iter):with Pool(max_wokers=32) a p:results = list(tqdm(p.imap(f. this_iter), total=len(this_iter))return results
if name == '__main__':this_iter = [1,2,3,4,4,5,6]results = run(my_func, this_iter)

两者区别就在于使用ProcessPoolExecutor 还是 Pool,还有map 和imap。其他都是一样的使用。
完全免费的32核512G云服务器,还可以加载2080Ti等显卡,我觉得这个科研资源算是非常好了,至少节省了自己2万左右资金。

第二个就是hpc节点的使用
hpc的集群节点主要是用来批量跑数据预处理,我主要是跑fmriprep和xcp-d。
首先是定义变量:

#!/bin/bash#$ -N sub-${subject}_fmriprep
#$ -pe smp 10
#$ -q UI
#$ -j y
#$ -o /Data/test/logs
#$ -t 1-29:1

这些是hpc的定义,例如-o表示output,-pe表示需求的核心数,-q是请求的节点端口等等。
然后可以自己自定义一些环境变量:

singularityDir=/Data/test
export TEMPLATEFLOW_HOME=${singularityDir}/TemplateFlow
export SINGULARITYENV_TEMPLATEFLOW_HOME=/templateflow

然后就可以使用fmriprep的脚本:

singularity run --cleanenv \
-B /Users/work:/work \
-B ${TEMPLATEFLOW_HOME:-$HOME/.cache/templateflow}:/templateflow \
${singularityDir}/fmriprep.sif \
/Data/test/BIDS/ /Data/test/fmriprep/ participant --participant-label ${subject} \
--skip_bids_validation \
--nprocs 8 --omp-nthreads 8 --mem 32000 \
-t rest \
-w work \
........
......

然后保存脚本,在服务器端口敲命令: qsub fmriprep_run.sh 即可。
可以用 qstat | grep ID 查看提交的作业是否正常在运行。
等运行结束以后,可以使用qacct -j {job_id} 查看fmriprep的运行过程。
以我这个为例,我的test脚本调用了8个核跑了一个被试,运行细节如下:
一个rest-state bold输出到2个空间,做体空间和皮层空间,cpu时间是84831s,最大内存是5.8G,运行时间是8小时30分钟。
一般来说,fmriprep只有几个步骤能跑满cpu,比如ants,还有一些步骤是跑不满的,所以假设同样8个被试,使用8个核心,一个一个跑,跟使用1个核心,8个一起跑,后者的时间应该是要短很多。
一种方法是,使用python脚本,建立Pool池,调用多个kernel,然后每个kernel去跑一个singularity。

## multiple subjects
#!/bin/bash
#$ -N sub-batchArray_fmriprep
#$ -pe smp 10
#$ -q PINC, CCOM, UI
#$ -j y
#$ -o /data/logs
#$ -t 1-27:1
OMP_NUM_THREADS=30
subject='cat /data/test/sublist | head -n+${SGE_TASK_ID} | tail -n-1'singularityDir=/data/test
...
...

http://www.ppmy.cn/news/1215680.html

相关文章

【Spring Boot】035-Spring Boot 整合 MyBatis Plus

【Spring Boot】035-Spring Boot 整合 MyBatis Plus 【Spring Boot】010-Spring Boot整合Mybatis https://blog.csdn.net/qq_29689343/article/details/108621835 文章目录 【Spring Boot】035-Spring Boot 整合 MyBatis Plus一、MyBatis Plus 概述1、简介2、特性3、结构图4、相…

307.区域和检索

​题目来源: leetcode题目,网址:307. 区域和检索 - 数组可修改 - 力扣(LeetCode) 解题思路: 线段树,以二叉树的形式存储部分区间之和及总和。 解题代码: class NumArray { privat…

微机原理_7

一、单项选择题(本大题共15小题,每小题3分,共45分。在每小题给出的四个备选项中,选出一个正确的答案。) 1,与十进制数1770.625对应的八进制数是()。 A. 3352.5 B. 3350.5 C. 3352.1161 D. 3350.1151 2.8 位有符号数二进制补码表示的整数的范围是() A. -…

如何评估一个需求?需求做不完,怎么办?

如何评估一个需求? 需求的背景是什么?为什么要做这个需求?这个需求有什么价值?这个需求对比人力的性价比怎么样?提前看需求文档,不懂得及时向产品提问哪些功能是新增的,哪些功能是修改的需求的…

『亚马逊云科技产品测评』活动征文|Amazon EC2 的讲解及相关服务

授权声明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 Developer Centre, 知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道 Amazon EC2 的讲解及相关服务 一、什么是 Amazon EC2?二、何为…

vue v-model

一、为什么使用v-model? v-model指令可以在表单input、textarea以及select元素上创建双向数据绑定。它会根据控件类型自动选取正确的方法来更新元素。本质上是语法糖,负责监听用户的输入事件来更新数据。 二、什么场景下会使用v-model? ①…

CC1310F128RSMR Sub-1GHz超低功耗无线微控制器芯片

CC1310F128RSMR QFN-32 Sub-1GHz超低功耗无线微控制器 CC1310F128RSMR是一款低成本、 超低功耗、Sub-1 GHz射频器件,它是Simplel ink微控制器(MCU)平台的一部分。该平台由Wi- Fi组成、蓝牙低功耗,Sub-1 GHz,以太网,Zigbee线程和主…

【done】剑指offer46_new:解密数字

题目:力扣165,https://leetcode.cn/problems/ba-shu-zi-fan-yi-cheng-zi-fu-chuan-lcof/description/ 现有一串神秘的密文 ciphertext,经调查,密文的特点和规则如下: 密文由非负整数组成 数字 0-25 分别对应字母 a-z 请…