面向科研狗的服务器运维——服务器搭建维护到排障

server/2025/1/15 12:42:11/

系列文章目录

写在前面:某高校的苦逼计算机博士生。因为之前在高性能计算国家重点实验室做工程师,也负责了当时的超算节点的部分运维工作,所以现在也承担了组里的服务器运维工作。
 


文章目录

  • 系列文章目录
  • 前言
  • 一、pandas是什么?
  • 二、使用步骤
    • 1.引入库
    • 2.读入数据
  • 总结


前言

提示:这里可以添加本文要记录的大概内容:

例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


提示:以下是本篇文章正文内容,下面案例可供参考

一、服务器选型

这里就不赘述了,根据实验室资金选就好了。如果资金有限可以根据如下做考虑:

一)类型

这里指外观类型,和实验室占地有关。具体可以参考以下表格。另外简单来说:如果机器放在实验室,建议使用塔式服务器且风扇要选静音的!如果是在机房,有多个服务器要放置,建议直接配好机架,并根据机架选择4U(更强大兼容更强)或者2U机架式。如果做CPU任务或者网络任务,没有过多的GPU需求建议刀片式,CPU节点要求多,直接定制HPC Cluster吧,我之前工作时管理的就是400个Nodes集群,都是半裸式的!

服务器类型特点适用场景
塔式服务器易于安装,扩展性强小型企业及家庭使用
机架式服务器适合密集部署,空间利用高数据中心及企业环境
刀片服务器高密度、高性能大型企业及云计算环境
高性能计算(HPC)提供极高计算能力科研、模拟与建模任务

二)配件

CPU

塔式:一般都是单核(只带4个以内的GPU),富哥直接

机架式:

HPC集群:看供应商怎么给你配吧,越强越好,有钱直接双i9,单核性能拉满。一般用风冷

GPU

任务:看你是什么任务,一般机器学习就RTX就行,目前3090性价比最高,富哥选4090,穷的话2080Ti,一定要显存24GB的!大模型或者大参数量任务就选显存高的,进阶A40<A6000(40GB),有钱就A100,H100,富哥组用A800,H800

塔式:一般智能2-4块

机架式:4U能装8块

HPC集群:胖节点应该是2块

RAM

ECC(一般服务器都带)一般4卡以下64GB(32GB双通道),4卡用128GB以上(32X4多通道),8卡用256GB以上,主频3200以上

硬盘主要看内槽位和外槽位,内槽位主要装固态
主板这个没有太多能选的,看供应商。一般华硕够用了,有钱点选服务器板子,富哥选H3C
电源

塔式:

机架式

HPC集群:

三)进阶:路由与组网

(未完待续,先发出来占位,会一直更新的)

二、服务器配置

三、运维常见故障

四、Tricks

总结

以上所有内容是根据自己在实验室经验


http://www.ppmy.cn/server/158559.html

相关文章

16. C语言 字符串详解

本章目录: 前言C 字符串的基础概念字符串的定义字符串的内存表示 常见的字符串操作函数示例代码 深入探讨字符串长度计算strlen 与 sizeof 的区别 字符串操作的注意事项**1. 字符数组的大小**2. 字符数组和字符指针的区别3. 使用安全函数 字符串的遍历与格式化输出**遍历字符串…

LabVIEW水位监控系统

LabVIEW开发智能水位监控系统通过集成先进的传感技术与控制算法&#xff0c;为工业液体存储提供精确的水位调控&#xff0c;保证了生产过程的连续性与安全性。 项目背景 在化工和饮料生产等行业中&#xff0c;水位控制的准确性对保证生产安全和提高产品质量至关重要。传统的水…

初识C++(二)

六、引用 引用不是新定义一个变量&#xff0c;而是给已存在变量取了一个别名&#xff0c;编译器不会为引用变量开辟内存空间&#xff0c;它和它引用的变量共用同一块内存空间。 通俗地讲&#xff0c;可以理解为一个人能够拥有多个称呼&#xff0c;这些所有的称呼都是表示这一…

基于单片机的智能花卉浇水系统的设计与实现

摘要&#xff1a; 随着人们生活水平的不断提高&#xff0c;生活节奏也越来越快。人们经常忽视办公室或者家居的花卉&#xff0c;忘记浇水。本文设计了一种基于单片机的智能浇水系统。目的是解决养殖花卉的人忘记浇水的问题。本系统以单片机AT89S52为控制芯片&#xff0c;能够按…

Jmeter命令行生成html图形化报告失败反而生成temp文件问题解决

Jmeter生成html报告命令&#xff1a; jmeter -n -t 脚本文件名 -l 日志文件名 -e -o 目录名 出现这一问题的原因有二&#xff1a; JDK版本不对&#xff0c;我原先使用JDK17&#xff0c;后来使用JDK1.8版本就解决了打开 jmeter.properties 文件&#xff08;在Jmeter根目录的bi…

【Go】Go并发编程基础详解

1. 操作系统发展历程 1.1 进程概念 进程是程序的一次运行过程&#xff0c;进程这个概念是比较抽象的&#xff0c;从来就没有标准统一的定义&#xff0c;进程主要包含三部分要素&#xff1a;程序、数据、进程控制块 程序&#xff1a;用于描述进程要完成的功能&#xff0c;是控…

【数学】概率论与数理统计(五)

文章目录 [toc] 二维随机向量及其分布随机向量离散型随机向量的概率分布律性质示例问题解答 连续型随机向量的概率密度函数随机向量的分布函数性质连续型随机向量均匀分布 边缘分布边缘概率分布律边缘概率密度函数二维正态分布示例问题解答 边缘分布函数 二维随机向量及其分布 …

《自动驾驶与机器人中的SLAM技术》ch8:基于 IESKF 的紧耦合 LIO 系统

目录 基于 IESKF 的紧耦合 LIO 系统 1 IESKF 的状态变量和运动过程 1.1 对名义状态变量的预测 1.2 对误差状态变量的预测及对协方差矩阵的递推 2 观测方程中的迭代过程 3 高维观测中的等效处理 4 NDT 和 卡尔曼滤波的联系 5 紧耦合 LIO 系统的主要流程 5.1 IMU 静止初始化 …