仿真的硬件选型原则:CPU

news/2024/10/30 15:30:11/

    做各类仿真工作,硬件条件是最基础的部分。如今主流仿真应用(结构有限元、流体CFD等)是基于CPU运行的,因此CPU的性能直接决定了仿真求解速度。本文就自身的理解,简单讲述CPU选型的几个基本原则。

1 架构与制程

    基本原则:买新不买旧,一定要选发布时间较近的CPU,可以多考虑AMD的产品。

    架构(architecture)是硬件的基本设计框架,直接决定了CPU的整体性能。和架构相关的另一个概念叫制程(fabrication process),表示了芯片内电路之间的间距。

    通常而言,新架构会采用更先进制程,会比使用不那么先进制程的旧架构更优秀,因此可实现更强大的性能。制程则数字越低越好,例如7nm制程比14nm制程好。

    近几年AMD和英特尔的架构、制程信息总结如下,格式:年份/架构名/制程/产品举例。规划中的产品线信息根据近期的新闻总结。

AMD:

2019 / Zen 2 / 7nm / Ryzen 9 3950X

2020 / Zen 3 / 7nm / Ryzen 9 5950X

2022 / Zen 4 / 5nm / Ryzen 9 7950X

规划中:2024 / Zen 5 / 3nm / 

英特尔:

2020 / Comet Lake / 14nm / i9 - 10900

2021 / Rocket Lake / 14nm / i9 - 11900

2021 / Alder Lake / 10nm / i9 - 12900

2022 / Raptor Lake / 10nm / i9 - 13900

规划中:2024 / Meteor Lake / 7nm

2 核心数与频率

2.1 运行频率

    对于同一架构的CPU,频率决定了单核心性能。CPU的频率包括基准频率和最大加速频率两类,其中,基准频率是指空载状态下的CPU频率,最大加速频率是指满载运行下可以实现的最大运行频率。频率要求为越高越好。

2.2 核心数和线程的关系

    关于核心数问题,涉及核心线程的概念。利用超线程技术将一个CPU核心虚拟化为两个线程,可极大的方便操作系统进行硬件资源调度。但是超线程技术不会实际增加算力操作系统分配CPU资源是按照线程进行分配,而不是核心。

    类比举例,CPU算力资源是一大碗菜,每个需要CPU的程序是夹菜的人,超线程技术则将菜(CPU算力)均分为两小碗(一个核心虚拟化为两个线程),当多人吃菜(多个程序抢CPU资源)时,更容易将菜分配给每个吃菜的人(算力根据程序需求进行分配)。

    在仿真软件的求解设置界面中,设置的调用核心数应该基于线程数,而非CPU核心数。应用程序不可能越过操作系统直接调度硬件资源。

    任务管理器中显示的CPU信息如图,核心(cores)数量8,线程(logical processor)数量16。在仿真软件的求解计算设置界面中,调用核心数输入16才能使CPU满载运行;输入8只能使一半核心满载,一半核心空载。

2.3 核心数选型原则

    核心数选择根据主要应用场景决定。所有程序都会出现核心数增加后并行效率恶化的趋势,因此无限制的增加CPU核心数并不能显著降低求解的时间。其恶化趋势如图所示。

    对于并行加速效率较差的软件(例如各类基于有限元法的软件,包括ANSYS、Abaqus、HyperWorks、COMSOL等),可以考虑采用核心数中等,但是运行频率很高的型号,例如AMD线程撕裂者Pro 5965WX(24核心48线程,基准频率3.8GHz,最高加速频率4.5GHz)。由于程序本身的并行效率较差,因此进一步增加核心数量对于节约计算时间意义不大。

    对于并行加速效率极佳的软件(例如基于有限体积法的Fluent、Star-CCM+,基于离散元法的EDEM等),可以考虑使用核心数更多的型号,至于单核心的频率则可以不要求太高,例如AMD线程撕裂者Pro 5995WX(64核心128线程)。

3 CPU类型

    仿真的CPU主要采用桌面CPU或服务器CPU,很少见笔记本的移动端CPU。而且通常笔记本电脑无论硬件算力还是散热条件,都难以运行复杂的仿真项目。

    对于同时代的CPU,因为实际上采用相同架构,因此两类CPU单核心的性能本身差异并不大。甚至部分服务器CPU因为可靠性需求而限制了频率,实际性能反而不如桌面CPU。服务器和桌面CPU,更多的差距在于两者在其他硬件的支持能力不同。部分服务器CPU型号支持多CPU扩展、大容量内存等,可适用于非常复杂的仿真问题。

3 CPU性能参考标准

    CPU性能对比,可直接参考性能测试软件(performance benchmark software)的评分。整体而言,测试软件评分更高的CPU,其性能更强。不同性能测试软件的测试方法、打分标准等均不同,且侧重于不同的应用场景,因此需要参考多方性能测试数据做综合对比,且详细比较同一测试软件中不同项目的测试结果。

对于仿真应用,可推荐的测试程序:

Geekbench(官网:browser.geekbench.com)

PassMark(官网:www.cpubenchmark.net)

4 其他注意事项

4.1 电源系统搭配

    电源如果供电功率不足或者供电质量太差(例如输出到主板的电压不稳定)会严重影响各设备的正常运行,甚至导致莫名其妙的死机等问题。电源输出功率要留有一定量余量,方便后续的硬件升级(如更换显卡、增加内存等)

4.2 散热系统搭配

    良好的散热是硬件充分发挥性能的必备条件。散热不佳会导致系统通过降频甚至强制关机断电等办法保护硬件。如果安装空间等条件足够,建议使用水冷系统,可以承载更大的散热负荷。与此同时,散热系统需要定期做维护保养,包括清理内部积灰、加注导热硅脂等,建议对散热系统做维护频率至少一年一次。

4.3 软件问题

    保持应用程序、操作系统、驱动程序、BIOS等软件部分的更新升级,使软件能够充分发挥硬件性能。特别是仿真软件本身,各个主要开发商均把提升并行效率,在更多核心数下可实现高效并行作为功能优化方向之一。

    如果不存在VMWare之类必须开启超线程才能运行的程序,可建议将超线程在BIOS设置为关闭。关闭后,一个CPU核心等同于一个线程,因此实现同样的算力,可使用更少的核心数,提升并行效率。

    关闭超线程提升并行效率的方法不适用于英特尔酷睿系列的12代及后续型号。原因在于,此方法的前提是每个CPU核心算力是相同的。酷睿系列的12代及后续型号采用大小核架构,仅大核(性能核)支持超线程,小核(效能核)不支持超线程,而且大核小核之间的算力差异巨大。

参考:

AMD产品手册 www.amd.com/en/products/specifications

英特尔产品手册 ark.intel.com/content/www/us/en/ark.html#@Processors


http://www.ppmy.cn/news/815436.html

相关文章

深度学习之选择GPU或CPU方法

1 TensorFlow设置方法 1.1 指定GPU 法1 import os os.environ["CUDA_DEVICE_ORDER"] "PCI_BUS_ID" os.environ["CUDA_VISIBLE_DEVICES"] "1"上边表示使用第二块GPU运行程序,如果要使用多块,如第一块和第三…

【装机必看】CPU该怎么选

CPU有四大重要参数:架构、核心、频率、缓存 一、架构 CPU架构是CPU商给CPU产品定的一个规范,主要目的是为了区分不同类型的CPU。目前市场上的CPU分类主要分有两大阵营,一个是intel、AMD为首的复杂指令集CPU,另一个是以IBM、ARM为…

网络编程5——TCP协议的五大效率机制:滑动窗口+流量控制+拥塞控制+延时应答+捎带应答

文章目录 前言一、TCP协议段与机制TCP协议的特点TCP报头结构TCP协议的机制与特性 二、TCP协议的 滑动窗口机制 三、TCP协议的 流量控制机制 四、TCP协议的 拥塞控制机制 五、TCP协议的 延时应答机制 六、TCP协议的 捎带应答机制 总结 前言 本人是一个普通程序猿!分享一点自己的…

如何从事区块链开发?

目录 第一部分:区块链基础知识第二部分:准备工作和环境设置第三部分:学习智能合约开发第四部分:实践项目开发第五部分:持续学习和跟踪行业发展第六部分:资源和工具 从事区块链开发是一个广泛的领域&#xf…

第二周复习

练习题 一、盒子模型&#xff08;登录窗口&#xff09; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>QQ登录窗口</title><style>.box{width: 450px;height: 350px;background-color:…

基于单片机汽车防盗报警的设计与实现

功能介绍 以STM32单片机作为主控系统&#xff1b;LCD1602液晶显示当前温度信息和参数等功能&#xff1b;3个LED指示灯表示&#xff1a;震动指示灯、人体感应指示灯、防盗模式开启指示灯&#xff1b;按键用来开启防盗模式&#xff0c;设置温度上下限&#xff1b;开启防盗后检测到…

以数字化、智能化、可视化为中心,打造智慧交通运维新标杆

交通作为国民经济和社会发展的基础性、先行性产业&#xff0c;在整个社会经济、民生发展中占有举足轻重的地位&#xff0c;随着包括5G基站建设、城际高速铁路和城市轨道交通、大数据中心、工业互联网在内的新基建按下加速键&#xff0c;轨道交通云联网加速实施。在此背景下&…

智能公交带来出行新感受,让城市公共交通变得更“聪明”

智能公交带来出行新感受&#xff0c;让城市公共交通变得更“聪明” ——以厦门公交为例 大家都知道&#xff0c;国内大部分城市交通费用拥堵&#xff0c;严重制约我国城市的经济发展&#xff0c;事实上&#xff0c;和发达国家比&#xff0c;国内城市私家车的保有量并不高&…