ARM发布新一代高性能处理器N3

embedded/2024/11/14 12:16:02/

简介

就在2月21日,ARM发布了新一代面向服务器的高性能处理器N3和V3,N系列平衡性能和功耗,而V系列则注重更高的性能。此次发布的N3,单个die最高32核(并加入到CCS,Compute Subsystems,包含Core,System Ip等),以CCS来讨论,每瓦性能比上一代提升20%-50%。而Neoverse V3,单个die最高64核(加入CCS),ARM似乎更强调其AI相关的分析能力,并于Neoverse V2 相比,Neoverse V3 在机器学习方面提供了+96%的性能提升,在RDBMS上提供了+16%的性能提升,在加密货币方面提供了+9%的性能提升,在整数工作负载方面提供了+12% 的性能提升。与此同时,相关的系统IP同时发布,例如新一代的CMN S3,这将取代前一代的CMN700,但没有更多的信息。

V3微架构的改变

Neoverse™ V3处理器应用 Arm®v9.2-A架构,Core接口使用DSU-120,Core总体性能提升没有官方数据,部分分析认为相比较前代提升大约在10~20%。

MMU

MMU,左为V3,右为V2

MMU,左为V3,右为V2

MMU仍然延续经典的2级TLB结构,更细节的微架构设计手册没有过多的描述,Translation Cache,聚合,预取等传统技术依然存在,对于L2 TLB,3代微架构没有明显的改变。最大的改变是 L1 TLB,其中ITLB的entry从V2的48entry升级到V3的128entry,而DTLB 从48entry升级为96entry。最具特点的是ITLB的巨大升级,可能是为了应对AI场景下,指令集地址变化更频繁。这也是为什么ARM对V3更强调AI场景的分析。

L1 Cache

ICache,上为V3,下为V2

ICache,上为V3,下为V2

ICache的改变主要在V3抛弃了Macro-Operation Cache(手册没提,应该是放弃了),这里亦安分析可能是对于精简指令集,这种做法性价比不高,或者设计确实没有达到理想的状态,再者,ARM本身非常关注功耗,所以在V3处理器版本抛弃了这种微架构。手机端A77,A78,X1,X2,X3均具有MOPCache,X4放弃该微架构。

DCache在参数上描述无差异。

L2 Cache

L2 cache,上V3,下V2

L2 cache,上V3,下V2

L2从官方描述上看,从原来的V2(1-2MB)升级V3(2-3MB),其它参数没有明显变化,详细的微架构尚不清楚。

总结

由于V3/N3刚刚发布,其它例如预测器,乱序等模块的微架构尚不清晰,等待公布更多信息再聊,除去按照惯例的性能提升描述,比较值得关注的是ARM对处理器涉及AI分析的强调,由此可以知道近几年AI发展对整个芯片行业的巨大冲击,似乎只有往AI上靠,才会获得市场的青睐,这一场AI争夺战已经进入白热化,芯片行业本身就处在中心。


http://www.ppmy.cn/embedded/107199.html

相关文章

基于uniapp的畅玩旅游景点门票预订系统的设计与实现b3w12 微信小程序

目录 博主介绍技术栈系统设计🌟文末获取源码数据库🌟具体实现截图后端前端java类核心代码部分展示可行性论证个人心得系统测试操作可行性源码获取详细视频演示 博主介绍 👇🏻 博主介绍:👇🏻 专…

如何本地搭建Whisper语音识别模型|语音识别|本地部署

目录 1. 环境配置 1.1 操作系统要求 1.2 安装依赖库 1.3 GPU支持的配置 2. 获取Whisper模型 2.1 克隆Whisper代码库 2.2 下载预训练模型 3. Whisper模型的部署与使用 3.1 加载Whisper模型 3.2 处理音频数据 3.3 语音识别 4. Whisper模型的高级配置与优化 4.1 自定…

利用TOPSIS算法进行生长素和施肥量对农作物各指标影响力的分析

文章目录 1 摘要2 问题的重述1. 背景介绍2. 问题的产生及进行数学建模的意义 3 TOPSIS算法1. TOPSIS算法介绍2. TOPSIS算法使用步骤 4 问题的分析1. 对问题一的分析及解答2. 对问题二的分析及解答3. 对问题三的分析及解答 5 模型的改进1. 验证2.模型改进…

聊聊,IEEE论文的含金量!

IEEE论文的含金量在学术界被广泛认可,这主要体现在以下几个方面: 学术价值:IEEE论文的学术价值体现在其研究内容的深度和广度上。这些论文通常涉及前沿的科学技术问题,提出创新性的理论、方法或实验结果。例如,在人工…

STL容器中 list(双向链表)的增删改查

list(双向链表) std::list 是 C 标准模板库(STL)中的一个容器,它实现了一个双向链表。双向链表中的每个元素都包含三个部分:存储数据的元素本身、指向前一个元素的指针(或迭代器)、…

Python 和 Java 区别是什么?哪个运行效率高?为什么?

一、Python 和 Java 的区别 1. 编程风格 • Python 是一种解释型动态编程语言,语法简洁、灵活,代码较为简洁直观,注重代码的可读性和简洁性,使用缩进来表示代码块。 • Java 是一种编译型静态编程语言,语法相对严谨…

[Leetcode] 接雨水(相向双指针)

可以直接移步大神的解题思路,非常详细 -> 盛最多水的容器 接雨水_哔哩哔哩_bilibili 11. 盛最多水的容器 https://leetcode.cn/problems/container-with-most-water/description/ 42. 接雨水 https://leetcode.cn/problems/trapping-rain-water/description/ 11…

python实现人工蜂群算法

博客目录 引言 什么是人工蜂群算法(ABC)?人工蜂群算法的应用场景为什么使用人工蜂群算法? 人工蜂群算法的原理 人工蜂群算法的基本概念人工蜂群算法的三种蜜蜂类型人工蜂群算法的流程人工蜂群算法的特点与优势 人工蜂群算法的实…