NVIDIA Ada Lovelace 架构

embedded/2024/12/22 23:58:45/

目录

3D 图形领域的突破性时刻。

第四代 Tensor Core

第三代 RT Core

着色器执行重排序

DLSS 3

AV1 编码器


致力于打造出色的游戏与创作、专业图形、AI 和计算性能。

3D 图形领域的突破性时刻。

Ada GPU 架构能够为光线追踪和基于 AI 的神经图形提供革命性的性能。该架构显著提高了 GPU 性能基准,更代表着光线追踪和神经图形的转折点。

第四代 Tensor Core

NVIDIA Tensor Core 推动并加快了 AI 技术的变革,包括 NVIDIA DLSS 以及可让帧率更大幅提升的全新 NVIDIA DLSS 3。

凭借英伟达在 Hopper H100 数据中心 GPU 上首次推出的全新 FP8 Transformer 引擎,Ada 的全新第四代 Tensor Core 拥有不可思议的飞快速度,可将吞吐量提升 4 倍,达到1.4 Tensor-petaFLOPS。

NVIDIA Tensor Core

NVIDIA 第三代 RT Core

第三代 RT Core

NVIDIA 发明的 RT Core 在视频游戏中实现了实时光线追踪。这种搭载在 GPU 上的特殊核心专为处理性能需求密集的光线追踪工作负载而设计。 

Ada 架构采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。

新款 RT Core 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒和围栏。DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构 (BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。

着色器执行重排序

高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染 3D 场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。)

着色器执行重排序 (SER) 技术能够动态调整这些工作负载的顺序,让原本低效的流程变得异常高效。SER 可将光线追踪操作的着色器性能最高提升 2 倍,或将游戏的帧率最高提升 25%。

着色器执行重排序技术

NVIDIA 光流加速器

DLSS 3

NVIDIA DLSS 3 是 AI 驱动图形领域的革命性突破,可大幅提升性能。DLSS 3 由 GeForce RTX 40 系列 GPU 所搭载的全新第四代 Tensor Core 和光流加速器提供支持,可利用 AI 创造更多高质量帧。

AV1 编码器

基于 Ada 架构的全新显卡配备了支持 AV1 编码的全新第八代 NVIDIA 编码器 (NVENC),可为主播、广播爱好者和视频通话用户带来更多新的尝试和体验。

该技术的效率比 H.264 高 40%,这有助于主播在保持直播推流比特率不变的情况下,将画面分辨率从 1080p 提高到 1440p,且画质依然稳定。

采用 AV1 编码的 NVIDIA 编码器


http://www.ppmy.cn/embedded/104474.html

相关文章

算法的学习笔记—最小的 K 个数(牛客JZ40)

😀前言 在编程面试中,找出一个数组中最小的K个数是一个常见的问题。虽然看似简单,但要在高效性方面有所保证却并不容易。本文将介绍两种有效解决该问题的算法:基于堆的解法和快速选择算法。我们将详细讲解它们的实现方式、时间复杂…

强化学习与深度学习的结合

强化学习与深度学习的结合 目录 一、引言 二、强化学习基础 三、深度学习基础 四、强化学习与深度学习的结合实例 五、总结 一、引言 随着人工智能技术的不断发展,强化学习已经成为了计算机科学领域的一个重要分支。而深度学习作为一种强大的机器学习方…

K8S Service

K8S知识目录 Kubernetes(通常简写为K8s)中的Service是一种核心资源对象,它用于将一组Pod(容器组)抽象为一个单一的服务,使得这些Pod能够对外提供稳定的服务入口。 一、作用 提供稳定的网络终点&#xff…

C#——类与结构

在未学习面向对象语言时,我常常将类比作一种结构体,其实类与结构体也确实很相似,类用来做函数的集合,结构用来做变量的集合,接下来将从几个角度刨析类与结构的不同。 类 vs 结构 类和结构在设计和使用时有不同的考虑…

常使用的前端构建优化策略

在前端开发中,构建优化是提升网站或应用性能、提高用户体验的重要手段。以下是一些常用的前端构建优化策略,它们涵盖了代码优化、资源加载优化、缓存利用、网络优化等多个方面。 一、代码优化 1. 精简代码 移除冗余代码:检查并删除未使用的…

音视频入门基础:WAV专题(7)——FFmpeg源码中计算WAV音频文件每个packet的size值的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以显示WAV音频文件每个packet(也称为数据包或多媒体包)的信息&#xff0…

在Ubuntu上使用apt工具安装RabbitMQ

创建安装脚本 cd home/ madir scripts cd scripts 创建脚本前,需要确认Linux版本。不同的版本对应着不同的运行脚本。 lsb_release -a 查看Linux版本 可以看到,我的Ubuntu版本是22.04。 在这里找到对应的脚本复制。 创建脚本文件: ca…

驱动开发系列17 - PCI总线

一:概述 PCI(外设计算机互连)或PCIe总线是现代计算机的主要组成部分,了解它的工作原理对于理解许多Linux设备驱动程序非常重要。 关于PCI总线本身有很多好的信息(在维基百科和其他地方),而Linux内核中也有关于PCI处理子系统实际实现的文档。然而,这两种现有来源…