TensorRTC++在Win10下前向推理速度不稳定原因汇总

news/2025/2/13 2:54:13/

问题背景：在使用C++版本的TensorRT框架做模型推理时，会遇到前向推理速度不稳定的情况。

问题1：同一个模型，同一套代码在运行时速度不稳定，比如一会儿24ms，然后隔一会再去推理就变成了90ms，再又降到30ms。

问题原因：不仅TensorRT框架有这种现象，Libtorch、onnx框架也存在类似的情况。其根本原因是数据从显存到内存的时间不稳定所导致的，即：cudaMemcpyAsync in cudaMemcpyDeviceToHost mode is slow。

(

也可以自己用打印以下部分代码的运行时间验证结论：

1：预处理：vector< cv::Mat >—>float *
2：数据从内存喂入显存：cudaMemcpyAsync(mBinding[bindIndex], input, mBindingSize[bindIndex], cu

http://www.ppmy.cn/news/3662.html

Java8 新特性——日期时间

Java8之前，日期时间：java.util.Date是可变类型，SimpleDateFormat非线程安全旧版的 Java 中日期时间 API 问题： 非线程安全 − java.util.Date 是非线程安全的，所有的日期类都是可变的。设计很差 − Java的日期/时间…

Python进阶：Day1什么django框架，怎么使用，用在哪里？

前言：django框架大家好，我是辣条好久没有更新高能作品了，从今天开始我不定期更新系列作品，可能会偏向于中高级，没有基础的同学们可以看我往期的基础博文哦~ 亦或者直接通过文末底下名片直接找到辣条~ 废话不多说我们…

全网最通俗易懂的.Net C#教程之01_C#程序结构和数据类型

1.1 C# 程序结构一个 C# 程序主要包括以下部分： 命名空间声明（Namespace declaration） 一个 class Class 方法 Class 属性一个 Main 方法语句（Statements）& 表达式（Expressions） …

Python 基础| Python 直接赋值、深拷贝和浅拷贝

先看这三个词的意思我觉得菜鸟的总结就很好 Python 直接赋值、浅拷贝和深度拷贝 | 菜鸟教程直接赋值：其实就是对象的引用（别名）。浅拷贝(copy)：拷贝父对象，不会拷贝对象的内部的子对象。深拷贝(deepcopy)&#xf…

C语言画贝塞尔曲线的函数

程序截图简单说明这个函数就是 void drawBezierCurve(COLORREF color, const unsigned int len, ...) color 是贝塞尔曲线的颜色，len 是画出贝塞尔曲线所需要的点的个数，最少 1 个，不要乱传。之后的参数传的就是画出贝塞尔曲线要的点&am…

【刷题笔记】之牛客面试必刷TOP101（二分查找-I + 二维数组中的查找 + 寻找峰值 + 数组中的逆序对 + 旋转数组的最小数字 + 比较版本号）

目录 1. 二分查找-I 2. 二维数组中的查找 3. 寻找峰值 4. 数组中的逆序对 5. 旋转数组的最小数字 6. 比较版本号 1. 二分查找-I 题目链接：二分查找-I_牛客题霸_牛客网 (nowcoder.com) 题目要求： 上代码 import java.util.*;public class Solut…

easyExcel导出表头合并不得不说真牛

有个导出单元格合并的任务，表头不规则合并格式，看得就烦，尤其是对于没玩儿过合并的我来说，任务放在哪里不知咋做，网上也看了一堆合并的方法，自己写注解来写的那些，麻烦得要命，我写一…

【2022.12.15】备战春招Day10——每日一题 + 34. 在排序数组中查找元素的第一个和最后一个位置 + 30. 二叉搜索树的最小绝对差

【每日一题】1945. 字符串转化后的各位数字之和题目描述给你一个由小写字母组成的字符串 s ，以及一个整数 k 。首先，用字母在字母表中的位置替换该字母，将 s 转化为一个整数（也就是，‘a’ 用 1 替换，‘…

TensorRTC++在Win10下前向推理速度不稳定原因汇总

相关文章