浅谈简单的程序优化技巧(C++)

embedded/2024/9/24 10:19:50/

在 C++ 编程中,优化是提升程序性能的关键步骤。常数优化,虽然看似细微,但在某些情况下却能显著提高程序的运行效率。本文将为您介绍一些实用的 C++ 常数优化技巧。

输入输出优化

看一下这道题:

【模板】快速读入

题目背景

制约解除作战!

题目描述

给你 n n n 个数,你需要求和并输出。

输入格式

第一行一个整数 n n n

之后一行 n n n 个整数以空格隔开,表示给定的 n n n 个数。

输出格式

一行一个数表示给定的数的和。

样例 #1

样例输入 #1
5
-1 2 -3 4 -5
样例输出 #1
-3

提示

对于 25 % 25\% 25% 的数据,满足 n = 1 0 5 n=10^5 n=105

对于 25 % 25\% 25% 的数据,满足 n = 1 0 6 n=10^6 n=106

对于 25 % 25\% 25% 的数据,满足 n = 1 0 7 n=10^7 n=107

对于 25 % 25\% 25% 的数据,满足 n = 1 0 8 n=10^8 n=108

对于 100 % 100\% 100% 的数据,满足所有数在 [ − n , n ] [-n,n] [n,n] 之间。

普通cin

在这里插入图片描述

#include<bits/stdc++.h>
using namespace std;
long long n,a,ans;
int main(){cin>>n;while(n--){cin>>a;ans+=a;}cout<<ans<<endl;
}

IOScin

在这里插入图片描述

#include<bits/stdc++.h>
using namespace std;
long long n,a,ans;
int main(){ios::sync_with_stdio(0);cin.tie(0);cout.tie(0);cin>>n;while(n--){cin>>a;ans+=a;}cout<<ans<<endl;
}

scanf

在这里插入图片描述

#include<bits/stdc++.h>
using namespace std;
long long n,a,ans;
int main(){scanf("%lld",&n);while(n--){scanf("%lld",&a);ans+=a;}printf("%lld\n",ans);
}

传引用快读

在这里插入图片描述

#include<bits/stdc++.h>
using namespace std;
template<typename T>
inline void read(T &x)
{x=0;char c = getchar();int s = 1;while(c < '0' || c > '9') {if(c == '-') s = -1;c = getchar();}while(c >= '0' && c <= '9') {x = x*10 + c -'0';c = getchar();}x*=s;
}
template<typename T>
inline void write(T x)
{if(x<0)putchar('-'),x=-x;if(x>9)write(x/10);putchar(x%10+'0');return;
}
long long n,a,ans;
int main(){read(n);while(n--){read(a);ans+=a;}write(ans);
}

返回值快读

在这里插入图片描述

#include <bits/stdc++.h>
using namespace std;
inline int read(){int x = 0, f = 1;char ch = getchar();while (!isdigit(ch)){if (ch == '-') f = -1;ch = getchar();}while (isdigit(ch)){x = (x << 1) + (x << 3) + (ch ^ 48);ch = getchar();}return x * f;
}inline void write(int x){if (x < 0) putchar('-'), x = -x;if (x > 9) write(x / 10);putchar(x % 10 + '0');
}int main(){int n = read(),ans = 0;int a[n + 1];while(n--){ans += read();}write(ans);return 0;
}

快读优化

在这里插入图片描述

#include <bits/stdc++.h>
using namespace std;
inline int read(){int x = 0, f = 1;char ch = getchar_unlocked();while (!isdigit(ch)){if (ch == '-') f = -1;ch = getchar_unlocked();}while (isdigit(ch)){x = (x << 1) + (x << 3) + (ch ^ 48);ch = getchar_unlocked();}return x * f;
}inline void write(int x){if (x < 0) putchar('-'), x = -x;if (x > 9) write(x / 10);putchar(x % 10 + '0');
}int main(){int n = read(),ans = 0;int a[n + 1];while(n--){ans += read();}write(ans);return 0;
}

结论:
在Windows系统上,传参快读最快,优化快读会CE
在测评机上,速度排序依次为优化快读,传参快读,返回值快读,IOScin,scanf,朴素cin

常量表达式优化

C++11 引入了常量表达式(constexpr)的概念。常量表达式是指在编译期间就能计算出结果的表达式。通过使用 constexpr ,可以让编译器在编译时进行计算,从而避免在运行时进行计算,提高程序的效率。

// 未优化版本
int fibonacci(int n) {if (n <= 1) {return n;}return fibonacci(n - 1) + fibonacci(n - 2);
}// 优化版本:使用常量表达式计算斐波那契数列
constexpr int fibonacci(int n) {return (n <= 1)? n : fibonacci(n - 1) + fibonacci(n - 2);
}

循环的边界优化

在循环中,尽量使用常量来定义循环的边界。这样可以让编译器更好地进行优化,例如展开循环或者消除一些不必要的边界检查。

// 未优化版本
int arr[100];
for (int i = 0; i < 100; ++i) {arr[i] = i;
}// 优化版本:使用常量定义循环边界
const int arrSize = 100;
for (int i = 0; i < arrSize; ++i) {arr[i] = i;
}

类型转换优化

类型转换可能会带来性能开销。特别是在频繁执行的代码段中,应尽量避免不必要的类型转换。

double value = 3.14;
int intValue = static_cast<int>(value);  // 仅在必要时进行类型转换

位运算优化

在某些情况下,位运算(如左移、右移)可以替代乘法和除法,因为位运算通常比乘法和除法运算更快。但是,在程序中,编译器一般会帮你优化,不用你费心思去写右移左移了。

// 未优化版本
int multiplyByEight(int num) {return num * 8;
}// 优化版本:使用左移 3 位替代乘以 8
int multiplyByEight(int num) {return num << 3;
}

预计算优化

对于一些在程序运行过程中不会改变的值,可以在程序开始时进行预计算,避免在运行时重复计算。

// 未优化版本
void calculateSum(int n) {int sum = 0;for (int i = 0; i < n; ++i) {sum += i;}
}// 优化版本:预计算求和公式
void calculateSum(int n) {const int sum = (n * (n - 1)) / 2;// 后续使用预计算的 sum
}

数据类型优化

根据实际需求选择合适的数据类型,避免使用过大或过小的数据类型。例如,如果一个整数的值不会超过 255 ,使用 uint8_t 而不是 int 。

// 未优化版本
int age = 25; 
// 优化版本:如果年龄范围确定在 0 到 150 之间,使用更紧凑的数据类型
unsigned char age = 25; 

结构体优化

拿存图举例,如下代码:

struct edge{int u,v,w;}e[M];

是优于如下代码的

int u[M],v[M],w[M];

原因是我们很可能同时关心一条边的所有信息,存储关联的一组数据时,结构体一般会比存储空间局部性更好,更好地利用缓存

提高复杂度

algorithm中的sort函数,当区间长度小于16时,就会切换到 O ( n 2 ) O(n^2) O(n2)插入排序,因为插入排序是连续的,对内存十分友好,在这个长度下 O ( l o g n ) O(logn) O(logn)并不比 O ( n ) O(n) O(n)快多少,log的函数还很难维护,所以,分治的结尾,用O(n)的算法,反而可以优化时间复杂度。

表达式优化

如果一个式子在程序里多次出现,就可以提前将式子的结果存下来。

尾递归优化

某些函数在结束时返回调用自己的值。一种典型的例子就是线段树:例如,某个询问完全当前节点的左子节点时,常见的写法是直接递归调用自己,并将节点和区间改为左子节点和询问区间不变。

int query(int x,int l,int r,int ql,int qr){if(l==ql&&r==qr){...... }int mid=l+r>>1;if(qr<=mid)return query(t[x].l,l,mid,ql,qr);else.....
}

这里的return query并不会调用函数,而是直接将参数替换并跳到函数开头。这样,就避免了一次额外的函数调用和函数返回,调用栈也只会有一层。因此,将线段树写为上面这样的适合尾递归的形式,比依次if累加起来性能要好。

内联优化

C++中,inline是一个优化的表示,对于极其简单的函数,编译器很容易分析,内联后就会加快程序的运行速度,但需要注意的是:内联并不是在每一个时候都对程序是好的,内联后,被内联的代码会膨胀,函数大小甚至发生了指数级别的增长,反而会拖慢程序的运行效率。

取模优化

许多计数类的题都会让你将结果对某个特殊的数取模,对于整数来说,加减法,位运算是最快的,其次是乘法,最慢的是除法,在对一个数取模时,应将他设为一个常量,这样编译器就会优化它的取模效,注意,定义常量要用const 关键字,#define只是单纯的替换

关于STL

STL中通常只有数据结构需要担心性能,sort等函数的表现还是很优秀的而且数据结构吸氧之后会有很大提升
vector,priority_queue通常并不必担心性能,实在不行用数组实现
list的性能很差,并不能满足竞赛的要求建议避免使用,代替方案:手写链表
deque和给予其的stack,queue性能都比较差,建议使用数组模拟
set,map底层基于平衡树,功能强大,但性能一般
unordered_map等比map好,但也不算快,其实可以手写哈希表,二次勘测性能比拉链要好。


http://www.ppmy.cn/embedded/90786.html

相关文章

Python数据结构篇(二)

数据结构 数据结构列表列表的创建与操作列表推导式案例实操 元组案例实操 字典字典的创建与操作字典推导式案例实操 集合集合的创建与操作集合推导式案例实操 数据结构 Python 中常用的数据结构包括列表、元组、字典和集合。每种数据结构都有其独特的特性和使用场景 列表 列…

PHP反序列化漏洞从入门到深入8k图文介绍,以及phar伪协议的利用

文章参考&#xff1a;w肝了两天&#xff01;PHP反序列化漏洞从入门到深入8k图文介绍&#xff0c;以及phar伪协议的利用 前言 本文内容主要分为三个部分&#xff1a;原理详解、漏洞练习和防御方法。这是一篇针对PHP反序列化入门者的手把手教学文章&#xff0c;特别适合刚接触PH…

Java中的5种线程池类型

Java中的5种线程池类型 1. CachedThreadPool &#xff08;有缓冲的线程池&#xff09;2. FixedThreadPool &#xff08;固定大小的线程池&#xff09;3. ScheduledThreadPool&#xff08;计划线程池&#xff09;4. SingleThreadExecutor &#xff08;单线程线程池&#xff09;…

三、Spring-WebFlux实战案例-流式

目录 一、springboot之间通讯方式 1. 服务端 (Spring Boot) 1.1 添加依赖 1.2 控制器 2. 客户端 (WebClient) 2.1 添加依赖 2.2 客户端代码 3. 运行 二、web与服务之间通讯方式 1、服务端代码 2、客户端代码 3、注意事项 三、移动端与服务端之间通讯方式…

Bug 解决 | 无法正常登录或获取不到用户信息

目录 1、跨域问题 2、后端代码问题 3、前端代码问题 我相信登录这个功能是很多人做项目时候遇到第一个槛&#xff01; 看起来好像很简单的登录功能&#xff0c;实际上还是有点坑的&#xff0c;比如明明账号密码都填写正确了&#xff0c;为什么登录后请求接口又说我没登录&a…

我所理解的sprd-camera摄像头框架流程分析

摄像头的图像格式:RGB24,RGB565,RGB444,YUV4:2:2 RGB24 表示R、G、B ,3种基色都用8个二进制位表示,那么红色、绿色、蓝色各有256种,那么由这三种基色构成的颜色就是256X256X256=16,777,216种,约等于1677万。UV 和我们熟知的 RGB 类似,是一种颜色编码格式。 YUV 包含三…

“vcruntime140.dll找不到”的错误怎么处理?一键修复vcruntime140.dll

遇到“vcruntime140.dll找不到”的错误提示时&#xff0c;这通常指的是尝试运行需要Visual C 2015 Redistributable支持的软件时由于该文件的缺失而导致程序无法启动。这种情况在使用Windows操作系统的用户中并不少见。为了帮大家在将来遇到此类问题时能够迅速解决&#xff0c;…

概率论原理精解【9】

文章目录 集类拓扑空间基 参考文献 集类 C是一个集类&#xff08;以G的某些子集为元素的集合称为G的集类&#xff09;。 A i ∈ C , ∩ i 1 n A i ∈ C , 此为有限交封闭 C 所得集类 C ∩ f A_i \in C,\cap_{i1}^nA_i \in C,此为有限交封闭C所得集类C_{\cap f} Ai​∈C,∩i1n…