sizeof
是 C 语言中的一个关键字,它用于计算某个类型或变量所占用的内存大小。sizeof
关键字在编译时由编译器处理,它的实现与具体的编译器和平台有关。
1.sizeof工作原理
在高级层面上,sizeof
的工作原理如下:
-
编译时计算:
sizeof
是在编译时计算的,而不是在运行时执行。编译器通过分析变量或类型来确定其在目标平台上所占用的内存大小。由于sizeof
是在编译时计算的,因此它通常不会引入任何运行时开销。 -
类型信息:编译器根据变量的类型信息来确定其大小。对于基本类型(如
int
、float
、char
等),编译器直接查阅这些类型在目标平台上的固定大小。对于复杂类型(如结构体、联合体等),编译器会根据类型中各个成员的大小和内存对齐要求来计算总的大小。 -
内存对齐:对于结构体或联合体,
sizeof
会考虑内存对齐的要求,这可能导致sizeof
计算出的大小比所有成员大小之和更大,因为编译器可能在某些成员之间插入填充字节以满足对齐要求。
示例:
#include <stdio.h>struct Example {char a;int b;double c;
};int main() {printf("Size of int: %zu\n", sizeof(int));printf("Size of struct Example: %zu\n", sizeof(struct Example));return 0;
}
运行结果:
Size of int: 4
Size of struct Example: 16
这个结果反映了 C 语言中的内存对齐(Memory Alignment)原则。让我们来分析一下为什么 struct Example
的大小是 16 字节,而不是成员大小的直接和(即 1 + 4 + 8 = 13
字节)。
当你看到输出结果显示结构体 Example
的大小为 16 字节时,这涉及到了两个关键因素:
成员的大小和内存对齐。
-
成员大小:
char a;
占用 1 字节int b;
通常占用 4 字节double c;
通常占用 8 字节
-
内存对齐:
- 对齐通常取决于结构体中最大的成员的对齐要求。在这个结构体中,
double
类型最大,其对齐要求通常是 8 字节。这意味着结构体的开始地址和所有成员的开始地址都应当是其最大成员(double
)大小的倍数。
- 对齐通常取决于结构体中最大的成员的对齐要求。在这个结构体中,
考虑到内存对齐,结构体 Example
的内存布局如下:
char a;
占用 1 字节,后面跟着 3 个填充字节(padding1
),以确保int b;
的对齐。int b;
从偏移量 4 开始,占用 4 字节。double c;
从偏移量 8 开始,占用 8 字节,对齐于 8 字节。
内存布局如下:
| a (1 byte) | padding1 (3 bytes) | b (4 bytes) | c (8 bytes) |
这样总的字节数为:1 (a) + 3 (padding1) + 4 (b) + 8 (c) = 16 字节。
因此,整个结构体的大小是 16 字节,这主要是为了满足 double
类型的对齐要求。这种对齐可以确保 CPU 访问内存时的效率最高。如果没有正确的对齐,某些平台可能会面临性能下降甚至运行错误。
2.sizeof实现方式
使用偏移相减计算大小
考虑一个结构体:
struct Example {char a;int b;double c;
};
在这个结构体中,各个成员在内存中的位置是有顺序的,且这些位置是由编译器决定的。为了计算结构体中各个成员的大小,可以使用两个成员之间的地址差(即偏移量)。这种方法利用了指针运算来计算大小。
假设我们要计算成员 a
和 b
之间的内存大小,可以通过指针相减的方式:
#include <stdio.h>struct Example {char a;int b;double c;
};int main() {struct Example ex;size_t size_a_b = (char*)(&ex.b) - (char*)(&ex.a); // 计算 b 相对于 a 的偏移量printf("Size between a and b: %zu\n", size_a_b);size_t size_b_c = (char*)(&ex.c) - (char*)(&ex.b); // 计算 c 相对于 b 的偏移量printf("Size between b and c: %zu\n", size_b_c);return 0;
}
运行结果:
Size between a and b: 4
Size between b and c: 4
-
Size between a and b: 4
:b
的地址是&ex.b
,相对于结构体起始地址的偏移量为 4。a
的地址是&ex.a
,起始地址为 0。- 因此,
&ex.b - &ex.a = 4
,这就是a
和b
之间的大小,结果是 4 字节。
-
Size between b and c: 4
:c
的地址是&ex.c
,相对于结构体起始地址的偏移量为 8。b
的地址是&ex.b
,偏移量为 4。- 因此,
&ex.c - &ex.b = 8 - 4 = 4
,这就是b
和c
之间的大小,结果也是 4 字节。
3.总结
在 C 语言中,sizeof 是一个编译时关键字,用于计算变量或类型的内存大小。编译器通过分析类型信息和内存对齐规则来确定内存占用大小。在结构体中,不同成员之间的地址偏移可以通过指针运算计算,但由于内存对齐的影响,这些偏移量可能包括填充字节。
偏移相减是一种通过指针相减来计算结构体成员间距的方法,例如计算成员 a 和 b 之间的大小。在代码中,结果显示 a 和 b 之间、b 和 c 之间的大小都是 4 字节。这是因为编译器为了满足 4 字节对齐要求,在 a 后面插入了 3 个字节的填充,同时 b 占用 4 字节后,c 从下一个 4 字节对齐的位置开始。
最终,编译器通过内存对齐和填充优化了结构体的布局,提高了内存访问的效率。这种指针运算虽然可以帮助理解内存布局,但在实际编程中,使用 sizeof 更为直接和准确。