一文彻底理解大小端和位域

为什么有大小端

人们一直认为大道至简，就好像物理学上的世界追求使用一个理论来统一所有的现象。为什么cpu存在大小端之分，一言以蔽之，这两种模式各有各的优点，其各自的优点就是对方的缺点，正因为两者彼此不分伯仲，再加上一些硬件厂商的坚持，因此在多字节存储顺序上始终没有一个统一的标准

小端模式优点：

内存的低地址处存放低字节，所以在强制转换数据时不需要调整字节的内容（注解：比如把int的4字节强制转换成short的2字节时，就直接把int数据存储的前两个字节给short就行，因为其前两个字节刚好就是最低的两个字节，符合转换逻辑）；
CPU做数值运算时从内存中依顺序依次从低位到高位取数据进行运算，直到最后刷新最高位的符号位，这样的运算方式会更高效

大端模式优点：

符号位在所表示的数据的内存的第一个字节中，便于快速判断数据的正负和大小

什么是大小端

	高位	0x12345678	低位
大端模式	低地址	0x12-0x34-0x56-0x78	高地址
小端模式	低地址	0x78-0x56-0x34-0x12	高地址

小端模式：是指数据的高字节保存在内存的高地址中，而数据的低字节保存在内存的低地址中。简单的说就是低地址存低位，高地址存高位。大端模式是正好相反。

通过代码来记忆

大多数情况下，小端机器比较多。我们会经常见到如下代码

uint32_t  uiVal = 0x11223344;
uint8_t  *pucLit = (uint8_t *) uiVal;

我们只需要记住 *pucLit的值是 0x44 即可。

字节内的bit顺序也有大小端

在 kernel 中的源码有如下定义

struct tcphdr {__be16	source;__be16	dest;__be32	seq;__be32	ack_seq;
#if defined(__LITTLE_ENDIAN_BITFIELD)__u16	res1:4,doff:4,fin:1,syn:1,rst:1,psh:1,ack:1,urg:1,ece:1,cwr:1;
#elif defined(__BIG_ENDIAN_BITFIELD)__u16	doff:4,res1:4,cwr:1,ece:1,urg:1,ack:1,psh:1,rst:1,syn:1,fin:1;
#else
#error	"Adjust your <asm/byteorder.h> defines"
#endif	__be16	window;__sum16	check;__be16	urg_ptr;
};