C语言字节对齐

=Start=

缘由：

学习需要

正文：

参考解答：

一、什么是字节对齐？为什么要进行对齐？

现代计算机中内存空间都是按照byte划分的，从理论上讲似乎对任何类型的变量的访问可以从任何地址开始，但实际情况是在访问特定类型变量的时候经常在特定的内存地址访问，这就需要各种类型数据按照一定的规则在空间上排列，而不是顺序的一个接一个的排放，这就是对齐。

对齐的作用和原因：各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误，那么在这种架构下编程必须保证字节对齐。其他平台可能没有这种情况，但是最常见的是如果不按照适合其平台要求对数据存放进行对齐，会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始，如果一个int型（假设为32位系统）如果存放在偶地址开始的地方，那么一个读周期就可以读出这32bit，而如果存放在奇地址开始的地方，就需要2个读周期，并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。显然在读取效率上下降很多。

二、字节对齐的效果演示代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

typedef struct {
    char  c1; // 2
    short s;  // 2
    char  c2; // 4
    int   i;  // 4
} T_FOO;

typedef struct
{
  int a;    // 4
  char b;   // 2
  short c;  // 2
} A;

typedef struct
{
  char b;   // 4
  int a;    // 4
  short c;  // 4
} B;

#pragma pack (2) /*指定按2字节对齐*/
typedef struct {
    char b;   // 2
    int a;    // 4
    short c;  // 2
} C;
#pragma pack () /*取消指定对齐，恢复缺省对齐*/

#pragma pack (1) /*指定按1字节对齐*/
typedef struct {
    char b;   // 1
    int a;    // 4
    short c;  // 2
} D;
#pragma pack ()/*取消指定对齐，恢复缺省对齐*/

int main(int argc, char const *argv[]) {
    A xx;
    //      a -> 0, b -> 4, c -> 6
    printf("a -> %d, b -> %d, c -> %d\n",
          (unsigned int)(void*)&xx.a - (unsigned int)(void*)&xx,
          (unsigned int)(void*)&xx.b - (unsigned int)(void*)&xx,
          (unsigned int)(void*)&xx.c - (unsigned int)(void*)&xx);
    printf("sizeof(A) = %d\n", sizeof(A));  // 8

    B yy;
    //      b -> 0, a -> 4, c -> 8
    printf("b -> %d, a -> %d, c -> %d\n",
          (unsigned int)(void*)&yy.b - (unsigned int)(void*)&yy,
          (unsigned int)(void*)&yy.a - (unsigned int)(void*)&yy,
          (unsigned int)(void*)&yy.c - (unsigned int)(void*)&yy);
    printf("sizeof(B) = %d\n", sizeof(B));  // 12

    C cc;
    //      b -> 0, a -> 2, c -> 6
    printf("b -> %d, a -> %d, c -> %d\n",
          (unsigned int)(void*)&cc.b - (unsigned int)(void*)&cc,
          (unsigned int)(void*)&cc.a - (unsigned int)(void*)&cc,
          (unsigned int)(void*)&cc.c - (unsigned int)(void*)&cc);
    printf("sizeof(C) = %d\n", sizeof(C));  // 8

    D dd;
    //      b -> 0, a -> 1, c -> 5
    printf("b -> %d, a -> %d, c -> %d\n",
          (unsigned int)(void*)&dd.b - (unsigned int)(void*)&dd,
          (unsigned int)(void*)&dd.a - (unsigned int)(void*)&dd,
          (unsigned int)(void*)&dd.c - (unsigned int)(void*)&dd);
    printf("sizeof(D) = %d\n", sizeof(D));  // 7

    return 0;
}

三、编译器是按照什么样的原则进行对齐的?

先让我们看四个重要的基本概念：

数据类型自身的对齐值：对于char型数据，其自身对齐值为1，对于short型为2，对于int,float,double类型，其自身对齐值为4，单位是字节。
结构体或者类的自身对齐值：其成员中自身对齐值最大的那个值。
指定对齐值：#pragma pack (value)时的指定对齐值value。
数据成员、结构体和类的有效对齐值：自身对齐值和指定对齐值中小的那个值。

有了这些值，我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值，最重要。有效对齐值N，就是表示“对齐在N上”，也就是说该数据的“存放起始地址%N=0”。而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放，结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是结构体有效对齐值的整数倍)。这样就不难理解上面的例子了。

四、如何修改编译器的默认对齐值？

在编码时，可以通过 #pragma pack (value) 的方式动态修改。注意：是 pragma 而不是 progma 。

五、针对字节对齐，我们在编程中有什么需要注意的？

基本的原则就是把结构中的变量按照类型大小从小到大声明，尽量减少中间的填补空间。

还有一种就是为了以空间换时间，我们显示的填补空间以进行对齐，比如：显式的插入reserved成员：

typedef struct {
  char a;
  char reserved[3]; //使用空间换时间
  int b;
} A;

reserved成员对我们的程序没有什么意义，它只是起到填补空间以达到字节对齐的目的，当然即使不加这个成员通常编译器也会给我们自动填补对齐，我们自己加上它只是起到显式的提醒作用。

以上就是我在学习C语言字节对齐时参考网上的一些文章以及实际编写样例进行测试总结的内容，在此记录一下，方便以后参考。

参考链接：

C/C++字节对齐详解
http://www.linuxsong.org/2010/09/c-byte-alignment/

C语言字节对齐问题详解 #nice
http://www.cnblogs.com/clover-toeic/p/3853132.html

C语言字节对齐
http://blog.csdn.net/21aspnet/article/details/6729724

GCC中的aligned和packed属性
http://blog.shengbin.me/posts/gcc-attribute-aligned-and-packed

失传的C结构体打包技艺
https://github.com/ludx/The-Lost-Art-of-C-Structure-Packing
http://www.catb.org/esr/structure-packing/

c语言中struct的内存对齐
https://gist.githubusercontent.com/yqingp/5607126/raw/ce1f1c5c5866b3f89f57a50555140098a9b06874/451.md

=END=