汉扬编程 编程大纲 嵌入式C语言中字节对齐的问题

嵌入式C语言中字节对齐的问题

嵌入式C语言中,字节对齐的问题主要出现在结构体中,我们先来看一下结构体的定义。

结构体struct的定义

在C语言中,结构体是一种复合数据类型,其构成元素既可以是基本数据类型(如int、long、float等)的变量,也可以是一些复合数据类型(如数组、结构、联合等)的数据单元。

在结构体中,编译器为结构体的每个成员按其自然边界(alignment)分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同。

接下来,我们再来看一下结构体在单片机中的实际物理地址的分配,也就是结构体变量所在实际实际硬件存储位置。

物理地址的分配

为了使单片机能够对变量进行快速的访问,变量的起始地址应该具有某些特性,即所谓的“对齐”。 比如4字节的int型(32位单片机),其起始地址应该位于4字节的边界上,即起始地址能够被4整除。

字节对齐的作用

字节对齐的作用不仅是便于cpu快速访问,同时合理地利用字节对齐可以有效地节省存储空间。

对于32位机来说,4字节对齐能够使cpu访问速度提高,比如说一个long类型的变量,如果跨越了4字节边界存储,那么cpu要读取两次,这样效率就低了。但是在32位机中使用1字节或者2字节对齐,反而会使变量访问速度降低。所以这要考虑处理器类型,另外还得考虑编译器的类型。

在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地,可以通过下面的方法来改变缺省的对界条件:

1、使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。

2、 使用伪指令#pragma pack (),取消自定义字节对齐方式。

例如,

struct test

{

char x1;

short x2;

float x3;

char x4;

};

由于编译器默认情况下会对这个struct作自然边界对齐,结构的第一个成员x1,其偏移地址为0,占据了第1个字节。第二个成员x2为short类型,其起始地址必须2字节对界,因此,编译器在x2和x1之间填充了一个空字节。结构的第三个成员x3和第四个成员x4恰好落在其自然边界地址上,在它们前面不需要额外的填充字节。在test结构中,成员x3要求4字节对界,是该结构所有成员中要求的最大边界单元,因而test结构的自然对界条件为4字节,编译器在成员x4后面填充了3个空字节。整个结构所占据空间为12字节。

如果采用伪指令#pragma pack (n),可以强制n个字节对齐:

#pragma pack(1) //让编译器对这个结构作1字节对齐

struct test

{

char x1;

short x2;

float x3;

char x4;

};

#pragma pack() //取消1字节对齐,恢复为默认4个字节对齐

这时候sizeof(struct test)的值为8。

字节对齐对程序执行的影响

各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的单片机在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程就必须保证字节对齐,其他平台可能没有这种情况。比如有些单片机,只能做偶地址存储,你如果不小心用到了奇地址,可能会产生莫名其妙的错误。还有的单片机为了多省几根地址线,对于存储地址的访问必须要求是4的倍数或者是8的倍数。

还有种情况就是,如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次都都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。这样显然在读取效率上下降很多。

理一理C语言字节对齐的那些事

前言

嵌入式C语言中字节对齐的问题

字节对齐是我们初学C语言就会接触到的一个概念,但是到底什么是字节对齐?对齐准则又是什么?为什么要字节对齐呢?字节对齐对我们编程有什么启示?本文将简单理一理字节对齐的那些事。小编是一个有着6年工作经验的工程师,关于C++编程,自己有做材料的整合,一个完整的C++编程学习路线,学习资料和工具,能够进我的群10048,-83029收取,免费送给大家,希望你也能凭着自己的努力,成为下一个优秀的程序员

什么是字节对齐

计算机中内存大小的基本单位是字节(byte),理论上来讲,可以从任意地址访问某种基本数据类型,但是实际上,计算机并非逐字节大小读写内存,而是以2,4,或8的 倍数的字节块来读写内存,如此一来就会对基本数据类型的合法地址作出一些限制,即它的地址必须是2,4或8的倍数。那么就要求各种数据类型按照一定的规则在空间上排列,这就是对齐。

对齐准则是什么

总的来说,字节对齐有以下准则:

结构体变量的首地址能够被其最大基本类型成员字节数大小所整除。结构体每个成员相对结构体首地址的偏移都是成员大小的整数倍,如不满足,对前一个成员填充字节以满足。结构体的总大小为结构体对最大成员大小的整数倍,如不满足,最后填充字节以满足。我们通过一个小例子来说明是如何对齐的。

考虑下面的程序:

/*================================================================* Copyright (C) 2018 Ltd. All rights reserved.* * 文件名称:testByteAlign.c* 创 建 者:shouwang* 创建日期:2018年09月15日* 描 述:*================================================================*/#include<stdio.h>#include<stdint.h>struct test{ int a; char b; int c; short d;};int main(int argc,char *argv){ /*在32位和64位的机器上,size_t的大小不同*/ printf(\”the size of struct test is %zu\”,sizeof(struct test)); return 0;}编译成32位程序并运行(默认四字节自然对齐),可以看到,结构体test 的大小为16字节,而不是11字节(a占4字节,b占1字节,c占4字节,d占2字节)

#64位机器上编译32位程序可能需要安装一个库#sudo apt-get install gcc-multilibgcc -m32 -o testByteAlign testByteAlign.c #编译程序chmod +x testByteAlign #赋执行权限./testByteAlign #运行the size of struct test is 16实际上,结构体test的成员在内存中可能是像下面这样分布的(数值为偏移量)

未对齐时:

0~345~910~11abcd

对齐时:

0~345~78~1112~1314~15ab填充内容cd填充内容

从上面可以看出,c的偏移为5,不满足对齐要求(它的偏移量应该能够被sizeof(int)大小整除),因此在b后面填充了3个字节,使得c的偏移为8。在b后面填充后,d已经满足对齐要求了,为什么最后还要填充字节呢?或者说,为什么需要满足第三条准则呢?

考虑下面的声明

struct teArray[2];

我们不难知道,teArray[0]的d如果不填充字节,那么teArray[1]的a偏移为14,不满足对齐要求,因此d后面也需要填充字节。

为什么要字节对齐

无论数据是否对齐,大多数计算机还是能够正确工作,而且从前面可以看到,结构体test本来只需要11字节的空间,最后却占用了16字节,很明显浪费了空间,那么为什么还要进行字节对齐呢?最重要的考虑是提高内存系统性能

前面我们也说到,计算机每次读写一个字节块,例如,假设计算机总是从内存中取8个字节,如果一个double数据的地址对齐成8的倍数,那么一个内存操作就可以读或者写,但是如果这个double数据的地址没有对齐,数据就可能被放在两个8字节块中,那么我们可能需要执行两次内存访问,才能读写完成。显然在这样的情况下,是低效的。所以需要字节对齐来提高内存系统性能。

在有些处理器中,如果需要未对齐的数据,可能不能够正确工作甚至crash,这里我们不多讨论。

实际编程中的考虑

实际上,字节对齐的细节都由编译器来完成,我们不需要特意进行字节的对齐,但并不意味着我们不需要关注字节对齐的问题。

空间存储

还是考虑前面的结构体test,其占用空间大小为16字节,但是如果我们换一种声明方式,调整变量的顺序,重新运行程序,最后发现结构体test占用大小为12字节

struct test{ int a; char b; short d; int c;};空间存储情况如下,b和c存储在了一个字节快中:

0~3456~78~11ab填充内容cd

也就是说,如果我们在设计结构的时候,合理调整成员的位置,可以大大节省存储空间。但是需要在空间和可读性之间进行权衡。

跨平台通信

由于不同平台对齐方式可能不同,如此一来,同样的结构在不同的平台其大小可能不同,在无意识的情况下,互相发送的数据可能出现错乱,甚至引发严重的问题。因此,为了不同处理器之间能够正确的处理消息,我们有两种可选的处理方法。

1字节对齐自己对结构进行字节填充我们可以使用伪指令#pragma pack(n)(n为字节对齐数)来使得结构间一字节对齐。

同样是前面的程序,如果在结构体test的前面加上伪指令,即如下:

#pragma pack(1) /*1字节对齐*/struct test{ int a; char b; int c; short d;};#pragma pack()/*还原默认对齐*/在这样的声明下,任何平台结构体test的大小都为11字节,这样做能够保证跨平台的结构大小一致,同时还节省了空间,但不幸的是,降低了效率。

当然了对于单个结构体,如下的方法,使其1字节对齐

struct test{ int a; char b; int c; short d;}__attribute__ ((packed));注:

__attribute__((aligned (n))),让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。__attribute__ ((packed)),取消结构在编译过程中的优化对齐,也可以认为是1字节对齐。除了前面的1字节对齐,还可以进行人为的填充,即test结构体声明如下:

struct test{ int a; char b; char reserve[3]; int c; short d; char reserve1[2];};访问效率高,但并不节省空间,同时扩展性不是很好,例如,当字节对齐有变化时,需要填充的字节数可能就会发生变化。

总结

虽然我们不需要具体关心字节对齐的细节,但是如果不关注字节对齐的问题,可能会在编程中遇到难以理解或解决的问题。因此针对字节对齐,总结了以下处理建议:

结构体成员合理安排位置,以节省空间跨平台数据结构可考虑1字节对齐,节省空间但影响访问效率跨平台数据结构人为进行字节填充,提高访问效率但不节省空间本地数据采用默认对齐,以提高访问效率32位与64位默认对齐数不一样

本文来自网络,不代表汉扬编程立场,转载请注明出处:http://www.hyzlch.com/mianfei/6651.html

Visual Studio Code C语言环境配置

输入输出的上升沿和下降沿是怎么来的,一起看看

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

返回顶部