大家好,今天小编来为大家解答八字论坛源码分享网站这个问题,八字论库很多人还不知道,现在让我们一起来看看吧!
内存管理
我们需要知道——变量,其实是内存地址的一个抽像名字罢了。在静态编译的程序中,所有的变量名都会在编译时被转成内存地址。机器是不知道我们取的名字的,只知道地址。
内存的使用时程序设计中需要考虑的重要因素之一,这不仅由于系统内存是有限的(尤其在嵌入式系统中),而且内存分配也会直接影响到程序的效率。因此,我们要对C语言中的内存管理,有个系统的了解。
在C语言中,定义了4个内存区间:代码区;全局变量和静态变量区;局部变量区即栈区;动态存储区,即堆区;具体如下:
1、栈区(stack)—由编译器自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。
2、堆区(heap)—一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表。
3、全局区(静态区)(static)—全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。-程序结束后由系统释放。
4、常量区—常量字符串就是放在这里的。程序结束后由系统释放。
5、程序代码区—存放函数体的二进制代码。
我们来看张图:
图1
首先我们要知道,源代码编译成程序,程序是放在硬盘上的,而非内存里!只有执行时才会被调用到内存中!我们来看看程序结构,ELF是是Linux的主要可执行文件格式。ELF文件由4部分组成,分别是ELF头(ELFheader)、程序头表(Programheadertable)、节(Section)和节头表(Sectionheadertable)。具体如下:
1、Programheader描述的是一个段在文件中的位置、大小以及它被放进内存后所在的位置和大小。即要加载的信息;
2、Sections保存着object文件的信息,从连接角度看:包括指令,数据,符号表,重定位信息等等。在图中,我们可以看到Sections中包括:
text文本结存放指令;rodata数据结readonly;data数据结可读可写;
3、Section头表(sectionheadertable)包含了描述文件sections的信息。每个section在这个表中有一个入口;每个入口给出了该section的名字,大小,等等信息。相当于索引!
而程序被加载到内存里面,又是如何分布的呢?我们看看上图中:
1、正文和初始化的数据和未初始化的数据就是我们所说的数据段,正文即代码段;
2、正文段上面是常量区,常量区上面是全局变量和静态变量区,二者占据的就是初始化的数据和未初始化的数据那部分;
3、再上面就是堆,动态存储区,这里是上增长;
4、堆上面是栈,存放的是局部变量,就是局部变量所在代码块执行完毕后,这块内存会被释放,这里栈区是下增长;
5、命令行参数就是001之类的,环境变量什么的前面的文章已经讲过,有兴趣的可以去看看。
我们知道,内存分为动态内存和静态内存,我们先讲静态内存。
静态内存
存储模型决定了一个变量的内存分配方式和访问特性,在C语言中主要有三个维度来决定:存储时期、作用域、链接。
存储时期
存储时期:变量在内存中的保留时间(生命周期)
存储时期分为两种情况,关键是看变量在程序执行过程中会不会被系统自动回收掉。
1)静态存储时期Static
在程序执行过程中一旦分配就不会被自动回收。
通常来说,任何不在函数级别代码块内定义的变量。
无论是否在代码块内,只要采用static关键字修饰的变量。
2)自动存储时期Automatic
除了静态存储以外的变量都是自动存储时期的,或者说只要是在代码块内定义的非static的变量,系统会肚脐自动非配和释放内存;
作用域
作用域:一个变量在定义该变量的自身文件中的可见性(访问或者引用)
在C语言中,一共有3中作用域:
1)代码块作用域
在代码块中定义的变量都具有该代码的作用域。从这个变量定义地方开始,到这个代码块结束,该变量是可见的;
2)函数原型作用域
出现在函数原型中的变量,都具有函数原型作用域,函数原型作用域从变量定义处一直到原型声明的末尾。
3)文件作用域
一个在所有函数之外定义的变量具有文件作用域,具有文件作用域的变量从它的定义处到包含该定义的文件结尾处都是可见的;
链接
链接:一个变量在组成程序的所有文件中的可见性(访问或者引用);
C语言中一共有三种不同的链接:
1)外部链接
如果一个变量在组成一个程序的所有文件中的任何位置都可以被访问,则称该变量支持外部链接;
2)内部链接
如果一个变量只可以在定义其自身的文件中的任何位置被访问,则称该变量支持内部链接。
3)空链接
如果一个变量只是被定义其自身的当前代码块所私有,不能被程序的其他部分所访问,则成该变量支持空链接
我们来看一个代码示例:
pragmapack(n)对齐用法详解
1.什么是对齐,以及为什么要对齐
现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就需要各类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。
对齐的作用和原因:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那么一个读周期就可以读出,而如果存放在奇地址开始的地方,就可能会需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该int数据。显然在读取效率上下降很多。这也是空间和时间的博弈。
2.对齐的实现
通常,我们写程序的时候,不需要考虑对齐问题。编译器会替我们选择时候目标平台的对齐策略。当然,我们也可以通知给编译器传递预编译指令而改变对指定数据的对齐方法。但是,正因为我们一般不需要关心这个问题,所以因为编辑器对数据存放做了对齐,而我们不了解的话,常常会对一些问题感到迷惑。最常见的就是struct数据结构的sizeof结果,出乎意料。为此,我们需要对对齐算法所了解。
作用:
指定结构体、联合以及类成员的packingalignment;
语法:
pragmapack指定的数值和这个数据成员自身长度两个中比较小的那个进行;也就是说,当pragmapack指定值之间较小的那个值进行;这样在成员是复杂类型时,可以最小化长度;
5>结构整体长度的计算必须取所用过的所有对齐参数的整数倍,不够补空字节;也就是取所用过的所有对齐参数中最大的那个值的整数倍,因为对齐参数都是2的n次方;这样在处理数组时可以保证每一项都边界对齐;
5.对齐的算法
由于各个平台和编译器的不同,现以本人使用的gccversion3.2.2编译器(32位x86平台)为例子,来讨论编译器对struct数据结构中的各成员如何进行对齐的。
在相同的对齐方式下,结构体内部数据定义的顺序不同,结构体整体占据内存空间也不同,如下:
设结构体如下定义:
结构体A中包含了4字节长度的int一个,1字节长度的char一个和2字节长度的short型数据一个。所以A用到的空间应该是7字节。但是因为编译器要对数据成员在空间上进行对齐。所以使用sizeof(strcutA)值为8。
现在把该结构体调整成员变量的顺序。
这时候同样是总共7个字节的变量,但是sizeof(structB)的值却是12。
下面我们使用预编译指令progmapack(value)时的指定对齐值value。
3>结构体或者类的自身对齐值:其数据成员中自身对齐值最大的那个值。
4>数据成员、结构体和类的有效对齐值:自身对齐值和指定对齐值中小的那个值。有了这些值,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,就是表示“对齐在N上”,也就是说该数据的”存放起始地址%N=0”.而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值的整数倍,结合下面例子理解)。这样就不能理解上面的几个例子的值了。
例子分析:
分析例子B;
假设B从地址空间0x0000开始排放。该例子中没有定义指定对齐值,在笔者环境下,该值默认为4。
第一个成员变量b的自身对齐值是1,比指定或者默认指定对齐值4小,所以其有效对齐值为1,所以其存放地址0x0000符合0x0000%1=0.
第二个成员变量a,其自身对齐值为4,所以有效对齐值也为4,所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中,符合0x0004%4=0,且紧靠第一个变量。
第三个变量c,自身对齐值为2,所以有效对齐值也是2,可以存放在0x0008到0x0009这两个字节空间中,符合0x0008%2=0。所以从0x0000到0x0009存放的都是B内容。再看数据结构B的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要求,0x0009到0x0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体B所占用。故B从0x0000到0x000B共有12个字节,sizeof(structB)=12;
同理,分析上面例子C:
第一个变量b的自身对齐值为1,指定对齐值为2,所以,其有效对齐值为1,假设C从0x0000开始,那么b存放在0x0000,符合0x0000%1=0;
第二个变量,自身对齐值为4,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003、0x0004、0x0005四个连续字节中,符合0x0002%2=0。
第三个变量c的自身对齐值为2,所以有效对齐值为2,顺序存放在0x0006、0x0007中,符合0x0006%2=0。所以从0x0000到0x00007共八字节存放的是C的变量。
又C的自身对齐值为4,所以C的有效对齐值为2。又8%2=0,C只占用0x0000到0x0007的八个字节。所以sizeof(structC)=8.
9.2.2字节对齐对程序的影响
先让我们看几个例子吧(32bit,x86环境,gcc编译器):
设结构体如下定义:
现在已知32位机器上各种数据类型的长度如下:
char:1(有符号无符号同)
short:2(有符号无符号同)
int:4(有符号无符号同)
long:4(有符号无符号同)
float:4double:8
那么上面两个结构大小如何呢?
结果是:
sizeof(strcutA)值为8
sizeof(structB)的值却是12
结构体A中包含了4字节长度的int一个,1字节长度的char一个和2字节长度的short型数据一个,B也一样;按理说A,B大小应该都是7字节。之所以出现上面的结果是因为编译器要对数据成员在空间上进行对齐。上面是按照编译器的默认设置进行对齐的结果,那么我们是不是可以改变编译器的这种默认对齐设置呢,当然可以.例如:
sizeof(structC)值是8。
修改对齐值为1:
sizeof(structD)值为7。
后面我们再讲解pragmapack.注意:是pragma而不是progma.
如果在编程的时候要考虑节约空间的话,那么我们只需要假定结构的首地址是0,然后各个变量按照上面的原则进行排列即可,基本的原则就是把结构中的变量按照类型大小从小到大声明,尽量减少中间的填补空间.还有一种就是为了以空间换取时间的效率,我们显示的进行填补空间进行对齐,比如:有一种使用空间换时间做法是显式的插入reserved成员:
reserved成员对我们的程序没有什么意义,它只是起到填补空间以达到字节对齐的目的,当然即使不加这个成员通常编译器也会给我们自动填补对齐,我们自己加上它只是起到显式的提醒作用.
2.4字节对齐可能带来的隐患
代码中关于对齐的隐患,很多是隐式的。比如在强制类型转换的时候。例如:
最后两句代码,从奇数边界去访问unsignedshort型变量,显然不符合对齐的规定。
在x86上,类似的操作只会影响效率,但是在MIPS或者sparc上,可能就是一个error,因为它们要求必须字节对齐.
如果出现对齐或者赋值问题首先查看
1).编译器的biglittle端设置
2).看这种体系本身是否支持非对齐访问
3).如果支持看设置了对齐与否,如果没有则看访问时需要加某些特殊的修饰来标志其特殊访问操作。
ARM下的对齐处理
fromDUI0067D_ADS1_2_CompLibtypequlifiers
有部分摘自ARM编译器文档对齐部分对齐的使用:
1.__align(num)
这个用于修改最高级别对象的字节边界。在汇编中使用LDRD或者STRD时就要用到此命令__align(8)进行修饰限制。来保证数据对象是相应对齐。这个修饰对象的命令最大是8个字节限制,可以让2字节的对象进行4字节对齐,但是不能让4字节的对象2字节对齐。__align是存储类修改,他只修饰最高级类型对象不能用于结构或者函数对象。
2.__packed
__packed是进行一字节对齐
l不能对packed的对象进行对齐
l所有对象的读写访问都进行非对齐访问
lfloat及包含float的结构联合及未用__packed的对象将不能字节对齐
l__packed对局部整形变量无影响
l强制由unpacked对象向packed对象转化是未定义,整形指针可以合法定
义为packed。
__packedint*p;//__packedint则没有意义
2.5对齐或非对齐读写访问带来问题
__packedstructSTRUCT_TEST
{chara;intb;charc;
};
//定义如下结构此时b的起始地址一定是不对齐的,在栈中访问b可能有问题,因为栈上数据肯定是对齐访问[fromCL]
//将下面变量定义成全局静态不在栈上
staticchar*p;staticstructSTRUCT_TESTa;voidMain()
{
__packedint*q;//此时定义成__packed来修饰当前q指向为非对齐的数据地址下面的访问则可以
p=(char*)&a;
q=(int*)(p+1);
*q=0x87654321;/*
得到赋值的汇编指令很清楚
ldrr5,0x20001590;=0]//函数进行4次strb操作然后返回保证了数据正确的访问
[0xe1a02420]movr2,r0,lsr1]
[0xe1a02820]movr2,r0,lsr2]
[0xe1a02c20]movr2,r0,lsr3]
[0xe1a0f00e]movpc,r14
*//*
如果q没有加__packed修饰则汇编出来指令是这样直接会导致奇地址处访问失败
[0xe59f2018]ldrr2,0x20001594;=0]
*/
//这样可以很清楚的看到非对齐访问是如何产生错误的
//以及如何消除非对齐访问带来问题
//也可以看到非对齐访问和对齐访问的指令差异导致效率问题
}
关于八字论坛源码分享网站到此分享完毕,希望能帮助到您。
