C语言深入学习系列

Wesley13
• 阅读 771

用C语言写程序时需要知道是大端模式还是小端模式。

所谓的大端模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;所谓的小端模式,是指数据的低位保存在内存的低地址中,而数据的高位保存在内存的高地址中

为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。例如一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x2211中小端模式,刚好相反,还是ox1122。我们常用的X86结构是小端模式,而KEIL C51则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

Java、.NET大行其道的今天,C语言作为一门经典的高级语言,存在的唯一理由就是其高效、精练。随着PC硬件升级和降价,C语言由于其自身的复杂度,在开发PC应用软件时,已经很少使用。但是在开发嵌入式系统软件和操作系统时,由于普遍强调微内核,少占用空间和高效,因此,在系统开发舞台上,C语言依旧是主角

在实际的程序开发中,为了提高数据的读取效率,在内存资源足够的情况下,一般在定义数据结构时,应该考虑四字节对齐,其原因很简单,现在的计算机多数是32位,也就是四字节。在每次读取数据时,一般都是直接读取32位的数据。有些情况下,字节对齐的数据结构,要比非对齐的数据结构占用空间少。以下分别就这两方面举例阐述。

1、充分考虑四字节对齐,可以节省存储空间

typedef struct tagAAA{

char name[10];

long sno;

char sex;

float score[4];

}AAA;

typedef struct tagBBB{

char name[10];

char sex;

long sno;

float score[4];

}BBB;

在VC下,调试,可以很容易看出来,AAA占的存储空间为36,BBB占的存储空间为32。原因很简单,在四字节对齐的情况下,按四个字节为单位分配存储空间,如果不足,会自动补充,本次分配不足以存放下面的变量时,会重新分配空间。

AAA:

|name[0]|name[1]|name[2]|name[3]|


|name[4]|name[5]|name[6]|name[7]|


|name[8]|name[9]|             |                   |

----------由于剩下的两个字节不足以存放sno(long占四个字节),所以重新分配


|                        sno                                       |

----------long变量占四个字节,32bits


|sex        |    自动填充                                |

----------剩余三个字节的空间,不足以重放一个float变量,因此重新分配


|                  score[0]                                     |


|                  ..........                                        |


|                  score[3]                                     |


由此可以轻易的计算出,AAA占36个字节,同理,很容易计算出BBB占32个字节空间。

2、字节对其的情况下,可以更高效的访问

假设一个结构体的数据如下存储:


|        12        |       34       |        56        |        78         |   -----------(A)



|        XX        |       YY       |        12       |         34        |   -----------(B)


|        56        |        78       |       XX       |         YY        |

在A情况下,一次性读取数据成功,但是,在B情况下,需要读取数据两次,由此,可看出效率的差异。

一般情况下,字节对齐遵从系统字节数与要求的对齐字节数相比,最小原则,即:假设要求按八字节对齐,但是系统为32位系统,则按照4字节对齐。在四字节对齐时,局部会按照2字节对齐,如:

struct tagAAA

{

char a;

short b;

char c;

}AAA;

结构体占据的空间为8字节而不是4字节,原因就是:


|    a     |          |             b              |


|   c      |                                      |

而不是:


|    a     |          b          |        c         |


其原因就是局部会以2字节对齐

***********************************************

众所周知,C语言程序设计中,内存的分配和管理完全交由程序员来控制,因此,内存管理是每个C程序员必须熟练掌握的。一般而言,分配给进程的内存有四个概念上不同的区域,分别为:代码段、数据段、堆和栈,其中数据段又可以细分为初始化为非零的数据和初始化为零的数据。如下图所示:


|       程序栈          |----------高地址--〉低地址(向下增长)


|          堆                |----------向上增长


|          BSS              |----------数据段

| 全局和静态变量 |

-----------------------------低地址

|     可执行代码     |----------代码段


可执行指令放在代码段中,任何时刻,内存中只有一份相同程序的指令拷贝,多个实例共享这些代码。 初始化为非零的静态数据和全局数据存放在数据段中,运行相同程序的每个进程,有自己的数据段。

初始化为零(即未初始化的变量,系统自动填充为0;或者初始化为0)的全局数据和静态分配数据存放在进程的BSS区域中,每个运行的进程都有自己的BSS,程序运行的时候,将数据放到数据段中,由此可知,只有初始化为非零的变量才占用空间,所以对于类似static int ss[1024];这样的数组自动用0来填充,它占的空间很小。

【BSS是“Block Started by Symbol”的缩写,意为“以符号开始的块”。BSS是Unix链接器产生的未初始化数据段。其他的段分别是包含程序代码的“text”段和包含已初始化数据的“data”段。BSS段的变量只有名称和大小却没有值。此名后来被许多文件格式使用,包括PE。“以符号开始的块”指的是编译器处理未初始化数据的地方。BSS节不包含任何数据,只是简单的维护开始和结束的地址,以便内存区能在运行时被有效地清零。BSS节在应用程序的二进制映象文件中并不存在,例如:

unsigned char var; // 分配到.bss节的8位未初始化变量

unsigned char var2 = 25; // 分配到.data节的8位已初始化变量

堆,动态内存来自于堆,即:通过malloc得到的空间,通常情况下,堆是向上增长的,即:后面分配的地址比前面的地址在数值上大一些。 【注意:这里的堆并不是数据结构中的堆,它的分配方式类似于链表】

栈,分配局部变量的地方,函数参数、函数的返回值和返回地址也放在栈空间中,需要特别注意的是,当函数返回后,存储在栈空间中的函数变量“自动消失”,空间被其他函数使用。栈空间是向下增长的。

在C语言中,一般通过malloc/calloc函数分配空间,通过free()函数释放空间,使用realloc()改变已分配空间的大小。

分配内存的步骤:

1.申明一个指定类型的指针

2.计算要分配空间的大小,一般使用函数sizeof()来实现

3.调用函数malloc()完成空间的申请,将函数的返回值赋给指针变量,

4.检查返回值是否不为NULL,保证空间分配成功

5.分配好的空间是没有经过初始化的,其中可能包含一些垃圾信息,因此调用函数memset()将其用0来填充是个好的习惯

释放内存步骤:

1.调用函数free()释放掉空间

注意:

1.不可以使用free()之后的空间

2.free()后,最好将指针置为NULL,因为如果不做这步处理, 原来的指针依旧指向刚才释放的空间,可以继续操作

3.避免重复释放空间

Unix系统上,提供了函数alloca()函数,可以实现在栈空间上分配指定大小的空间,这样的好处是,函数结束后,空间自动释放,不必显式地调用函数free(),但是该函数有很多弊端,比如不可移植等,因此不建议使用。

有必要提一下malloc、calloc、realloc函数的底层实现,在Linux系统中,提供了brk()和sbrk()函数,上面几个函数就是在这两个函数的基础上实现的

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
FLV文件格式
1.        FLV文件对齐方式FLV文件以大端对齐方式存放多字节整型。如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。2.  
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
00_设计模式之语言选择
设计模式之语言选择设计模式简介背景设计模式是一套被反复使用的、多数人知晓的、经过分类编目的、代码设计经验的总结。设计模式(Designpattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用。设计模式是软件开发人员在软件开发过程中面临的
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这