C语言嵌入式系统编程修炼之内存操作
数据指针
%A
%A 在嵌入式系统的编程中,常常要求在特定的内存单元读写内容,汇编有对应的MOV指令,而除C/C++以外的其它编程语言基本没有直接访问绝对地址的能力。在嵌入式系统的实际调试中,多借助C语言指针所具有的对绝对地址单元内容的读写能力。以指针直接操作内存多发生在如下几种情况:
%A
%A (1) 某I/O芯片被定位在CPU的存储空间而非I/O空间,而且寄存器对应于某特定地址;
%A
%A (2) 两个CPU之间以双端口RAM通信,CPU需要在双端口RAM的特定单元(称为mail box)书写内容以在对方CPU产生中断;
%A
%A (3) 读取在ROM或FLASH的特定单元所烧录的汉字和英文字模。
%A
%A 譬如:
%A
%A unsigned char *p = (unsigned char *)0xF000FF00;
%A *p=11;
%A
%A 以上程序的意义为在绝对地址0xF0000+0xFF00(80186使用16位段地址和16位偏移地址)写入11。
%A
%A 在使用绝对地址指针时,要注意指针自增自减操作的结果取决于指针指向的数据类别。上例中p++后的结果是p= 0xF000FF01,若p指向int,即:
%A
%A int *p = (int *)0xF000FF00;
%A
%A p++(或++p)的结果等同于:p = p+sizeof(int),而p-(或-p)的结果是p = p-sizeof(int)。
%A
%A 同理,若执行:
%A
%A long int *p = (long int *)0xF000FF00;
%A
%A 则p++(或++p)的结果等同于:p = p+sizeof(long int) ,而p-(或-p)的结果是p = p-sizeof(long int)。
%A
%A 记住:CPU以字节为单位编址,而C语言指针以指向的数据类型长度作自增和自减。理解这一点对于以指针直接操作内存是相当重要的。
%A
%A 函数指针
%A
%A 首先要理解以下三个问题:
%A
%A (1)C语言中函数名直接对应于函数生成的指令代码在内存中的地址,因此函数名可以直接赋给指向函数的指针;
%A
%A (2)调用函数实际上等同于"调转指令+参数传递处理+回归位置入栈",本质上最核心的操作是将函数生成的目标代码的首地址赋给CPU的PC寄存器;
%A
%A (3)因为函数调用的本质是跳转到某一个地址单元的code去执行,所以可以"调用"一个根本就不存在的函数实体,晕?请往下看:
%A
%A 请拿出你可以获得的任何一本大学《微型计算机原理》教材,书中讲到,186 CPU启动后跳转至绝对地址0xFFFF0(对应C语言指针是0xF000FFF0,0xF000为段地址,0xFFF0为段内偏移)执行,请看下面的代码:
%A
%A typedef void (*lpFunction) ( ); /* 定义一个无参数、无返回类型的 */
%A /* 函数指针类型 */
%A lpFunction lpReset = (lpFunction)0xF000FFF0; /* 定义一个函数指针,指向*/
%A /* CPU启动后所执行第一条指令的位置 */
%A lpReset(); /* 调用函数 */
%A
%A 在以上的程序中,我们根本没有看到任何一个函数实体,但是我们却执行了这样的函数调用:lpReset(),它实际上起到了"软重启"的作用,跳转到CPU启动后第一条要执行的指令的位置。
%A
%A 记住:函数无它,唯指令集合耳;你可以调用一个没有函数体的函数,本质上只是换一个地址开始执行指令!
%A
%A 数组vs.动态申请
%A
%A 在嵌入式系统中动态内存申请存在比一般系统编程时更严格的要求,这是因为嵌入式系统的内存空间往往是十分有限的,不经意的内存泄露会很快导致系统的崩溃。
%A
%A 所以一定要保证你的malloc和free成对出现,如果你写出这样的一段程序:
%A
%A char * function(void)
%A {
%A char *p;
%A p = (char *)malloc(…);
%A if(p==NULL)
%A …;
%A … /* 一系列针对p的操作 */
%A return p;
%A }
%A
%A 在某处调用function(),用完function中动态申请的内存后将其free,如下:
%A
%A char *q = function();
%A …
%A free(q);
%A
%A 上述代码明显是不合理的,因为违反了malloc和free成对出现的原则,即"谁申请,就由谁释放"原则。不满足这个原则,会导致代码的耦合度增大,因为用户在调用function函数时需要知道其内部细节!
%A
%A 正确的做法是在调用处申请内存,并传入function函数,如下:
%A
%A char *p=malloc(…);
%A if(p==NULL)
%A …;
%A function(p);
%A …
%A free(p);
%A p=NULL;
%A
%A 而函数function则接收参数p,如下:
%A
%A void function(char *p)
%A {
%A … /* 一系列针对p的操作 */
%A }
%A
%A
%A 基本上,动态申请内存方式可以用较大的数组替换。对于编程新手,笔者推荐你尽量采用数组!嵌入式系统可以以博大的胸襟接收瑕疵,而无法"海纳"错误。毕竟,以最笨的方式苦练神功的郭靖胜过机智聪明却范政治错误走反革命道路的杨康。
%A
%A 给出原则:
%A
%A (1)尽可能的选用数组,数组不能越界访问(真理越过一步就是谬误,数组越过界限就光荣地成全了一个混乱的嵌入式系统);
%A
%A (2)如果使用动态申请,则申请后一定要判断是否申请成功了,并且malloc和free应成对出现!
%A
%A 关键字const
%A
%A const意味着"只读"。区别如下代码的功能非常重要,也是老生长叹,如果你还不知道它们的区别,而且已经在程序界摸爬滚打多年,那只能说这是一个悲哀:
%A
%A const int a;
%A int const a;
%A const int *a;
%A int * const a;
%A int const * a const;
%A
%A (1) 关键字const的作用是为给读你代码的人传达非常有用的信息。例如,在函数的形参前添加const关键字意味着这个参数在函数体内不会被修改,属于"输入参数"。在有多个形参的时候,函数的调用者可以凭借参数前是否有const关键字,清晰的辨别哪些是输入参数,哪些是可能的输出参数。
%A
%A (2)合理地使用关键字const可以使编译器很自然地保护那些不希望被改变的参数,防止其被无意的代码修改,这样可以减少bug的出现。
%A
%A const在C++语言中则包含了更丰富的含义,而在C语言中仅意味着:"只能读的普通变量",可以称其为"不能改变的变量"(这个说法似乎很拗口,但却最准确的表达了C语言中const的本质),在编译阶段需要的常数仍然只能以#define宏定义!故在C语言中如下程序是非法的:
%A
%A const int SIZE = 10;
%A char a[SIZE]; /* 非法:编译阶段不能用到变量 */
%A
%A 关键字volatile
%A
%A C语言编译器会对用户书写的代码进行优化,譬如如下代码:
%A
%A int a,b,c;
%A a = inWord(0x100); /*读取I/O空间0x100端口的内容存入a变量*/
%A b = a;
%A a = inWord (0x100); /*再次读取I/O空间0x100端口的内容存入a变量*/
%A c = a;
%A
%A 很可能被编译器优化为:
%A
%A int a,b,c;
%A a = inWord(0x100); /*读取I/O空间0x100端口的内容存入a变量*/
%A b = a;
%A c = a;
%A
%A 但是这样的优化结果可能导致错误,如果I/O空间0x100端口的内容在执行第一次读操作后被其它程序写入新值,则其实第2次读操作读出的内容与第一次不同,b和c的值应该不同。在变量a的定义前加上volatile关键字可以防止编译器的类似优化,正确的做法是:
%A
%A volatile int a;
%A
%A volatile变量可能用于如下几种情况:
%A
%A (1) 并行设备的硬件寄存器(如:状态寄存器,例中的代码属于此类);
%A
%A (2) 一个中断服务子程序中会访问到的非自动变量(也就是全局变量);
%A
%A (3) 多线程应用中被几个任务共享的变量。
%A
%A CPU字长与存储器位宽不一致处理
%A
%A 在背景篇中提到,本文特意选择了一个与CPU字长不一致的存储芯片,就是为了进行本节的讨论,解决CPU字长与存储器位宽不一致的情况。80186的字长为16,而NVRAM的位宽为8,在这种情况下,我们需要为NVRAM提供读写字节、字的接口,如下:
%A
%A typedef unsigned char BYTE;
%A typedef unsigned int WORD;
%A /* 函数功能:读NVRAM中字节
%A * 参数:wOffset,读取位置相对NVRAM基地址的偏移
%A * 返回:读取到的字节值
%A */
%A extern BYTE ReadByteNVRAM(WORD wOffset)
%A {
%A LPBYTE lpAddr = (BYTE*)(NVRAM + wOffset * 2); /* 为什么偏移要×2? */
%A
%A return *lpAddr;
%A }
%A
%A /* 函数功能:读NVRAM中字
%A * 参数:wOffset,读取位置相对NVRAM基地址的偏移
%A * 返回:读取到的字
%A */
%A extern WORD ReadWordNVRAM(WORD wOffset)
%A {
%A WORD wTmp = 0;
%A LPBYTE lpAddr;
%A /* 读取高位字节 */
%A lpAddr = (BYTE*)(NVRAM + wOffset * 2); /* 为什么偏移要×2? */
%A wTmp += (*lpAddr)*256;
%A /* 读取低位字节 */
%A lpAddr = (BYTE*)(NVRAM + (wOffset +1) * 2); /* 为什么偏移要×2? */
%A wTmp += *lpAddr;
%A return wTmp;
%A }
%A
%A /* 函数功能:向NVRAM中写一个字节
%A *参数:wOffset,写入位置相对NVRAM基地址的偏移
%A * byData,欲写入的字节
%A */
%A extern void WriteByteNVRAM(WORD wOffset, BYTE byData)
%A {
%A …
%A }
%A
%A /* 函数功能:向NVRAM中写一个字 */
%A *参数:wOffset,写入位置相对NVRAM基地址的偏移
%A * wData,欲写入的字
%A */
%A extern void WriteWordNVRAM(WORD wOffset, WORD wData)
%A {
%A …
%A }
%A
%A 子贡问曰:Why偏移要乘以2?
%A
%A 子曰:请看图1,16位80186与8位NVRAM之间互连只能以地址线A1对其A0,CPU本身的A0与NVRAM不连接。因此,NVRAM的地址只能是偶数地址,故每次以0x10为单位前进!
%A
%A
%A 图1 CPU与NVRAM地址线连接
%A
%A 子贡再问:So why 80186的地址线A0不与NVRAM的A0连接?
%A
%A 子曰:请看《IT论语》之《微机原理篇》,那里面讲述了关于计算机组成的圣人之道。
%A
%A 总结
%A
%A 本篇主要讲述了嵌入式系统C编程中内存操作的相关技巧。掌握并深入理解关于数据指针、函数指针、动态申请内存、const及volatile关键字等的相关知识,是一个优秀的C语言程序设计师的基本要求。当我们已经牢固掌握了上述技巧后,我们就已经学会了C语言的99%,因为C语言最精华的内涵皆在内存操作中体现。
%A
%A 我们之所以在嵌入式系统中使用C语言进行程序设计,99%是因为其强大的内存操作能力!
%A
%A 如果你爱编程,请你爱C语言;
%A
%A 如果你爱C语言,请你爱指针;
%A
%A 如果你爱指针,请你爱指针的指针!
%A
%A%A
%A
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。