嵌入式中C和汇编的一些技巧

ARM汇编部分:

A. 条件执行

      CMP R0,#5

      BEQ BYPASS

      ADD R1,R1,R0

      SUB R1,R1,R2

   BYPASS ......

可以替代为:

       CMP R0,#5

       ADDNE R1,R1,R0

       SUBNE R1,R1,R2

       ......

        如果被跳过的指令序列并不进行复杂的操作,使用条件执行都要比使用转移好,因为ARM转义指令一般要用3个周期来执行。

       对于以下的条件执行可以这样来写汇编:

       ; if ( (a = = b) && (c = = d) )   e++

       CMP R0,R1

      CMPEQ R2,R3

      ADDEQ R4,R4,#1

 

C语言部分:

A.  很多人认为以下两种变量定义空间效率一样的:

        char a;

short b;

char c;

int d;

        char a;

char b;

short c;

int d;

其实不然,定义次序的不同导致最终映像中不同的数据布局,实际中第二种定义方式能够节约更多的存储空间,所以在变量声名时,最好把所有相同类型的变量放在一起定义,这样可以优化存储器布局。

 

B.  我们总是设法使用short或者char来定义变量,认为这样能够节省存储空间,但也有例外,我们先来看下这几段C代码及其相应的汇编:

  C代码:

int addition(int a)

        { return a+1; }

        汇编:

        ADD a1,a1,#1

 

  C代码:

        short addition(short a)

{ return a+1; }

汇编:

ADD a1,a1,#1

MOV a1,a1,LSL #16

MOV a1,a1,ASR #16

MOV PC,LR

 

  C代码:

        char addition(char a)

{ return a+1; }

汇编:

ADD a1,a1,#1

AND a1,a1,# &FF

MOV PC,LR

 

    因为char 类型、short类型分别是8位、16位,完成加法操作后,需要在32位的寄存器中进行符号扩展,所以使用32位的int以及unsinged int做加法效率最高。

 

C.冗余变量要消耗空间,许多人都不赞同使用它,但是下面这种情况就不同了。

int m ( void );

    Int n ( void );

    Int fg;

 

void func_1 ( void )

{

fg += m ( );

fg += n ( );

}

 

  void func_2 ( void )

        {

            int tmp = fg;

            tmp += m ( );

            tmp += n ( );

            fg = tmp;

}

   

    func_1 ( ) 中每次对全局变量fg的加法操作都需要从存储器load到寄存器里,加完数据后还要store回原来的存储器,所以这个函数就进行了两次load和两次store操作。在func_2 ( ) 中,tmp作为局部变量,系统为其分配一寄存器,首先执行一次load操作后,由tmp进行加法,最后只需一次store操作把结果送给fg,节省了很多时间,毕竟读/写存储器的时间耗费要比读/写寄存器高得多。

 

D.关于计数循环的问题,一般我们都会使用累加计数的方式,递减计数用得比较少,虽然从C代码上看累加和递减两种方式时间复杂度相同,但是在对时间要求严格的嵌入式领域,这两者执行时间还是有差别的。

  累加计数方式:

        for ( i = 1; i < times; i ++ )

        {

           tmp = tmp * i ;

}

汇编:

……

0x06: MUL R2,R1,R2

0x10: ADD R1,R1,#1

0x14: CMP R2,R0

0x18: BLE 0x06

……

  递减计数方式:

        for ( i = times; i > 1; i -- )

        {

           tmp = tmp * i ;

}

汇编:

……

0x06: MUL R0,R1,R0

0x10: SUB R1,R1,#1

0x14: BNE 0x06

        ……

    从上面的汇编可以看出,累加计数需要用到专门的CMP指令来判断条件,而递减计数只需要利用条件执行的NE进行判别,当循环次数的量很大的话时间效率就有差别了。

投 票

觉得本文不错,投一票   

评 论


验证码: 看不清?换一张

作者最新博文

    数据正在载入中..

部落热点博文

    数据正在载入中..