首页 > 其他分享 >C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表

时间:2023-08-02 18:32:07浏览次数:36  
标签:语句 esp C语言 break Switch ebp printf push ptr

Switch语句

Switch语句也是分支语句的一种,其语法如下:

switch(表达式)

{

case 常量表达式1:

 语句;

break;


case 常量表达式:

 语句;

break;


case 常量表达式:

 语句;

break;

 ......

default:

 语句;

break;

}

需要注意如下几点:

  1. 表达式结束不能是浮点数
  2. case后的常量值不能一样
  3. case后的值必须是常量
  4. break非常重要,当执行到一个分支后,如果没有break就会继续向下执行,遇到break才会跳出switch语句
  5. default语句与位置无关,但是当default写在其他条件的前面时。如果没有break就会向下继续匹配执行

switch语句与if..else语句的区别:

  1. switch语句只能进行等值判断(仅能支持常量表达式),而if..else可以进行区间判断(表达式、常量...都可以)
  2. switch语句的执行效率远远高于if..else,在分支条件比较多的情况下,这种趋势愈发明显

Switch语句为什么高效

之前说到switch语句的执行效率远远高于if..else,这是为什么?我们可以写一段代码通过反汇编来查看其在底层的具体实现:

int x = 3;
 
switch(x)
{
case1:
 printf("A \n");
break;
case2:
 printf("B \n");
break;
case3:
 printf("C \n");
break;
case4:
 printf("D \n");
break;
default:
 printf("default \n");
break;
}

其反汇编代码为:

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_switch语句

如上反汇编代码我们可以看出switch在一开始就直接将变量x-1与3进行比较,ja指令则表示大于则跳转(a表示above),但这变量x明显等于3,所以将值赋予edx,最后jmp跳到堆栈地址2*4+40d896(40d896+8),也就是0x40D89E对应的值:

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_switch语句_02

最终跳转到0x0040d80c,打印出了C。

 

我自己机器上的实验:

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_反汇编_03

 

 

为啥本质上是查找表呢?我自己机器上分析下:

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_反汇编_04

 

 

 

那么我们再使用if...else来实现相同功能:

int x = 3;

 

if (x == 1) {


 printf("A \n");


} elseif (x == 2) {


 printf("B \n");


} elseif (x == 3) {


 printf("C \n");


} elseif (x == 4) {


 printf("D \n");


} else {


 printf("default \n");

}

其反汇编代码为:

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_switch语句_05

可以看见其会一行一行的执行,而不像switch语句一样,直接可以跳转到对应的地址。

通过观察堆栈,我们可以发现switch的高明之处:

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_反汇编_06

其将case分支的执行地址都存入到了堆栈中(也就是查找表),而后使用算法去寻找到对应要执行的地址(堆栈存储的地址),这套算法我们可以这样理解:

1.堆栈中会存在一个执行地址的内存表,其顺序是按照case后的常量大小排序的,最大的常量所在的分支执行地址最先压入表中;如下图所示我将代码顺序打乱后还是如此:

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_堆栈_07

2.根据内存表存储顺序,直接将传入的值减去1,然后*4(这里也是数据宽度4字节)+最后压入的堆栈地址。

了解完算法原理之后,我们需要了解一个概念:大表和小表;当生成的函数跳转地址表,每个成员有4个字节的时,我们称之为大表。

注意

  1. 在case分支小于等于3个、case最大值和最小值差大于等于255时不存在大小表
  2. 在case分支大于3个并且大表项空隙小于等于6个时只有大表没有小表
  3. 在case分支大于3个且大表项空隙大于6个且case最大最小差值小于255时存在大表和小表

最后:在一般情况下,我们通常会去使用if语句而不是switch,因为if语句在编程时更加得心应手,所以我们可以暂且忽视效率而去选择更加便利的编写方式。

 

实例

case分支少的switch语句

CPP代码:

#include "stdafx.h"
void Fun(int x) {
	switch (x) {
		case 1:
			printf("%d",1);
			break;
		case 2:
			printf("%d",2);
			break;
		case 3:
			printf("%d",3);
			break;
		default:
			printf("None");
			break;
	}
}

int main(int argc, char* argv[]) {
	Fun(2);
	return 0;
}

反汇编:

Fun:
0040D490   push        ebp
0040D491   mov         ebp,esp
0040D493   sub         esp,44h
0040D496   push        ebx
0040D497   push        esi
0040D498   push        edi
0040D499   lea         edi,[ebp-44h]
0040D49C   mov         ecx,11h
0040D4A1   mov         eax,0CCCCCCCCh
0040D4A6   rep stos    dword ptr [edi]
0040D4A8   mov         eax,dword ptr [ebp+8]
0040D4AB   mov         dword ptr [ebp-4],eax
0040D4AE   cmp         dword ptr [ebp-4],1
0040D4B2   je          Fun+32h (0040d4c2)
0040D4B4   cmp         dword ptr [ebp-4],2
0040D4B8   je          Fun+43h (0040d4d3)
0040D4BA   cmp         dword ptr [ebp-4],3
0040D4BE   je          Fun+54h (0040d4e4)
0040D4C0   jmp         Fun+65h (0040d4f5)
0040D4C2   push        1
0040D4C4   push        offset string "%d" (0042210c)
0040D4C9   call        printf (0040d760)
0040D4CE   add         esp,8
0040D4D1   jmp         Fun+72h (0040d502)
0040D4D3   push        2
0040D4D5   push        offset string "%d" (0042210c)
0040D4DA   call        printf (0040d760)
0040D4DF   add         esp,8
0040D4E2   jmp         Fun+72h (0040d502)
0040D4E4   push        3
0040D4E6   push        offset string "%d" (0042210c)
0040D4EB   call        printf (0040d760)
0040D4F0   add         esp,8
0040D4F3   jmp         Fun+72h (0040d502)
0040D4F5   push        offset string "None" (00422f6c)
0040D4FA   call        printf (0040d760)
0040D4FF   add         esp,4
0040D502   pop         edi
0040D503   pop         esi
0040D504   pop         ebx
0040D505   add         esp,44h
0040D508   cmp         ebp,esp
0040D50A   call        __chkesp (004010a0)
0040D50F   mov         esp,ebp
0040D511   pop         ebp
0040D512   ret

小结:

case分支小于4个时,其反汇编与if...else类似

case分支多的switch语句

CPP代码:

#include "stdafx.h"
void Fun(int x) {
	switch (x) {
		case 1:
			printf("1");
			break;
		case 2:
			printf("2");
			break;
		case 3:
			printf("3");
			break;
		case 4:
			printf("4");
			break;
		default:
			printf("None");
			break;
	}
}

int main(int argc, char* argv[]) {
	Fun(2);
	return 0;
}

反汇编:

Fun:
0040D490   push        ebp
0040D491   mov         ebp,esp
0040D493   sub         esp,44h
0040D496   push        ebx
0040D497   push        esi
0040D498   push        edi
0040D499   lea         edi,[ebp-44h]
0040D49C   mov         ecx,11h
0040D4A1   mov         eax,0CCCCCCCCh
0040D4A6   rep stos    dword ptr [edi]
0040D4A8   mov         eax,dword ptr [ebp+8]
0040D4AB   mov         dword ptr [ebp-4],eax
0040D4AE   mov         ecx,dword ptr [ebp-4]
0040D4B1   sub         ecx,1
0040D4B4   mov         dword ptr [ebp-4],ecx	;[ebp-4]=[ebp+8]-1
0040D4B7   cmp         dword ptr [ebp-4],3
0040D4BB   ja          $L537+11h (0040d50b)		;如果[ebp-4]>3跳转到0040d50b
0040D4BD   mov         edx,dword ptr [ebp-4]
0040D4C0   jmp         dword ptr [edx*4+40D529h]
$L533:
0040D4C7   push        offset string "1" (00422fac)
0040D4CC   call        printf (0040d760)
0040D4D1   add         esp,4
0040D4D4   jmp         $L539+1Ch (0040d510)
$L535:
0040D4D6   push        offset string "2" (00422fa8)
0040D4DB   call        printf (0040d760)
0040D4E0   add         esp,4
0040D4E3   jmp         $L539+1Ch (0040d510)
$L537:
0040D4E5   push        offset string "3" (00422fa4)
0040D4EA   call        printf (0040d760)
0040D4EF   add         esp,4
0040D4F2   jmp         $L539+1Ch (0040d510)
$L539:
0040D4F4   push        offset string "4" (0042210c)
0040D4F9   call        printf (0040d760)
0040D4FE   add         esp,4
0040D501   jmp         $L539+1Ch (0040d510)
0040D503   push        offset string "None" (00422f6c)
0040D508   call        printf (0040d760)
0040D50D   add         esp,4
0040D510   pop         edi
0040D511   pop         esi
0040D512   pop         ebx
0040D513   add         esp,44h
0040D516   cmp         ebp,esp
0040D518   call        __chkesp (004010a0)
0040D51D   mov         esp,ebp
0040D51F   pop         ebp
0040D520   ret

Register:

EAX = 00000002 EBX = 7FFDE000
 ECX = 00000001 EDX = 00000001
 ESI = 00000000 EDI = 0012FF28
 EIP = 0040D4C0 ESP = 0012FED8
 EBP = 0012FF28 EFL = 00000293

Memory:

0040D521  C7 D4 40 00  窃@.
0040D525  D6 D4 40 00  衷@.
0040D529  E5 D4 40 00  逶@.
0040D52D  F4 D4 40 00  粼@.

小结:

case分支大于等于4个且连续时,会在一段连续内存中存储每个case所对应语句块的起始地址(称其为大表),根据[edx*4+40D529h]即可确定跳转地址

case后的值打乱顺序

CPP代码:

#include "stdafx.h"
void Fun(int x) {
	switch (x) {
		case 2:
			printf("2");
			break;
		case 1:
			printf("1");
			break;
		case 4:
			printf("4");
			break;
		case 3:
			printf("3");
			break;
		default:
			printf("None");
			break;
	}
}

int main(int argc, char* argv[]) {
	Fun(2);
	return 0;
}

反汇编:

Fun:
0040D490   push        ebp
0040D491   mov         ebp,esp
0040D493   sub         esp,44h
0040D496   push        ebx
0040D497   push        esi
0040D498   push        edi
0040D499   lea         edi,[ebp-44h]
0040D49C   mov         ecx,11h
0040D4A1   mov         eax,0CCCCCCCCh
0040D4A6   rep stos    dword ptr [edi]
0040D4A8   mov         eax,dword ptr [ebp+8]
0040D4AB   mov         dword ptr [ebp-4],eax
0040D4AE   mov         ecx,dword ptr [ebp-4]
0040D4B1   sub         ecx,1
0040D4B4   mov         dword ptr [ebp-4],ecx
0040D4B7   cmp         dword ptr [ebp-4],3
0040D4BB   ja          $L539+0Fh (0040d503)
0040D4BD   mov         edx,dword ptr [ebp-4]
0040D4C0   jmp         dword ptr [edx*4+40D521h]
$L533:
0040D4C7   push        offset string "2" (00422fac)
0040D4CC   call        printf (0040d760)
0040D4D1   add         esp,4
0040D4D4   jmp         $L539+1Ch (0040d510)
$L535:
0040D4D6   push        offset string "1" (00422fa8)
0040D4DB   call        printf (0040d760)
0040D4E0   add         esp,4
0040D4E3   jmp         $L539+1Ch (0040d510)
$L537:
0040D4E5   push        offset string "4" (00422fa4)
0040D4EA   call        printf (0040d760)
0040D4EF   add         esp,4
0040D4F2   jmp         $L539+1Ch (0040d510)
$L539:
0040D4F4   push        offset string "3" (0042210c)
0040D4F9   call        printf (0040d760)
0040D4FE   add         esp,4
0040D501   jmp         $L539+1Ch (0040d510)
0040D503   push        offset string "None" (00422f6c)
0040D508   call        printf (0040d760)
0040D50D   add         esp,4
0040D510   pop         edi
0040D511   pop         esi
0040D512   pop         ebx
0040D513   add         esp,44h
0040D516   cmp         ebp,esp
0040D518   call        __chkesp (004010a0)
0040D51D   mov         esp,ebp
0040D51F   pop         ebp
0040D520   ret

Register:

EAX = 00000002 EBX = 7FFDB000
 ECX = 00000001 EDX = 00000001
 ESI = 00000000 EDI = 0012FF28
 EIP = 0040D4C0 ESP = 0012FED8
 EBP = 0012FF28 EFL = 00000293

Memory:

0040D521  D6 D4 40 00  衷@.
0040D525  C7 D4 40 00  窃@.
0040D529  F4 D4 40 00  粼@.
0040D52D  E5 D4 40 00  逶@.

小结:

在值连续的情况下,顺序并不会影响生成大表

起始值对反汇编的影响

CPP代码:

#include "stdafx.h"
void Fun(int x) {
	switch (x) {
		case 100:
			printf("100");
			break;
		case 101:
			printf("101");
			break;
		case 102:
			printf("102");
			break;
		case 103:
			printf("103");
			break;
		case 104:
			printf("104");
			break;
		case 105:
			printf("105");
			break;
		case 106:
			printf("106");
			break;
		case 107:
			printf("107");
			break;
		case 108:
			printf("108");
			break;
		case 109:
			printf("109");
			break;
		default:
			printf("None");
			break;
	}
}

int main(int argc, char* argv[]) {
	Fun(102);
	return 0;
}

反汇编:

Fun:
0040D7E0   push        ebp
0040D7E1   mov         ebp,esp
0040D7E3   sub         esp,44h
0040D7E6   push        ebx
0040D7E7   push        esi
0040D7E8   push        edi
0040D7E9   lea         edi,[ebp-44h]
0040D7EC   mov         ecx,11h
0040D7F1   mov         eax,0CCCCCCCCh
0040D7F6   rep stos    dword ptr [edi]
0040D7F8   mov         eax,dword ptr [ebp+8]
0040D7FB   mov         dword ptr [ebp-4],eax
0040D7FE   mov         ecx,dword ptr [ebp-4]
0040D801   sub         ecx,64h	;64h=100
0040D804   mov         dword ptr [ebp-4],ecx
0040D807   cmp         dword ptr [ebp-4],9
0040D80B   ja          $L551+0Fh (0040d8b7)
0040D811   mov         edx,dword ptr [ebp-4]
0040D814   jmp         dword ptr [edx*4+40D8D5h]
$L533:
0040D81B   push        offset string "100" (00422fc4)
0040D820   call        printf (0040d760)
0040D825   add         esp,4
0040D828   jmp         $L551+1Ch (0040d8c4)
$L535:
0040D82D   push        offset string "101" (00422fc0)
0040D832   call        printf (0040d760)
0040D837   add         esp,4
0040D83A   jmp         $L551+1Ch (0040d8c4)
$L537:
0040D83F   push        offset string "102" (00422fbc)
0040D844   call        printf (0040d760)
0040D849   add         esp,4
0040D84C   jmp         $L551+1Ch (0040d8c4)
$L539:
0040D84E   push        offset string "103" (00422fb8)
0040D853   call        printf (0040d760)
0040D858   add         esp,4
0040D85B   jmp         $L551+1Ch (0040d8c4)
$L541:
0040D85D   push        offset string "104" (00422fb4)
0040D862   call        printf (0040d760)
0040D867   add         esp,4
0040D86A   jmp         $L551+1Ch (0040d8c4)
$L543:
0040D86C   push        offset string "105" (00422fb0)
0040D871   call        printf (0040d760)
0040D876   add         esp,4
0040D879   jmp         $L551+1Ch (0040d8c4)
$L545:
0040D87B   push        offset string "106" (00422fac)
0040D880   call        printf (0040d760)
0040D885   add         esp,4
0040D888   jmp         $L551+1Ch (0040d8c4)
$L547:
0040D88A   push        offset string "107" (00422fa8)
0040D88F   call        printf (0040d760)
0040D894   add         esp,4
0040D897   jmp         $L551+1Ch (0040d8c4)
$L549:
0040D899   push        offset string "108" (00422fa4)
0040D89E   call        printf (0040d760)
0040D8A3   add         esp,4
0040D8A6   jmp         $L551+1Ch (0040d8c4)
$L551:
0040D8A8   push        offset string "109" (0042210c)
0040D8AD   call        printf (0040d760)
0040D8B2   add         esp,4
0040D8B5   jmp         $L551+1Ch (0040d8c4)
0040D8B7   push        offset string "None" (00422f6c)
0040D8BC   call        printf (0040d760)
0040D8C1   add         esp,4
0040D8C4   pop         edi
0040D8C5   pop         esi
0040D8C6   pop         ebx
0040D8C7   add         esp,44h
0040D8CA   cmp         ebp,esp
0040D8CC   call        __chkesp (004010a0)
0040D8D1   mov         esp,ebp
0040D8D3   pop         ebp
0040D8D4   ret

Memory:

0040D8D5  1B D8 40 00  .谸.
0040D8D9  2D D8 40 00  -谸.
0040D8DD  3F D8 40 00  ?谸.
0040D8E1  4E D8 40 00  N谸.
0040D8E5  5D D8 40 00  ]谸.
0040D8E9  6C D8 40 00  l谸.
0040D8ED  7B D8 40 00  {谸.
0040D8F1  8A D8 40 00  娯@.
0040D8F5  99 D8 40 00  欂@.
0040D8F9  A8 D8 40 00  ㄘ@.

Register:

EAX = 00000066 EBX = 7FFDB000
 ECX = 00000002 EDX = 00000002
 ESI = 00000000 EDI = 0012FF28
 EIP = 0040D814 ESP = 0012FED8
 EBP = 0012FF28 EFL = 00000297

小结:

起始值并不影响大表的生成,edx = switch表达式的值 - case整型常量起始值

连续值中抹去少项

CPP代码:

#include "stdafx.h"
void Fun(int x) {
	switch (x) {
		case 100:
			printf("100");
			break;
		case 101:
			printf("101");
			break;
		case 102:
			printf("102");
			break;
		case 103:
			printf("103");
			break;
		case 106:
			printf("106");
			break;
		case 107:
			printf("107");
			break;
		case 108:
			printf("108");
			break;
		case 109:
			printf("109");
			break;
		default:
			printf("None");
			break;
	}
}

int main(int argc, char* argv[]) {
	Fun(102);
	return 0;
}

反汇编:

Fun:
0040D7E0   push        ebp
0040D7E1   mov         ebp,esp
0040D7E3   sub         esp,44h
0040D7E6   push        ebx
0040D7E7   push        esi
0040D7E8   push        edi
0040D7E9   lea         edi,[ebp-44h]
0040D7EC   mov         ecx,11h
0040D7F1   mov         eax,0CCCCCCCCh
0040D7F6   rep stos    dword ptr [edi]
0040D7F8   mov         eax,dword ptr [ebp+8]
0040D7FB   mov         dword ptr [ebp-4],eax
0040D7FE   mov         ecx,dword ptr [ebp-4]
0040D801   sub         ecx,64h
0040D804   mov         dword ptr [ebp-4],ecx
0040D807   cmp         dword ptr [ebp-4],9
0040D80B   ja          $L547+0Fh (0040d893)
0040D811   mov         edx,dword ptr [ebp-4]
0040D814   jmp         dword ptr [edx*4+40D8B1h]
$L533:
0040D81B   push        offset string "100" (00422fbc)
0040D820   call        printf (0040d760)
0040D825   add         esp,4
0040D828   jmp         $L547+1Ch (0040d8a0)
$L535:
0040D82A   push        offset string "101" (00422fb8)
0040D82F   call        printf (0040d760)
0040D834   add         esp,4
0040D837   jmp         $L547+1Ch (0040d8a0)
$L537:
0040D839   push        offset string "102" (00422fb4)
0040D83E   call        printf (0040d760)
0040D843   add         esp,4
0040D846   jmp         $L547+1Ch (0040d8a0)
$L539:
0040D848   push        offset string "103" (00422fb0)
0040D84D   call        printf (0040d760)
0040D852   add         esp,4
0040D855   jmp         $L547+1Ch (0040d8a0)
$L541:
0040D857   push        offset string "106" (00422fac)
0040D85C   call        printf (0040d760)
0040D861   add         esp,4
0040D864   jmp         $L547+1Ch (0040d8a0)
$L543:
0040D866   push        offset string "107" (00422fa8)
0040D86B   call        printf (0040d760)
0040D870   add         esp,4
0040D873   jmp         $L547+1Ch (0040d8a0)
$L545:
0040D875   push        offset string "108" (00422fa4)
0040D87A   call        printf (0040d760)
0040D87F   add         esp,4
0040D882   jmp         $L547+1Ch (0040d8a0)
$L547:
0040D884   push        offset string "109" (0042210c)
0040D889   call        printf (0040d760)
0040D88E   add         esp,4
0040D891   jmp         $L547+1Ch (0040d8a0)
0040D893   push        offset string "None" (00422f6c)
0040D898   call        printf (0040d760)
0040D89D   add         esp,4
0040D8A0   pop         edi
0040D8A1   pop         esi
0040D8A2   pop         ebx
0040D8A3   add         esp,44h
0040D8A6   cmp         ebp,esp
0040D8A8   call        __chkesp (004010a0)
0040D8AD   mov         esp,ebp
0040D8AF   pop         ebp
0040D8B0   ret

Memory:

0040D8B1  1B D8 40 00  .谸.
0040D8B5  2A D8 40 00  *谸.
0040D8B9  39 D8 40 00  9谸.
0040D8BD  48 D8 40 00  H谸.
0040D8C1  93 D8 40 00  撠@.	;缺失的104和105都跳转到0040D893
0040D8C5  93 D8 40 00  撠@.	;而0040D893是Default的语句块地址
0040D8C9  57 D8 40 00  W谸.
0040D8CD  66 D8 40 00  f谸.
0040D8D1  75 D8 40 00  u谸.
0040D8D5  84 D8 40 00  勜@.

Register:

EAX = 00000066 EBX = 7FFDE000
 ECX = 00000002 EDX = 00000002
 ESI = 00000000 EDI = 0012FF28
 EIP = 0040D814 ESP = 0012FED8
 EBP = 0012FF28 EFL = 00000297

小结:

空缺地址通过填充default语句块地址解决,但会造成内存浪费

连续值中抹去多项

CPP代码:

#include "stdafx.h"
void Fun(int x) {
	switch (x) {
		case 100:
			printf("100");
			break;
		case 101:
			printf("101");
			break;
		case 102:
			printf("102");
			break;
		case 106:
			printf("106");
			break;
		case 108:
			printf("108");
			break;
		case 112:
			printf("112");
			break;
		case 115:
			printf("115");
			break;
		default:
			printf("None");
			break;
	}
}

int main(int argc, char* argv[]) {
	Fun(110);
	return 0;
}

反汇编:

Fun:
0040D7E0   push        ebp
0040D7E1   mov         ebp,esp
0040D7E3   sub         esp,44h
0040D7E6   push        ebx
0040D7E7   push        esi
0040D7E8   push        edi
0040D7E9   lea         edi,[ebp-44h]
0040D7EC   mov         ecx,11h
0040D7F1   mov         eax,0CCCCCCCCh
0040D7F6   rep stos    dword ptr [edi]
0040D7F8   mov         eax,dword ptr [ebp+8]
0040D7FB   mov         dword ptr [ebp-4],eax
0040D7FE   mov         ecx,dword ptr [ebp-4]
0040D801   sub         ecx,64h
0040D804   mov         dword ptr [ebp-4],ecx
0040D807   cmp         dword ptr [ebp-4],0Fh
0040D80B   ja          $L545+0Fh (0040d888)
0040D80D   mov         eax,dword ptr [ebp-4]
0040D810   xor         edx,edx				;edx清零
0040D812   mov         dl,byte ptr  (0040d8c6)[eax]	;dl=[小表地址+eax] ==>没有看懂。。。todo
0040D818   jmp         dword ptr [edx*4+40D8A6h]
$L533:
0040D81F   push        offset string "102" (00422fb4)
0040D824   call        printf (0040d760)
0040D829   add         esp,4
0040D82C   jmp         $L545+1Ch (0040d895)
$L535:
0040D82E   push        offset string "1003\n" (00422fd8)
0040D833   call        printf (0040d760)
0040D838   add         esp,4
0040D83B   jmp         $L545+1Ch (0040d895)
$L537:
0040D83D   push        offset string "109" (00422fac)
0040D842   call        printf (0040d760)
0040D847   add         esp,4
0040D84A   jmp         $L545+1Ch (0040d895)
$L539:
0040D84C   push        offset string "1009\n" (00422fd0)
0040D851   call        printf (0040d760)
0040D856   add         esp,4
0040D859   jmp         $L545+1Ch (0040d895)
$L541:
0040D85B   push        offset string "108" (00422fa4)
0040D860   call        printf (0040d760)
0040D865   add         esp,4
0040D868   jmp         $L545+1Ch (0040d895)
$L543:
0040D86A   push        offset string "109" (00422fc8)
0040D86F   call        printf (0040d760)
0040D874   add         esp,4
0040D877   jmp         $L545+1Ch (0040d895)
$L545:
0040D879   push        offset string "115" (00422fc0)
0040D87E   call        printf (0040d760)
0040D883   add         esp,4
0040D886   jmp         $L545+1Ch (0040d895)
0040D888   push        offset string "error\n" (00422f6c)
0040D88D   call        printf (0040d760)
0040D892   add         esp,4
0040D895   pop         edi
0040D896   pop         esi
0040D897   pop         ebx
0040D898   add         esp,44h
0040D89B   cmp         ebp,esp
0040D89D   call        __chkesp (004010a0)
0040D8A2   mov         esp,ebp
0040D8A4   pop         ebp
0040D8A5   ret

Memory:

;大表
0040D8A6  1F D8 40 00  .谸.
0040D8AA  2E D8 40 00  .谸.
0040D8AE  3D D8 40 00  =谸.
0040D8B2  4C D8 40 00  L谸.
0040D8B6  5B D8 40 00  [谸.
0040D8BA  6A D8 40 00  j谸.
0040D8BE  79 D8 40 00  y谸.
0040D8C2  88 D8 40 00  堌@.
;小表
0040D8C6  00 01 02 07  ....
0040D8CA  07 07 03 07  ....
0040D8CE  04 07 07 07  ....
0040D8D2  05 07 07 06  ....

小表的解释:

  • 当空缺值太多时内存的浪费也会变多,编译器当然知道这样不是办法,所以利用小表来解决这个问题。小表可以看作是一个智能蹦床,对于不同的玩家会给出不同的力,遇到没有付费的玩家(空缺值)直接将他抛出场外(给出参数,使其跳转到default的语句块),遇到付费玩家(存在的值)则按照他的等级给出不同的力(给出参数,使其跳转到其对应的语句块)
  • 可以看出,在小表中所有的空缺值都是07(因为在这个样例中,当edx=7[edx*4+40D8A6h]的地址为default语句块的地址),而存在的值的对应值从0递增。

 

断开一定程度的选择

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_反汇编_08

C语言逆向分析——Switch语句,为何大多数情况较if语句更高效?就是因为查找表_反汇编_09


关键点

mov dl,byte ptr (004010d0)[eax]

jmp dword ptr [edx4+4010BCh]
(004010d0)[eax] = [004010d0 + eax
4] 在这个地址中得到一个偏移 作为查询大表的edx值。==》内在原理是啥???todo

 

 

差值大的情况

CPP代码:

#include "stdafx.h"
void Fun(int x) {
	switch (x) {
		case 301:
			printf("301");
			break;
		case 302:
			printf("302");
			break;
		case 303:
			printf("303");
			break;
		case 304:
			printf("304");
			break;
		case 305:
			printf("305");
			break;
		case 306:
			printf("306");
			break;
		case 307:
			printf("307");
			break;
		case 308:
			printf("308");
			break;
		case 309:
			printf("309");
			break;
		case 3:
			printf("3");
			break;
		default:
			printf("None");
			break;
	}
}

int main(int argc, char* argv[]) {
	Fun(102);
	return 0;
}

反汇编:

Fun:
0040D7E0   push        ebp
0040D7E1   mov         ebp,esp
0040D7E3   sub         esp,44h
0040D7E6   push        ebx
0040D7E7   push        esi
0040D7E8   push        edi
0040D7E9   lea         edi,[ebp-44h]
0040D7EC   mov         ecx,11h
0040D7F1   mov         eax,0CCCCCCCCh
0040D7F6   rep stos    dword ptr [edi]
0040D7F8   mov         eax,dword ptr [ebp+8]
0040D7FB   mov         dword ptr [ebp-4],eax
0040D7FE   cmp         dword ptr [ebp-4],131h	;0x131 = 305
0040D805   jg          Fun+75h (0040d855)		;[ebp-4] > 305 跳转到0040d855
0040D807   cmp         dword ptr [ebp-4],131h
0040D80E   je          Fun+0D7h (0040d8b7)		;[ebp-4] == 305 跳转到0040d8b7
0040D814   cmp         dword ptr [ebp-4],12Eh	;0x12E = 302
0040D81B   jg          Fun+5Eh (0040d83e)		;[ebp-4] > 302 跳转到0040d855
0040D81D   cmp         dword ptr [ebp-4],12Eh
0040D824   je          Fun+0A7h (0040d887)		;[ebp-4] == 302 跳转到0040d887
0040D826   cmp         dword ptr [ebp-4],3;   3比较
0040D82A   je          $L549+0Fh (0040d902)
0040D830   cmp         dword ptr [ebp-4],12Dh; ==>301比较
0040D837   je          Fun+95h (0040d875)
0040D839   jmp         $L549+1Eh (0040d911)
0040D83E   cmp         dword ptr [ebp-4],12Fh
0040D845   je          Fun+0B9h (0040d899)
0040D847   cmp         dword ptr [ebp-4],130h;==>304比较
0040D84E   je          Fun+0C8h (0040d8a8)
0040D850   jmp         $L549+1Eh (0040d911)
0040D855   mov         ecx,dword ptr [ebp-4]
0040D858   sub         ecx,132h ;306比较
0040D85E   mov         dword ptr [ebp-4],ecx
0040D861   cmp         dword ptr [ebp-4],3
0040D865   ja          $L549+1Eh (0040d911)
0040D86B   mov         edx,dword ptr [ebp-4]
0040D86E   jmp         dword ptr [edx*4+40D92Fh] ;==>这里也有表
0040D875   push        offset string "301" (00422fc4)
0040D87A   call        printf (0040d760)
0040D87F   add         esp,4
0040D882   jmp         $L549+2Bh (0040d91e)
0040D887   push        offset string "302" (00422fc0)
0040D88C   call        printf (0040d760)
0040D891   add         esp,4
0040D894   jmp         $L549+2Bh (0040d91e)
0040D899   push        offset string "303" (00422fbc)
0040D89E   call        printf (0040d760)
0040D8A3   add         esp,4
0040D8A6   jmp         $L549+2Bh (0040d91e)
0040D8A8   push        offset string "304" (00422fb8)
0040D8AD   call        printf (0040d760)
0040D8B2   add         esp,4
0040D8B5   jmp         $L549+2Bh (0040d91e)
0040D8B7   push        offset string "305" (00422fb4)
0040D8BC   call        printf (0040d760)
0040D8C1   add         esp,4
0040D8C4   jmp         $L549+2Bh (0040d91e)
$L543:
0040D8C6   push        offset string "306" (00422fb0)
0040D8CB   call        printf (0040d760)
0040D8D0   add         esp,4
0040D8D3   jmp         $L549+2Bh (0040d91e)
$L545:
0040D8D5   push        offset string "307" (00422fac)
0040D8DA   call        printf (0040d760)
0040D8DF   add         esp,4
0040D8E2   jmp         $L549+2Bh (0040d91e)
$L547:
0040D8E4   push        offset string "308" (00422fa8)
0040D8E9   call        printf (0040d760)
0040D8EE   add         esp,4
0040D8F1   jmp         $L549+2Bh (0040d91e)
$L549:
0040D8F3   push        offset string "309" (00422fa4)
0040D8F8   call        printf (0040d760)
0040D8FD   add         esp,4
0040D900   jmp         $L549+2Bh (0040d91e)
0040D902   push        offset string "3" (0042210c)
0040D907   call        printf (0040d760)
0040D90C   add         esp,4
0040D90F   jmp         $L549+2Bh (0040d91e)
0040D911   push        offset string "None" (00422f6c)
0040D916   call        printf (0040d760)
0040D91B   add         esp,4
0040D91E   pop         edi
0040D91F   pop         esi
0040D920   pop         ebx
0040D921   add         esp,44h
0040D924

标签:语句,esp,C语言,break,Switch,ebp,printf,push,ptr
From: https://blog.51cto.com/u_11908275/6941631

相关文章

  • C语言逆向——数组和结构体,数组多维只是一个编译构造的假象,本质会转成一维数组,结构体
    数组数组是C语言中非常重要的一个概念,学习C语言主要就是两个知识点:数组、指针,学好这两个,那么你的C语言一定也会很好。什么是数组?或者说什么情况下我们需要使用数组,比如说我们需要定义一个人的年龄,我们可以定义一个变量来表示,但是如果我们需要定义三个人的年龄呢?那就需要三个变量来......
  • C语言学习笔记
    C语言入门写代码流程写C代码1、创建工程2、创建项目.cpp-c++文件.c-源文件.h-头文件head3、写代码1、main主函数,程序的入口,有且仅有一个//包含一个叫stdio.h的文件//std-标准standardinnputout标准输入输出,所以函数中有输入、输出语句都要包含这个文件#in......
  • c语言作业之求两个数的最大公约数
    intmain()//最大公约数{ intn=0; intm=0; intr=0; printf("请输入两个数字:"); scanf("%d%d",&n,&m); while(n%m)//n取模m { r=n%m; n=m; m=r; } printf("最大公约数为:%d\n",m); return0;}......
  • 无涯教程-Lua - nested语句函数
    Lua编程语言允许在另一个循环中使用一个循环。以下部分显示了一些示例来说明这一概念。nestedloops-语法Lua中嵌套for循环语句的语法如下-forinit,max/minvalue,incrementdoforinit,max/minvalue,incrementdostatement(s)endstatement(s)en......
  • 【C语言基础】分支和循环
    目录一、分支语句1.1if语句1.2switch语句二、循环语句2.1while语句2.2for语句2.3dowhile语句一、分支语句1.1if语句语法结构if(表达式1)//如果表达式1为真,执行语句1;如果为假,不执行。语句1;if(表达式1)//如果表达式1为真,执行语句1;如果为假,执行语句2。语句1;else语句2;//多......
  • 无涯教程-Lua - repeat...until 语句函数
    与for和while循环(它们在循环顶部测试循环条件)不同,Lua编程中的repeat...until循环语言在循环的底部检查其条件。repeat...until循环与while循环相似,不同之处在于,保证do...while循环至少执行一次。repeat...untilloop-语法Lua编程语言中repeat...until循......
  • 我的第八次C语言练习
    今天原本还想多学点,结果代码打到一半突然没保存到,导致只能重新打,浪费了很多时间,也就没学什么。//intmain(void)//{// floata;// a=3.1415926;// printf("%fcanbewritten%e\nalsocanbewritten%a",a,a,a);// return0;//}今天学的是浮点数,其中%f,%e,%a分别指的......
  • 无涯教程-Lua - for语句函数
    for循环是一种重复控制结构,可让您有效地编写需要执行特定次数的循环。forloop-语法Lua编程语言中for循环的语法如下-forinit,max/minvalue,incrementdostatement(s)end这是for循环中的控制流程-首先执行init步骤,并且仅执行一次。此步骤使您可以声明和初......
  • 无涯教程-Lua - while语句函数
    只要给定条件为真,Lua编程语言中的while循环语句就会重复执行目标语句。whileloop-语法Lua编程语言中while循环的语法如下-while(condition)dostatement(s)endwhileloop-流程图在这里,需要注意的关键是while循环可能根本不执行。当测试条件并且输出为false......
  • C语言, 字符串
    #include<stdio.h>#include<stdlib.h>#include<string.h>char*tt3="web数学算法";intstr_comparer(){//字符串是个指向字符串开头的指针char*tt1="aac";char*tt2="aa";//字符串可以直接转换成整数,前面加......