roger 发表于 2020-9-20 21:42:47

反汇编代码还原之特殊除法还原

目录
[*] 代码还原反汇编之特殊除法还原
[*]               系列文章
[*]         一丶了解数学知识
[*]               1.1 简介
[*]               1.2 数学知识
[*]                         1.2.1 数学知识之代数与解方程
[*]                         1.2.2 简化表达式去括号
[*]                         1.2.3 简化表达式之交叉相乘
[*]                         1.2.4 简化表达式之合并同类项
[*]                         1.2.5 简化表达式之分数的加法简化
[*]                         1.2.7 简化表达式之分数乘法
[*]                         1.2.8分数除法
[*]         二丶除法特殊汇编
[*]               2.1 特殊定式汇编
[*]                         2.1.1高级代码与汇编对应
[*]                         2.1.2 核心代码反汇编还原
[*]                         2.1.3 特殊汇编的除法原理
[*]                         2.1.4 x86乘法特性与x64乘法特性
[*]                         2.1.5 汇编等式还原
[*]               2.2 特殊汇编M大于0x80000000的加调整
[*]                         2.2.1 高级代码与反汇编
[*]                         2.2.2 代码定式还原
[*]                         2.2.3代码优化原理
[*]               2.3 特殊汇编大于0x80000000无调整
[*]                         2.3.1 高级代码与反汇编
[*]                         2.3.2 代码定式还原
[*]                         2.3.3 除法原理还原
[*]               2.4 M小于0x80000000 的减调整
[*]                         2.4.1高级代码与反汇编
[*]                         2.4.2 代码公式还原
[*]                         2.4.3 除法优化原理
[*]         三丶总结
代码还原反汇编之特殊除法还原系列文章  反汇编技术之熟悉IDA工具
  反汇编逆向技术之寻找Main入口点
  反汇编代码还原之优化方式
  反汇编代码还原之加减乘
  反汇编代码还原之除法为2的幂
  反汇编代码还原之除法为非2的幂
一丶了解数学知识1.1 简介  在下面会有大量的数学知识来进行讲解. 当然如果你奔着如何还原.直接按照定式还原就行.不用纠结如何计算出来的
  但是你了解数学知识.从数学角度来看待优化.那么会可以了解其真正原理 本人数学也不好.但还是查阅很多资料.把基础数学
  罗列出来.一来是便与复习.二来是能看到基本的数学公式即可.
1.2 数学知识1.2.1 数学知识之代数与解方程  方程:有一个未知数.我们来解这个未知数那么叫做解方程
  例如:
12x + 3 = 64x + 5 = 17  解方程我们可以代入一个数进行去解.也可以直接做平衡解.
  意思就是 如果 等式的左边+ 那么我们就利用减法.两边都减去这个值. 如果是x 那么做相反运算也就是/ 反之亦然
  解:
123456789x + 3 = 6x +3-3= 6 - 3x = 3 4x + 5 = 174x + 5 - 5 = 17 - 54x = 124x / 4 = 12 / 4x = 31.2.2 简化表达式去括号  简化表达式分为 移除括号 交换结合定律 合并同类项 等
  移除括号. 看公式:
1234563(5 + 2) 展开的时候计算括号的值变成 3*5 + 3*2 = 15 + 6a(b + c) = ab + ac3(x + 6) = 3x + 3*6负数乘法去括号遵循 负正得负 负负得正的规律-3(a + -6) =-3a + -3*-6 = -3a + 18-3(a + 6) = -3a + -3*6 = -3a + -18  关于去括号的另一个特性
123 * (2 + 4) = 3 * 63 *(2 + 4) = 3*2 + 3*4  两种方式都是可以得出结果的.一般第一种就是加这个数的和.第二种就是拆分为乘数来.计算之后在相机啊.
  第二种用途用于不好算的数来用的
  例如:
122 * 204直接算算不出可以简化为2* 200 + 2*4 = 4081.2.3 简化表达式之交叉相乘  交叉相乘用于分数.可以帮助我们进行简化
  解决的是把一个分数变为表达式
  原理就是分子与分母相乘
  可以看到分子变了.而分母都变成了(12*3) 所以都是除同一个数
  所以可以去掉了.变成 8 3 + 12 2
  公式记为
1.2.4 简化表达式之合并同类项  如果看官方简介会看到一大堆名词解释.那么这里说一下自我的理解吧.
  同类项 就是这一类属于一项.优先把他们组合起来.
  例如:
  在这里 有xy就是同类项.所以可以优先组合起来.
  组合的时候我们可以再根据加法减法符号来组合同符合类别的
12(-xy + 5xy) + (-2xy - 4xy)+(3 - 7) == -2xy - 4也可以变成1.2.5 简化表达式之分数的加法简化  分数加法
  ​      分数的加法是有一条简单的规矩的.就是去分母.
  如何去分母之前也有说.就是让分母一致.然后直接计算分子
  我们可以看一下上面的倒数相乘去分母.就是一个很好的例子
  ​   
  公式为如上,也就是交叉相乘的结果
1#### 1.2.6 简化表达式之分数的减法简化  ​            分数减法同加法一样.之不管变成相减了
1.2.7 简化表达式之分数乘法  分数乘法
  分数乘法简化还是按照上乘上下乘下原则
1.2.8分数除法  分数除法要转变为分数乘法.具体原则就是 *分数的倒数来进行相乘
  其余按照分数乘法来做
二丶除法特殊汇编2.1 特殊定式汇编2.1.1高级代码与汇编对应  高级代码:
123456789101112131415int main(int argc, char* argv[]){    /*    除法    */   unsigned int NumberOne = 0;   unsigned int NumberTwo = 0;   scanf("%u",&NumberOne);   scanf("%u",&NumberTwo);   unsigned int Count1 = NumberOne / -6;   unsigned int Count2 = NumberTwo / 7;    printf("%d%d",Count2,Count1);    system("pause");    return 0;}  一个是无符号/-6 一个是/正数7
  看下汇编
1234567891011121314151617181920212223242526272829303132333435363738394041424344454647.text:00401000.text:00401000.text:00401000 ; int __cdecl main(int argc, const char **argv, const char **envp).text:00401000 _main         proc near               ; CODE XREF: start+AF↓p.text:00401000.text:00401000 var_8         = dword ptr -8.text:00401000 var_4         = dword ptr -4.text:00401000 argc            = dword ptr4.text:00401000 argv            = dword ptr8.text:00401000 envp            = dword ptr0Ch.text:00401000.text:00401000               sub   esp, 8.text:00401003               xor   eax, eax.text:00401005               mov   , eax.text:00401009               mov   , eax.text:0040100D               lea   eax, .text:00401011               push    eax.text:00401012               push    offset aU       ; "%u".text:00401017               call    _scanf.text:0040101C               lea   ecx, .text:00401020               push    ecx.text:00401021               push    offset aU       ; "%u".text:00401026               call    _scanf.text:0040102B               mov   ecx, .text:0040102F               mov   eax, 7.text:00401034               mul   ecx.text:00401036               sub   ecx, edx.text:00401038               mov   eax, 24924925h.text:0040103D               shr   ecx, 1.text:0040103F               add   ecx, edx.text:00401041               shr   ecx, 1Fh.text:00401044               push    ecx.text:00401045               mov   ecx, .text:00401049               mul   ecx.text:0040104B               sub   ecx, edx.text:0040104D               shr   ecx, 1.text:0040104F               add   ecx, edx.text:00401051               shr   ecx, 2.text:00401054               push    ecx.text:00401055               push    offset aDD      ; "%d%d".text:0040105A               call    _printf.text:0040105F               push    offset aPause   ; "pause".text:00401064               call    _system.text:00401069               xor   eax, eax.text:0040106B               add   esp, 28h.text:0040106E               retn.text:00402.1.2 核心代码反汇编还原  我们去掉流水线优化后的核心反汇编如下
123456789101112131415161718192021222324252627282930313233.text:00401000.text:00401000.text:00401000 ; int __cdecl main(int argc, const char **argv, const char **envp).text:00401000 _main         proc near               ; CODE XREF: start+AF↓p.text:00401000.text:00401000 var_8         = dword ptr -8.text:00401000 var_4         = dword ptr -4.text:00401000 argc            = dword ptr4.text:00401000 argv            = dword ptr8.text:00401000 envp            = dword ptr0Ch.text:00401000 .text:00401003               xor   eax, eax.text:00401005               mov   , eax.text:00401009               mov   , eax核心位置 /-6.text:0040102B               mov   ecx, .text:0040102F               mov   eax, 7.text:00401034               mul   ecx.text:00401036               sub   ecx, edx.text:0040103D               shr   ecx, 1.text:0040103F               add   ecx, edx.text:00401041               shr   ecx, 1Fh.text:00401044               push    ecx核心位置/7.text:00401038               mov   eax, 24924925h.text:00401045               mov   ecx, .text:00401049               mul   ecx.text:0040104B               sub   ecx, edx.text:0040104D               shr   ecx, 1.text:0040104F               add   ecx, edx.text:00401051               shr   ecx, 2.text:00401054               push    ecx  观看代码定式.我们发现了一个特点. 核心汇编代码都是 乘 减 移 加 移的指令
12345678.text:00401038               mov   eax, 24924925h.text:00401045               mov   ecx, .text:00401049               mul   ecx.text:0040104B               sub   ecx, edx.text:0040104D               shr   ecx, 1.text:0040104F               add   ecx, edx.text:00401051               shr   ecx, 2.text:00401054               push    ecx  如果你想要还原.记住代码定式
12345678.text:00401038               mov   eax, M.text:00401045               mov   ecx, 被除数.text:00401049               mul   ecx.text:0040104B               sub   ecx, edx.text:0040104D               shr   ecx, n.text:0040104F               add   ecx, edx.text:00401051               shr   ecx, n.text:00401054               push    ecx  利用除法转变为乘法的特性.我们首先统计 n值然后使用2的幂加上n值. 一般是2^(32 + n)
  注意这里是幂值想加
  如下
  然后统计M值
  这里的代码还原的公式为

[*]正数的还原手法
  比如我们要还原/7 我们可以代入公式
  设M = 24924925h10进制 = 613566757
  设n值 = 3进行幂想加后得出 2^35
  代入公式之后计算的结果向上取整
  得出结果为7 这个就是我们求的被除数. 所以这一整段代码我们可以还原为
1var_4 / 7
[*]负数的还原手法
  如果是负数一样代入公式.比如这里是/-6
  M = 7
  n = 1F +1 = 32
  代入公式得
  很明显这是一个很大的数.这个数放到计算器中可以看到是一个负数
  我们看16进制就可以看出这个是个负数,我们对其取反.然后转变为DWORD即可.
2.1.3 特殊汇编的除法原理  还记得我们上一讲的除法转变为乘法的例子吧
  简单例子如下
  那么这里其实本质还是用这个除法转变为乘法的公式.只不过有些许不同
  不同点在于C计算位置. 也就是计算M数的时候.如果n的取值大于32. 那么其结果会超过 4个字节整数的表达范围 所以要进行调整.
  调整为我减去2^32次方 然后最后的时候再加上
  比如下
  那么我们的除法就会随之改变.剩下的就是求出M怎么得出的
  在这里我们看下汇编表达形式.并且列出与之对应表达式 但是我们先看一下乘法的特性
2.1.4 x86乘法特性与x64乘法特性
[*]  x86乘法特性
  在x86下.乘法的乘积放在edx.eax中.但是这不是绝对.看如下

被乘数乘数乘积结果存放AL(Byte)reg/mem8AXAX(WORD)reg/mem16DX:AXEAXreg/mem32EDX:EAX  举例
123mov al,5hmov bl,10hmul bl         //ax == 0050,CF = 0  与之同理
123456.dataval1 WORD 2000hval2 WORD 0l00h.codemov ax, val1         ; AX = 2000hmul val2               ; DX:AX = 00200000h, CF = 1  4字节计算被乘数是4个字节
123mov eax, 12345hmov ebx, 1000hmul ebx                   ; EDX:EAX = 0000000012345000h, CF = 0
[*]  x64下的乘法特性
  64 位模式下,MUL 指令可以使用 64 位操作数。一个 64 位寄存器或内存操作数与 RAX 相乘,产生的 128 位乘积存放到 RDX:RAX 寄存器中。下例中,RAX 乘以 2,就是将 RAX 中的每一位都左移一位。RAX 的最高位溢出到 RDX 寄存器,使得 RDX 的值为 0000 0000 0000 0001h:
12345.datamultiplier QWORD 10h.codemov rax, OAABBBBCCCCDDDDhmul multiplier       ; RDX:RAX = 00000000000000000AABBBBCCCCDDDDOh
2.1.5 汇编等式还原  了解了乘法原理我们来看等式.根据我们的汇编产生的等式
1234567891011121314151617181920212223.text:00401038               mov   eax, 24924925h.text:00401045               mov   ecx, .text:00401049               mul   ecxeax = Mecx = 被除数M * ecx 结果放在 edx:eax中 .text:0040104B               sub   ecx, edx此条代码是让被除数 - M*ecx的高32位乘积.等价于 ecx - (M * ecx)/2^32 .text:0040104D               shr   ecx, 1然后整体又/2的一次方(ecx - (M * ecx)/2^32)/2^1.text:0040104F               add   ecx, edx最后又加上乘积的高位((ecx - (M * ecx)/2^32)/2) + (M * ecx)/2^32 .text:00401051               shr   ecx, 2最后整体又/2的2次方(((ecx - (M * ecx)/2^32)/2) + (M * ecx)/2^32)/2^2.text:00401054               push    ecx   最后使用乘积高位  最终我们以图示的方式来列出公式
  然后我们化简
  首先是第一段化简 也可以称作是简化 如果不明白看下上面的数学知识补充
  最后得出的公式 我们直接求解即可.
  2^35 / (2^32 + M) 就得出了最终结果
  比如我们的 /7 我们代入公式
12^35 / (2^32 + 24924925h) === 6.99999 向上取整 = 72.2 特殊汇编M大于0x80000000的加调整2.2.1 高级代码与反汇编1234567891011121314151617181920212223int main(int argc, char* argv[]){    /*    除法    */      int NumberOne = 0;      int NumberTwo = 0;       scanf("%u",&NumberOne);    scanf("%u",&NumberTwo);      int Count1 = NumberOne / 7;       printf("%d%d%d",Count1);    system("pause");   return 0;}  汇编对应代码
1234567891011121314151617181920212223242526272829303132333435363738.text:00401000 ; int __cdecl main(int argc, const char **argv, const char **envp).text:00401000 _main         proc near               ; CODE XREF: start+AF↓p.text:00401000.text:00401000 var_8         = dword ptr -8.text:00401000 var_4         = dword ptr -4.text:00401000 argc            = dword ptr4.text:00401000 argv            = dword ptr8.text:00401000 envp            = dword ptr0Ch.text:00401000.text:00401000               sub   esp, 8.text:00401003               xor   eax, eax.text:00401005               mov   , eax.text:00401009               mov   , eax.text:0040100D               lea   eax, .text:00401011               push    eax.text:00401012               push    offset aU       ; "%u".text:00401017               call    _scanf.text:0040101C               lea   ecx, .text:00401020               push    ecx.text:00401021               push    offset aU       ; "%u".text:00401026               call    _scanf.text:0040102B               mov   ecx, .text:0040102F               mov   eax, 92492493h.text:00401034               imul    ecx.text:00401036               add   edx, ecx.text:00401038               sar   edx, 2.text:0040103B               mov   eax, edx.text:0040103D               shr   eax, 1Fh.text:00401040               add   edx, eax.text:00401042               push    edx.text:00401043               push    offset aDDD   ; "%d%d%d".text:00401048               call    _printf.text:0040104D               push    offset aPause   ; "pause".text:00401052               call    _system.text:00401057               xor   eax, eax.text:00401059               add   esp, 24h.text:0040105C               retn.text:0040105C _main         endp  提取出核心汇编
123456789.text:0040102B               mov   ecx, .text:0040102F               mov   eax, 92492493h.text:00401034               imul    ecx.text:00401036               add   edx, ecx.text:00401038               sar   edx, 2.text:0040103B               mov   eax, edx.text:0040103D               shr   eax, 1Fh.text:00401040               add   edx, eax.text:00401042               push    edx2.2.2 代码定式还原  观看上面代码.发现跟我们除法转化为乘法的代码定式很像 唯一不同的就是在使用 imul 指令之后.后面不是移位而是紧接着是一个add指令
  其实这里的代码跟我们的特殊汇编第一种很相似. 这里的M数也很大. 原因是除法转换为乘法的时候做了调整.加了2^32次方
  这个定式等价于除法转化为乘法的定式
  直接使用这个定式进行还原即可.
12^34 / 2454267027 = 6.999... = 7  除法转化为乘法的代码定式为
  解方程得
2.2.3代码优化原理  编译器再计算M数的时候(2^n/b)是以无符号数来进行计算的.而代入除法转变为乘法的代码中.是以有符号进行处理的.有符号的最高位是代表符号位
  而无符号的最高位是数据位.所以如果你以无符号来进行计算.那么结果就会出错. 所以我们计算机中.如果(2^n/b)计算出的M数大于0x80000000
  最高位为1也就是负数的表现形式.那么实际参与除法转变为乘法的过程是以补码来计算的. 结果是以
  来进行计算的. 所以我们的除法转变为乘法的公式又变了.
  变成了
  这里的括号是求补码的意思 计算机中 2^n / b - 2^32次方是可以计算出来的
  所以根据我们的代码定式列出方程式
123456789.text:0040102B               mov   ecx, .text:0040102F               mov   eax, 92492493h.text:00401034               imul    ecx.text:00401036               add   edx, ecx.text:00401038               sar   edx, 2.text:0040103B               mov   eax, edx.text:0040103D               shr   eax, 1Fh.text:00401040               add   edx, eax.text:00401042               push    edx  在加法这里.直接使用edx想加. 而EXE是M与被除数计算出来的.是乘积的高位.所以这里的edx等价于是
  我们直接列出公式
  直接进行代码公式优化即可.
  这个公式等价于除法转变为乘法的公式 所以直接使用公式还原即可.
2.3 特殊汇编大于0x80000000无调整  当除数为负数且无调整的时候会出现这样的问题新的除法调整
2.3.1 高级代码与反汇编123456789101112131415int main(int argc, char* argv[]){    /*    除法    */      int NumberOne = 0;      int NumberTwo = 0;    scanf("%u",&NumberOne);    scanf("%u",&NumberTwo);    int Count1 = NumberOne / -5;    printf("%d",Count1);    system("pause");   return 0;}  核心汇编
12345678.text:0040102B               mov   ecx, .text:0040102F               mov   eax, 99999999h            大于0x8..没有进行调整.text:00401034               imul    ecx.text:00401036               sar   edx, 1.text:00401038               mov   eax, edx.text:0040103A               shr   eax, 1Fh.text:0040103D               add   edx, eax.text:0040103F               push edx2.3.2 代码定式还原  遇到上述指令.直接使用代码定式还原
  这里我们已知M 跟n值 直接代入公式即可.
  结果向上取整.但是我们结果要判别为负.
2.3.3 除法原理还原  首先我们先看一下除法转变为乘法的公式
  如果我们b为正数的时候.那么公式就是使用上面的公式. 如果为负数那么除法公式就变化了.变成了负数的方式求结果了
  如下:
  求 -C
  那么最终如果我们要求b(除数) 就是 2^n /(2^32 - M) 即可.
2.4 M小于0x80000000 的减调整  减调整对于我们特殊的定式汇编我们算的是加调整. M值是小于0x80000000 而且有add调整.说明是一个正数
  如果小于还是进行减调整.那么 我们要还原的除数还是为负数
2.4.1高级代码与反汇编  看下高级代码
1234567891011121314151617181920212223int main(int argc, char* argv[]){    /*    除法    */      int NumberOne = 0;      int NumberTwo = 0;       scanf("%u",&NumberOne);    scanf("%u",&NumberTwo);      int Count1 = NumberOne / -7;       printf("%d",Count1);    system("pause");   return 0;}  核心反汇编
123456789.text:0040102B               mov   ecx, .text:0040102F               mov   eax, 6DB6DB6Dh.text:00401034               imul    ecx.text:00401036               sub   edx, ecx                              减调整.text:00401038               sar   edx, 2.text:0040103B               mov   eax, edx.text:0040103D               shr   eax, 1Fh.text:00401040               add   edx, eax.text:00401042               push    edx2.4.2 代码公式还原  如果想要计算出上方的定式.那么我们还是使用
  进行还原即可.
  代入公式得
12^34 / (2^32 - 6DB6DB6Dh) = 6.99999...  结果向上取整.得出7 但是是负数所以得出是-7
2.4.3 除法优化原理  跟我们除数为 +7的代码公式相似.(2.2小结,M大于0x8000000) 只不过除数变成负数了.所以要对M数进行取负计算.
  公式如下:
  上面的公式是有符号为正数的公式.此时我们对我们的M取负数即可.
  设C为如下公式
  最终求解即可.
  使用
  进行还原即可.
三丶总结
[*]  M小于0x80000000
  如果M大于0x8... 且有加调整 那么除数为正数 使用 b = 2^n /b 还原即可
  如果M大于0x8   且没有调整那么除数为负数 使用 b = 2^n /(2^32 - M) 还原即可.

[*]  M大于0x80000000
  如果有减调整.那么除数为负数. 使用 b = 2^n/(2^32-M) 即可.
  如果加调整,且满足 乘 减 移 加 移 使用 b = 2^n/(2^32+M) 即可.

  除法的优化与还原资料. 参考自恩师 钱林松 出版的 <<C++反汇编与逆向分析技术揭秘>> 在此前提上加了自己的一些理解.以及定式还原的方式.
  最后感谢一下 编程技术版主KevinsBobo本书的公式资料在我写的时候有些许不理解.最后请教编程技术版主.然后熬夜做公式做还原得出的.
  还是那句话 高手复习. 新手学习

页: [1]
查看完整版本: 反汇编代码还原之特殊除法还原