DASCTF2024八月开学季 - clock
感谢 dbgbgtf 提供的复杂printf格式解释思路
文件属性
属性 | 值 |
---|---|
Arch | amd64 |
RELRO | Partial |
Canary | off |
NX | on |
PIE | off |
strip | no |
libc | 2.35-0ubuntu3.8 |
解题思路
程序一开始将堆区添加了可执行权限,并允许我们输入shellcode
随后主菜单中的display_current_time
给了可以控制的format_and_print
,我们可以控制前三个参数。
跟进去一看,vsnprintf
是什么函数?
vsnprintf
与va_list
vsnprintf
是"printf to string with max n chars in raw va_list"的意思,va_list
是什么?
通过gdb打印它的结构,看不懂;在glibc中找定义,找不到;在网上找文章,没有具体信息;
最后发现它是由gcc实现的。正当我放弃时,想到了pwndbg,结果发现pwndbg已经做好了解析功能
图中gp_offset
指向的参数就是第一个参数,reg_save_area
用完了,overflow_arg_area
继续,
这也是各种printf
的内部实现,不难看出,从第 6 个参数开始从栈上访问
可以发现,第二个参数来自堆上,而堆又是可执行的;第三个参数来自栈上,因此可以写指针,
然后利用$
来访问。注意到在format_and_print
函数后跟了puts
, 并且程序没有开PIE与只读GOT,
因此可以尝试覆盖之。如果能覆盖成堆地址就好了,直接跳转过去执行我输入的代码。其中的秘诀就是——%*c
。
*
——取宽度格式化修饰符
*
在printf中是一个格式化修饰符,意味着将当前参数作为int
读入并视为宽度,
例如printf("%*d", -5, 777)
就会在内部被解释为"%-5d"
,输出777
;
*
还可以使用positional arg,例如printf("%c%*4$d", '>', 1, 2, 3)
就会输出> 1
。
注意,positional arg会使输出变得“不合直觉”,在上例中,4$
应当作用在d
上,
然而实际上却作用在了*
上,输出了" 1"。类似的,printf("%3$*d", 3, 2, 1)
输出 1
;
printf("%3$*2$d", 3, 2, 1)
输出 1
。以下是一种解释。具体的代码请参阅printf-parsemb
。
相关代码
此外,*
取参数的值时,固定取int
,当取到的值为负数时,会自动做相反数运算,并且打开左对齐输出,
在后文中会提到,这是一个对我们在利用时不利的特性。
1 | /* Get width from argument. */ |
现在我们知道,我们访问的第一个参数是刚写入完内容的name
堆地址,第二个参数是pwd
栈地址,
并且第6个参数处就是我们写入的内容。如果我们能把堆地址写到puts@got
中,
那么puts
执行时就会跳转到我们在堆上输入的数据处。此时*
参数就派上用场了。
使用"%*c%6$lln"
作为格式输入,vsnprintf
就会将第一个堆地址作为宽度,打印第二个字符,
然后根据写过的字符数,将其写入到第六个参数,puts@got
中。
巧合
由于程序没开PIE,因此堆地址刚好占4个字节,由于*
取的类型为int
,所以如果开了PIE,
堆地址变成了6个字节,这个方法就废了
此外,puts@got
原先已经链接了puts@libc
,其中存放了6个字节的数据,
需要通过lln
清空之前的数据,只保留堆地址这4个字节
这样以来,我们只需要在申请的堆块上写上打开shell的shellcode,我们就能成功拿shell。
最后的payload非常短,我猜是非预期
EXPLOIT
1 | from pwn import * |
*
修饰符的妙用
这里有一篇文章,
讲了如何借助*
进行进一步利用。简而言之,如果有libc的指针,
并且有现成的指针存储了堆之上,栈之下的地址,那么就可以先从现有的libc指针中使用*
,
写libc & 0xffffffff
个字节,然后可以再跟一个%?c
来做加法,把写过的字节调一下,
然后再使用%?$n
就可以把调过偏移的数字写入你想要写的指针中(堆之上,栈之下的地址的高2字节,
即0x7fff
这个部分,基本都一样,因此可以直接利用)
基于我本机(Arch Linux, GLIBC_2.39)的libc.so.6,我收集了一系列在system
之前的符号,
可以在当前目录下的SymbolsBeforeSystem.txt中查看
但是,由上面的源码可见,当libc & 0x80000000 != 0
时,*
取到的就是一个负数,
并会将其取相反数,例如对0x7ffff7c00000
取就会变成-(0x7ffff7c00000 & 0xffffffff)
,
即0x8400000
,这显然与我们想写的0xf7c00000
产生了偏差。在ASLR开启的情况下,
libc被int截断后的最高位为0的概率是1/2,因此我们通过这种方式能写正确字节的概率也是1/2。
写这么多字节为什么连接没有被关断?
容器一般会有限制,如cpu时间,占用的资源等,如果一次性打印了大量的字符, 则很有可能导致连接的关断。然而,上面的例子中,写入堆地址同样是一个很大的值,却能顺利打通, 这是怎么回事呢?
仔细观察函数vsnprintf
属于sprintf
家族,实际上,大量空白字符并没有输出到标准输出流中,
实际上只做了字符串写入操作;而且还限定了长度,防止越界写。那么内部实际在写入完有效的字符串后,
会使用一个额外的,“丢弃的”缓冲区来处理剩余未写入完的垃圾字符,如下图所示
在上图中,buf.base.write_base
本来是指向要写入的字符串(0x7fffffffddb0)开始的,
当字符串写入达到长度限制后,write_base
就指向了结构体内的discard
继续写入。
gdb跟踪查看源代码,当有大量字符溢出时,会反复使用memset
填充discard
,
而这个行为实际上并不经过网络传输,因此不会导致连接关断。
相关代码
written
有误?
在上述结构体中,有written
字段,然而,如果payload比较短,我发现written
明明是0,
但是使用%n
时仍然写入了正确的数字。例如"%c%20c%n"
在运行到%n
时,
结构体中的written
仍然是0。实际上,printf正确地将21写入了预期的指针中,
查询源码发现统计"%n"前已写入的字符是written + (write_ptr - write_base)
,因此没有问题。
相关代码
实际使用*
时,除了可以用在vsnprintf
& snprintf
,还可以用在fprintf
& dprintf
,
如写入的文件是/dev/null
,这同样不会向网络传输字符。总而言之,只要空白字符不打印出来,
就可以利用。
printf
函数分配了堆块?
当我测试时,printf会分配堆块,其调用链是
__printf_buffer_do_flush -> __printf_buffer_flush_to_file -> _IO_new_file_xsputn -> _IO_new_file_overflow -> __GI__IO_doallocbuf -> __GI__IO_file_doallocate -> malloc
,
printf确实会分配堆块。然而,看了pwn.college后发现只要setbuf(stdout, NULL)
就不会再分配缓冲区了。
看来这行代码一方面实现了即时刷新缓冲区,另一方面也避免了出乎意料的堆块分配。
参考
- 标题: DASCTF2024八月开学季 - clock
- 作者: RocketDev
- 创建于 : 2024-09-05 00:15:00
- 更新于 : 2024-09-27 00:12:00
- 链接: https://rocketma.dev/2024/09/04/clock/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。