全球看点：手把手教你使用 GNU 调试器

2022-07-22 17:57:32来源：Linux中国

如果你是一个程序员，想在你的软件增加某些功能，你首先考虑实现它的方法：例如写一个方法、定义一个类，或者创建新的数据类型。然后你用编译器或解释器可以理解的编程语言来实现这个功能。但是，如果你觉得你所有代码都正确，但是编译器或解释器依然无法理解你的指令怎么办？如果软件大多数情况下都运行良好，但是在某些环境下出现缺陷怎么办？这种情况下，你得知道如何正确使用调试器找到问题的根源。

GNU 调试器GNU Project Debugger（GDB）是一个发现项目缺陷的强大工具。它通过追踪程序运行过程中发生了什么来帮助你发现程序错误或崩溃的原因。（LCTT 校注：GDB 全程是“GNU Project Debugger”，即 “GNU 项目调试器”，但是通常我们简称为“GNU 调试器”）

本文是 GDB 基本用法的实践教程。请跟随示例，打开命令行并克隆此仓库：

(资料图片)

git clone https://github.com/hANSIc99/core_dump_example.git

快捷方式

GDB 的每条命令都可以缩短。例如：显示设定的断点的info break命令可以被缩短为i break。你可能在其他地方看到过这种缩写，但在本文中，为了清晰展现使用的函数，我将所写出整个命令。

命令行参数

你可以将 GDB 附加到每个可执行文件。进入你克隆的仓库（core_dump_example），运行make进行编译。你现在能看到一个名为coredump的可执行文件。（更多信息，请参考我的文章《创建和调试 Linux 的转储文件》。）

要将 GDB 附加到这个可执行文件，请输入:gdb coredump。

你的输出应如下所示：

gdb coredump output

返回结果显示没有找到调试符号。

调试信息是目标文件object file（可执行文件）的组成部分，调试信息包括数据类型、函数签名、源代码和操作码之间的关系。此时，你有两种选择：

继续调试汇编代码（参见下文“无符号调试”）使用调试信息进行编译，参见下一节内容使用调试信息进行编译

为了在二进制文件中包含调试信息，你必须重新编译。打开Makefile，删除第 9 行的注释标签（#）后重新编译：

CFLAGS =-Wall -Werror -std=c++11 -g

-g告诉编译器包含调试信息。运行make clean，接着运行make，然后再次调用 GDB。你得到如下输出后就可以调试代码了：

GDB output with symbols

新增的调试信息会增加可执行文件的大小。在这种情况下，执行文件增加了 2.5 倍（从 26,088 字节增加到 65,480 字节）。

输入run -c1，使用-c1开关启动程序。当程序运行到达State_4时将崩溃：

gdb output crash on c1 switch

你可以检索有关程序的其他信息，info source命令提供了当前文件的信息：

gdb info source output

101 行代码语言: C++编译器（版本、调优、架构、调试标志、语言标准）调试格式：DWARF 2没有预处理器宏指令（使用 GCC 编译时，宏仅在使用 -g3 标志编译时可用）。

info shared命令打印了动态库列表机器在虚拟地址空间的地址，它们在启动时被加载到该地址，以便程序运行：

gdb info shared output

如果你想了解 Linux 中的库处理方式，请参见我的文章在 Linux 中如何处理动态库和静态库。

调试程序

你可能已经注意到，你可以在 GDB 中使用run命令启动程序。run命令接受命令行参数，就像从控制台启动程序一样。-c1开关会导致程序在第 4 阶段崩溃。要从头开始运行程序，你不用退出 GDB，只需再次运行run命令。如果没有-c1开关，程序将陷入死循环，你必须使用Ctrl+C来结束死循环。

gdb output stopped by sigint

你也可以一步一步运行程序。在 C/C++ 中，入口是main函数。使用list main命令打开显示main函数的部分源代码：

gdb output list main

main函数在第 33 行，因此可以输入break 33在 33 行添加断点:

gdb output breakpoint added

输入run运行程序。正如预期的那样，程序在main函数处停止。输入layout src并排查看源代码：

gdb output break at main

你现在处于 GDB 的文本用户界面（TUI）模式。可以使用键盘向上和向下箭头键滚动查看源代码。

GDB 高亮显示当前执行行。你可以输入next（n）命令逐行执行命令。如果你没有指定新的命令，GBD 会执行上一条命令。要逐行运行代码，只需按回车键。

有时，你会发现文本的输出有点显示不正常：

gdb output corrupted

如果发生这种情况，请按Ctrl+L重置屏幕。

使用Ctrl+X+A可以随时进入和退出 TUI 模式。你可以在手册中找到其他的键绑定。

要退出 GDB，只需输入quit。

设置监察点

这个示例程序的核心是一个在无限循环中运行的状态机。n_state变量枚举了当前所有状态：

while(true){            switch(n_state){            case State_1:                    std::cout << "State_1 reached" << std::flush;                    n_state = State_2;                    break;            case State_2:                    std::cout << "State_2 reached" << std::flush;                    n_state = State_3;                    break;                        (.....)                        }    }

如果你希望当n_state的值为State_5时停止程序。为此，请在main函数处停止程序并为n_state设置监察点：

watch n_state == State_5

只有当所需的变量在当前上下文中可用时，使用变量名设置监察点才有效。

当你输入continue继续运行程序时，你会得到如下输出：

gdb output stop on watchpoint_1

如果你继续运行程序，当监察点表达式评估为false时 GDB 将停止：

gdb output stop on watchpoint_2

你可以为一般的值变化、特定的值、读取或写入时来设置监察点。

更改断点和监察点

输入info watchpoints打印先前设置的监察点列表：

gdb output info watchpoints

删除断点和监察点

如你所见，监察点就是数字。要删除特定的监察点，请先输入delete后输入监察点的编号。例如，我的监察点编号为 2；要删除此监察点，输入delete 2。

注意：如果你使用delete而没有指定数字，所有监察点和断点将被删除。

这同样适用于断点。在下面的截屏中，我添加了几个断点，输入info breakpoint打印断点列表：

gdb output info breakpoints

要删除单个断点，请先输入delete后输入断点的编号。另外一种方式：你可以通过指定断点的行号来删除断点。例如，clear 78命令将删除第 78 行设置的断点号 7。

禁用或启用断点和监察点

除了删除断点或监察点之外，你可以通过输入disable，后输入编号禁用断点或监察点。在下文中，断点 3 和 4 被禁用，并在代码窗口中用减号标记：

disabled breakpoints

也可以通过输入类似disable 2 - 4修改某个范围内的断点或监察点。如果要重新激活这些点，请输入enable，然后输入它们的编号。

条件断点

首先，输入delete删除所有断点和监察点。你仍然想使程序停在main函数处，如果你不想指定行号，可以通过直接指明该函数来添加断点。输入break main从而在main函数处添加断点。

输入run从头开始运行程序，程序将在main函数处停止。

main函数包括变量n_state_3_count，当状态机达到状态 3 时，该变量会递增。

基于n_state_3_count的值添加一个条件断点，请输入：

break 54 if n_state_3_count == 3

Set conditional breakpoint

继续运行程序。程序将在第 54 行停止之前运行状态机 3 次。要查看n_state_3_count的值，请输入：

print n_state_3_count

print variable

使断点成为条件断点

你也可以使现有断点成为条件断点。用clear 54命令删除最近添加的断点，并通过输入break 54命令添加一个简单的断点。你可以输入以下内容使此断点成为条件断点：

condition 3 n_state_3_count == 9

3指的是断点编号。

modify breakpoint

在其他源文件中设置断点

如果你的程序由多个源文件组成，你可以在行号前指定文件名来设置断点，例如，break main. cpp:54。

捕捉点

除了断点和监察点之外，你还可以设置捕获点。捕获点适用于执行系统调用、加载共享库或引发异常等事件。

要捕获用于写入 STDOUT 的write系统调用，请输入：

catch syscall write

catch syscall write output

每当程序写入控制台输出时，GDB 将中断执行。

在手册中，你可以找到一整章关于断点、监察点和捕捉点的内容。

评估和操作符号

用print命令可以打印变量的值。一般语法是print <表达式> <值>。修改变量的值，请输入：

set variable  .

在下面的截屏中，我将变量n_state_3_count的值设为123。

catch syscall write output

/x表达式以十六进制打印值；使用&运算符，你可以打印虚拟地址空间内的地址。

如果你不确定某个符号的数据类型，可以使用whatis来查明。

whatis output

如果你要列出main函数范围内可用的所有变量，请输入info scope main:

info scope main output

DW_OP_fbreg值是指基于当前子程序的堆栈偏移量。

或者，如果你已经在一个函数中并且想要列出当前堆栈帧上的所有变量，你可以使用info locals:

info locals output

查看手册以了解更多检查符号的内容。

附加调试到一个正在运行的进程

gdb attach <进程 ID>命令允许你通过指定进程 ID（PID）附加到一个已经在运行的进程进行调试。幸运的是，coredump程序将其当前 PID 打印到屏幕上，因此你不必使用ps或top手动查找 PID。

启动coredump应用程序的一个实例：

./coredump

coredump application

操作系统显示 PID 为2849。打开一个单独的控制台窗口，移动到coredump应用程序的根目录，然后用 GDB 附加到该进程进行调试：

gdb attach 2849

attach GDB to coredump

当你用 GDB 附加到进程时，GDB 会立即停止进程运行。输入layout src和backtrace来检查调用堆栈：

layout src and backtrace output

输出显示在main.cpp第 92 行调用std::this_thread::sleep_for<...>(. ..)函数时进程中断。

只要你退出 GDB，该进程将继续运行。

你可以在 GDB 手册中找到有关附加调试正在运行的进程的更多信息。

在堆栈中移动

在命令窗口，输入up两次可以在堆栈中向上移动到main.cpp:

moving up the stack to main.cpp

通常，编译器将为每个函数或方法创建一个子程序。每个子程序都有自己的栈帧，所以在栈帧中向上移动意味着在调用栈中向上移动。

你可以在手册中找到有关堆栈计算的更多信息。

指定源文件

当调试一个已经在运行的进程时，GDB 将在当前工作目录中寻找源文件。你也可以使用目录命令手动指定源目录。

评估转储文件

阅读创建和调试 Linux 的转储文件了解有关此主题的信息。

参考文章太长，简单来说就是：

假设你使用的是最新版本的 Fedora使用-c1开关调用 coredump：coredump -c1使用 GDB 加载最新的转储文件：coredumpctl debug打开 TUI 模式并输入layout src

coredump output

backtrace的输出显示崩溃发生在距离main.cpp五个栈帧之外。回车直接跳转到main.cpp中的错误代码行：

up 5 output

看源码发现程序试图释放一个内存管理函数没有返回的指针。这会导致未定义的行为并引起SIGABRT。

无符号调试

如果没有源代码，调试就会变得非常困难。当我在尝试解决逆向工程的挑战时，我第一次体验到了这一点。了解一些汇编语言的知识会很有用。

我们用例子看看它是如何运行的。

找到根目录，打开Makefile，然后像下面一样编辑第 9 行：

CFLAGS =-Wall -Werror -std=c++11 #-g

要重新编译程序，先运行make clean，再运行make，最后启动 GDB。该程序不再有任何调试符号来引导源代码的走向。

no debugging symbols

info file命令显示二进制文件的内存区域和入口点：

info file output

.text区段始终从入口点开始，其中包含实际的操作码。要在入口点添加断点，输入break *0x401110然后输入run开始运行程序：

breakpoint at the entry point

要在某个地址设置断点，使用取消引用运算符*来指定地址。

选择反汇编程序风格

在深入研究汇编之前，你可以选择要使用的汇编风格。 GDB 默认是 AT&T，但我更喜欢 Intel 语法。变更风格如下：

changing assembly flavor

现在输入layout asm调出汇编代码窗口，输入layout reg调出寄存器窗口。你现在应该看到如下输出：

set disassembly-flavor intel

layout asm and layout reg output

保存配置文件

尽管你已经输入了许多命令，但实际上还没有开始调试。如果你正在大量调试应用程序或尝试解决逆向工程的难题，则将 GDB 特定设置保存在文件中会很有用。

该项目的 GitHub 存储库中的gdbinit配置文件包含最近使用的命令：

set disassembly-flavor intel    set write on    break *0x401110    run -c2    layout asm    layout reg

set write on命令使你能够在程序运行期间修改二进制文件。

退出 GDB 并使用配置文件重新启动 GDB ：gdb -x gdbinit coredump。

阅读指令

应用c2开关后，程序将崩溃。程序在入口函数处停止，因此你必须写入continue才能继续运行：

continuing execution after crash

idiv指令进行整数除法运算：RAX寄存器中为被除数，指定参数为除数。商被加载到RAX寄存器中，余数被加载到RDX中。

从寄存器角度，你可以看到RAX包含5，因此你必须找出存储堆栈中位置为rbp-0x4的值。

读取内存

要读取原始内存内容，你必须指定比读取符号更多的参数。在汇编输出中向上滚动一点，可以看到堆栈的划分：

stack division output

你最感兴趣的应该是rbp-0x4的值，因为它是idiv的存储参数。你可以从截图中看到rbp-0x8位置的下一个变量，所以rbp-0x4位置的变量是 4 字节宽。

在 GDB 中，你可以使用x命令查看任何内存内容：

x/< 可选参数n、f、u> < 内存地址addr>

可选参数：

n：单元大小的重复计数（默认值：1）f：格式说明符，如printfu：单元大小b：字节h：半字（2 个字节）w: 字（4 个字节）（默认）g: 双字（8 个字节）

要打印rbp-0x4的值，请输入x/u $rbp-4:

print value

如果你能记住这种模式，则可以直接查看内存。参见手册中的查看内存部分。

操作汇编

子程序zeroDivide()发生运算异常。当你用向上箭头键向上滚动一点时，你会找到下面信息：

0x401211 <_Z10zeroDividev>              push   rbp    0x401212 <_Z10zeroDividev+1>            mov    rbp,rsp

这被称为函数前言：

调用函数的基指针（rbp）存放在栈上栈指针（rsp）的值被加载到基指针（rbp）

完全跳过这个子程序。你可以使用backtrace查看调用堆栈。在main函数之前只有一个堆栈帧，所以你可以用一次up回到main:

Callstack assembly

在你的main函数中，你会找到下面信息:

0x401431      cmp    BYTE PTR [rbp-0x12],0x0    0x401435      je     0x40145f     0x401437      call   0x401211<_Z10zeroDividev>

子程序zeroDivide()仅在jump equal (je)为true时进入。你可以轻松地将其替换为jump-not-equal (jne)指令，该指令的操作码为0x75（假设你使用的是 x86/64 架构；其他架构上的操作码不同）。输入run重新启动程序。当程序在入口函数处停止时，设置操作码：