我在这个上运行了 gcc -S :
int main()
{
printf ("Hello world!");
}
.file "test.c"
.section .rodata
.LC0:
.string "Hello world!"
.text
.globl main
.type main, @function
main:
leal 4(%esp), %ecx
andl $-16, %esp
pushl -4(%ecx)
pushl %ebp
movl %esp, %ebp
pushl %ecx
subl $20, %esp
movl $.LC0, (%esp)
call printf
addl $20, %esp
popl %ecx
popl %ebp
leal -4(%ecx), %esp
ret
.size main, .-main
.ident "GCC: (GNU) 4.3.0 20080428 (Red Hat 4.3.0-8)"
.section .note.GNU-stack,"",@progbits
最佳答案
这是怎么回事:
.file "test.c"
.section .rodata
.LC0:
.string "Hello world!"
.text
.globl main
.type main, @function
main:
leal 4(%esp), %ecx
%ecx
值 4+%esp
( %esp
是堆栈指针)。 andl $-16, %esp
%esp
稍作修改,使其成为 16 的倍数。 对于某些数据类型(对应 C 的 double
和 long double
的浮点格式),内存访问在地址为 16 的倍数时性能更好。这在这里并不是真正需要的,但是当在没有优化标志(-O2
...)的情况下使用时,编译器往往会产生相当多的通用无用代码(即在某些情况下可能有用但在这里没有用的代码)。 pushl -4(%ecx)
-4(%ecx)
处的单词是在 andl
之前位于堆栈顶部的单词.代码检索那个词(顺便说一下,它应该是返回地址)并再次推送它。这种模拟从具有 16 字节对齐堆栈的函数调用将获得的内容。我的猜测是这个 push
是参数复制序列的残余。由于函数已经调整了堆栈指针,它必须复制函数参数,这些参数可以通过堆栈指针的旧值访问。这里没有参数,除了函数返回地址。请注意,不会使用这个词(同样,这是没有优化的代码)。 pushl %ebp
movl %esp, %ebp
%ebp
(因为我们要修改它),然后设置%ebp
指向堆栈帧。此后,%ebp
将用于访问函数参数,使得 %esp
又免费了。 (是的,没有参数,所以这对那个函数没用。) pushl %ecx
%ecx
(我们将在函数退出时需要它,以将 %esp
恢复为它在 andl
之前的值)。 subl $20, %esp
printf()
的参数。 (这是矫枉过正,因为只有一个参数,它将使用 4 个字节 [这是一个指针])。 movl $.LC0, (%esp)
call printf
printf()
(即我们确保 %esp
指向包含参数的单词,这里是 $.LC0
,它是rodata 部分中常量字符串的地址)。然后我们打电话printf()
. addl $20, %esp
printf()
返回,我们删除为参数分配的空间。此 addl
取消什么 subl
上面做了。 popl %ecx
%ecx
(推到上面); printf()
可能已经修改了它(调用约定描述了函数可以修改哪个寄存器而不在退出时恢复它们;%ecx
就是这样一个寄存器)。 popl %ebp
%ebp
(对应于上面的 pushl %ebp
)。 leal -4(%ecx), %esp
%esp
到它的初始值。这个操作码的作用是存储在%esp
值 %ecx-4
. %ecx
在第一个函数操作码中设置。这将取消对 %esp
的任何更改,包括 andl
. ret
.size main, .-main
main()
的大小功能:在汇编过程中的任何时候,“.
”是“我们现在添加东西的地址”的别名。如果在此处添加另一条指令,它将到达“.
”指定的地址。因此,这里的“.-main
”是函数main()
的代码的确切大小。 . .size
指令指示汇编器将该信息写入目标文件。 .ident "GCC: (GNU) 4.3.0 20080428 (Red Hat 4.3.0-8)"
.section .note.GNU-stack,"",@progbits
https://stackoverflow.com/questions/5325326/