曲水 发表于 2022-7-27 09:27:36

如何找出内存错误程序


问题
​18-Feb-2014 15:48:45] WARNING: child 11274 exited on signal 11 (SIGSEGV) after 0.089068 seconds from start
显然11274进程运行过程中遇到了段错误导致进程异常退出了。继续追查发现是php的hsf扩展在启动初始化的时候遇到内存问题导致段错误。
沧老师这个段错误进程你怎么定位到是hsf扩展的问题?

分析过程
​发现段错误:
日志中的信息表明,进程号为11274的进程由于收到SIGSEGV信号而退出了。收到这个信号的时候,程序是可以生成core文件的。不过通过日志我们可以知道进程11274退出时没有生成core文件。因为在php-fpm的日志中,如果退出时生成了core文件,日志中会有“SIGSEGV - core dumped”字样。如:
​ WARNING: child 15845 exited on signal 11 (SIGSEGV - core dumped) after 1.051001 seconds from start
​生成core文件:
为啥没生成core文件?是因为我们的系统做了限制。执行如下命令可以查看限制情况:

可以看出,系统对于core文件大小默认限制是0.也就是说不能生成core文件。可以通过以下命令设置大小。
$ulimit -c unlimited
通过命令,我们就把系统对于core文件的大小限制去除了。
服务器问题请联系tg@liushangqushui1


设置完后,重启了php-fpm 进程。剩下的事情,就是坐等core文件生成了。
​第二天,查看php-fpm日志,发现了如下记录:
WARNING: child 15845 exited on signal 11 (SIGSEGV - core dumped) after 1.051001 seconds from start
WARNING: child 17803 exited on signal 11 (SIGSEGV - core dumped) after 0.927973 seconds from start
WARNING: child 23491 exited on signal 11 (SIGSEGV - core dumped) after 0.798308 seconds from start
说明,core文件已经生成。
gdb分析core文件:
既然core文件生成了,现在该gdb上场了。通过如下命令查看程序退出时的栈信息。

页: [1]
查看完整版本: 如何找出内存错误程序