Asterisk项目内存访问错误导致崩溃问题分析与解决方案

2025-06-30 04:31:07作者：乔或婵

问题现象

在Asterisk 20.9.2版本中，运行在AlmaLinux 8.9环境下的系统会不定期出现崩溃现象。崩溃发生时，系统日志显示Asterisk在尝试访问内存地址0x650072005f0065时失败，该地址明显是一个无效的内存地址。崩溃后，无论重启Asterisk服务还是重启整个服务器，都无法使服务恢复正常运行。

崩溃分析

通过gdb回溯分析，可以确定崩溃发生在PJSIP模块处理接收到的SIP消息时。具体调用栈显示：

在ast_strlen_zero()函数中尝试访问无效内存地址
调用链经过PJSIP分发器(distributor)和传输层处理
最终在IO队列的事件处理线程中触发崩溃

这种崩溃模式表明系统在处理网络数据包时出现了内存访问越界问题。特别值得注意的是，崩溃后唯一能让系统恢复工作的方法是重新编译安装Asterisk，这暗示着可能存在模块版本不匹配或内存损坏问题。

根本原因

深入分析后发现，系统环境中存在两个Asterisk模块目录：

/usr/lib64/asterisk/modules - 当前使用的正确目录
/usr/lib/asterisk/modules - 残留的旧版本模块目录

虽然配置文件中明确指定了astmoddir指向/usr/lib64/asterisk/modules，但系统可能在某些情况下错误加载了旧目录中的模块。这种模块混用会导致内存管理不一致，最终引发内存访问错误。

解决方案

清理旧模块目录：完全移除/usr/lib/asterisk/modules目录及其内容，确保系统不会加载旧版本模块。
验证模块一致性：在系统正常运行时记录模块文件的MD5校验值和时间戳：
```
md5sum /usr/lib64/asterisk/modules/*
ls -alth /usr/lib64/asterisk/modules/*
```
监控模块变化：在崩溃发生后，再次检查上述信息，确认是否有模块被意外修改或替换。
配置确认：确保/etc/asterisk/asterisk.conf中的astmoddir配置正确指向当前使用的模块目录。