Open5GS AMF状态机处理PDU会话ID冲突导致的崩溃问题分析

2025-07-05 12:44:15作者：翟萌耘Ralph

问题背景

在5G核心网Open5GS项目中，AMF(接入和移动性管理功能)作为核心网元之一，负责处理UE(用户设备)的注册、会话管理等关键流程。近期发现一个与AMF状态机处理相关的重要缺陷：当单个UE频繁进行连接和断开操作时，如果出现PDU会话ID冲突情况，可能导致AMF服务崩溃。

问题现象

在实际测试环境中，使用UERANSIM模拟器对单个UE进行反复连接和断开操作时，AMF会在5-10分钟后出现崩溃。崩溃发生时，AMF正在处理NSMF-PDUSESSION服务的更新请求，具体表现为在处理DUPLICATED_PDU_SESSION_ID场景时出现断言失败。

技术分析

根本原因

通过对日志和代码的分析，可以确定问题的根本原因在于AMF状态机在处理PDU会话ID冲突时存在逻辑缺陷：

当UE快速重复进行连接/断开操作时，可能产生相同的PDU会话ID
AMF在检测到重复ID时，尝试更新SM上下文但未正确处理资源组件
在ogs_uridup函数中，对资源组件的断言检查失败导致崩溃

关键代码路径

问题出现在以下处理流程中：

UE发起PDU会话建立请求
AMF检测到重复的PDU会话ID(DUPLICATED_PDU_SESSION_ID)
AMF尝试通过NSMF服务更新SM上下文
在构建URI时，资源组件为空导致断言失败

影响范围

该问题主要影响：

使用频繁连接/断开场景的UE
存在PDU会话ID冲突的情况
AMF服务的稳定性

解决方案

项目维护团队已经修复了这个问题，主要修改包括：

完善了AMF状态机对PDU会话ID冲突的处理逻辑
增加了对资源组件的有效性检查
优化了SM上下文更新流程的异常处理

验证结果

修复后经过测试验证：

连续运行测试脚本5分钟以上未再出现崩溃
PDU会话ID冲突场景得到正确处理
AMF服务稳定性显著提升

技术建议

对于5G核心网开发人员，建议：

在状态机设计中充分考虑异常场景处理
对关键资源访问增加有效性检查
针对频繁连接/断开场景进行专项测试
关注PDU会话管理中的ID冲突问题

该问题的修复提升了Open5GS在复杂场景下的稳定性，为5G核心网的可靠性提供了更好的保障。

open5gs

Open5GS is a C-language Open Source implementation for 5G Core and EPC, i.e. the core network of LTE/NR network (Release-17)

项目地址：https://gitcode.com/gh_mirrors/op/open5gs

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

leetcode

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.37 K

781