OpenWrt项目中Realtek RTL838x设备的异常重启问题分析

2025-05-09 14:02:09作者：胡易黎Nicole

This repository is a mirror of https://git.openwrt.org/openwrt/openwrt.git It is for reference only and is not active for check-ins. We will continue to accept Pull Requests here. They will be merged via staging trees then into openwrt.git.

项目地址：https://gitcode.com/GitHub_Trending/op/openwrt

问题背景

在OpenWrt 24.10版本中，部分使用Realtek RTL838x系列交换芯片的网络设备出现了异常重启现象。受影响的主要设备包括HPE 1920系列（JG924A、JG926A）和Zyxel GS1900系列（GS1900-8）交换机。该问题最早出现在24.10-rc2版本中，表现为设备在正常运行数天至数周后突然重启，且没有明显的触发条件或错误日志。

问题现象

根据用户报告，设备会在以下情况下发生异常重启：

设备运行数天至数周后突然重启
重启前系统负载、网络流量和内存使用均处于正常水平
控制台输出中仅显示"^@"字符，随后直接进入BootWare界面
问题在23.05.5版本中未出现，但在24.10版本中重现

技术分析

硬件架构特点

Realtek RTL838x系列交换芯片采用了一种独特的设计：

使用外部看门狗电路而非SoC内置看门狗
系统LED控制外设复用为GPIO0引脚
设备树配置中通过pinctrl属性禁用系统LED外设，使该引脚可用于看门狗控制

可能原因分析

看门狗超时问题：
- 外部看门狗需要定期"喂狗"以防止超时重启
- 系统负载过高可能导致喂狗不及时
- 但用户报告显示重启时系统负载正常
系统LED外设配置：
- 设备树中禁用系统LED外设可能导致看门狗控制失效
- 保留系统LED外设可使引脚自动产生4Hz脉冲，满足看门狗需求
- 但这会失去看门狗的实际监控功能
GPIO去抖动问题：
- 类似其他设备的复位键误触发问题
- 但控制台未显示"REBOOT"日志，排除此可能性
内核调度问题：
- 24.10版本内核调度器变更可能导致关键任务延迟
- 影响看门狗喂狗任务的及时执行