Janet语言中错误堆栈丢失问题的分析与解决

2025-06-18 11:58:52作者：范靓好Udolf

问题背景

在Janet语言开发过程中，当程序在退出时处理标准输入数据时，可能会遇到一个棘手的问题：错误堆栈信息在程序终止过程中丢失。具体表现为当执行类似(json/decode (file/read stdin :line))这样的代码时，如果标准输入关闭（返回nil），程序会抛出错误但无法显示完整的堆栈跟踪信息。

问题现象

当Janet脚本退出时，(file/read stdin :line)会返回nil。此时如果直接将这个nil值传递给json/decode函数，会导致如下错误：

error: bad slot #0, expected string, symbol, keyword or buffer, got nil

但令人困扰的是，这个错误往往不会显示完整的调用堆栈，使得调试变得异常困难。

问题根源分析

经过深入分析，这个问题实际上是一个复杂的竞态条件问题，涉及多个因素：

多线程环境：当程序中有多个线程运行时（特别是那些会延迟程序关闭的线程），file/read函数有足够的时间返回nil值。
程序终止时序：在程序快速关闭的情况下，file/read可能来不及返回nil值；但当关闭过程被其他线程延迟时，它就有足够时间返回nil。
错误处理机制：当Janet正在关闭过程中，错误堆栈信息可能无法正常收集和打印，因为系统资源正在被释放。

问题复现

可以通过以下测试代码复现该问题：

(import spork/json)

(ev/spawn-thread
  (with [proc (os/spawn ["sleep" "100000000000"] :p {:out :pipe :err :pipe})]
    (os/proc-wait proc)))

(ev/spawn-thread
  (forever
    (json/decode (file/read stdin :line))))

(forever
  (ev/sleep 1))

执行方式：

sleep 1000 | janet test.janet

当终止sleep进程时，通常会看到完整的错误信息。但如果快速连续终止sleep和Janet脚本，就可能出现堆栈信息丢失的情况。

解决方案

针对这个问题，有以下几种解决方案：

输入检查：在使用json/decode前，先检查输入是否为nil：

(if-let [line (file/read stdin :line)]
  (json/decode line)
  (print "EOF reached"))

程序终止方式：考虑修改Janet源码，将所有exit调用替换为_exit，这样可以避免清理过程中的竞态条件。
错误处理包装：使用try捕获可能的异常，确保错误信息能被记录：
```
(try
  (json/decode (file/read stdin :line))
  ([err] (print "Error:" err)))
```