Jupyter Book中statsmodels回归表格的LaTeX导出问题解析

2025-06-17 09:31:54作者：裴麒琰

问题背景

在使用Jupyter Book构建包含statsmodels回归分析结果的PDF文档时，许多用户遇到了"Missing $ inserted"的LaTeX编译错误。这个问题特别出现在使用--builder pdflatex参数构建包含statsmodels.summary()输出的笔记本时。

问题现象

当用户在Jupyter Notebook中运行如下代码并尝试导出为PDF时：

import statsmodels.api as sm
import statsmodels.formula.api as smf

dat = sm.datasets.get_rdataset("Guerry", "HistData").data
results = smf.ols("Lottery ~ Literacy", data=dat).fit()
results.summary()

直接使用Jupyter Book构建PDF时会遇到LaTeX编译错误，而单独使用nbconvert却能正常工作。这表明问题出在Jupyter Book的LaTeX导出流程中。

技术分析

根本原因

这个问题源于Jupyter Book的LaTeX模板与statsmodels的表格输出格式之间的兼容性问题。statsmodels的summary()方法生成的表格包含特殊字符和格式，特别是概率值中的"P>|t|"部分，这会导致LaTeX解析错误。

解决方案比较

目前有两种可行的解决方案：

使用MyST文档引擎：Jupyter Book V2将采用MyST作为默认引擎，它提供了更灵活的文档导出功能，能够更好地处理这类表格输出。MyST支持多种导出格式，包括LaTeX和Typst。
临时替代方案：对于仍在使用Jupyter Book 1.x版本的用户，可以将回归表格截图后以图片形式插入文档，虽然不够优雅但能绕过LaTeX解析问题。