LuaLaTeX 下 thuthesis 模板中文标点符号处理问题解析

2025-06-10 18:33:15作者：卓炯娓

问题背景

在学术论文写作中，中文标点符号的正确显示至关重要。清华大学学位论文模板 thuthesis 在使用 LuaLaTeX 引擎编译时，出现了中文标点符号（如破折号、省略号、引号等）被错误识别为西文字符的问题，导致这些标点符号显示为半角形式而非全角形式。

技术分析

字符分类机制

在 LaTeX 排版系统中，特别是处理中日韩文字时，字符被划分为不同的类别（category）。这些类别决定了字符在排版时的行为方式：

类别 3（ALchar）：通常用于西文字母和数字
类别 6（JAchar）：用于日文字符
类别 9（CNchar）：用于中文字符

问题根源

thuthesis 模板在处理带圈数字（U+2460-U+24FF）时，原本意图是将这些字符归类为类别 6（JAchar），但实际代码实现中错误地将 U+2000 至 U+243F 范围内的字符也一并设置为了类别 3（ALchar）。这导致了以下中文标点符号被错误分类：

省略号（……）
引号（""）
破折号（——）

LuaLaTeX 与 XeLaTeX 的差异

XeLaTeX 引擎能够正确处理这些中文标点符号，将其归类为类别 9（CNchar），因此显示为全角形式。而 LuaLaTeX 由于上述字符分类错误，导致这些标点符号被当作西文字符处理。

解决方案

正确实现方式

通过分析 \ltjdefcharrange 命令的行为特性，发现它是增量更新的，因此只需针对带圈数字范围进行单独设置即可：

\ifLuaTeX
  \ltjdefcharrange{6}{"2460-"24FF}

这种实现方式不会覆盖其他字符原有的正确分类，特别是保留了中文标点符号应有的类别 9 设置。

技术要点

增量更新特性：\ltjdefcharrange 命令不会重置整个字符范围，而是只修改指定范围的字符类别
精确范围控制：只需针对实际需要修改的字符范围（带圈数字）进行调整
兼容性保持：不影响其他字符（特别是中文标点符号）的原有正确分类

最佳实践建议

引擎选择：对于中文文档，XeLaTeX 通常对中文支持更为成熟
字符分类检查：在使用 LuaLaTeX 时，应特别注意特殊符号的字符类别设置
范围精确控制：修改字符类别时，应尽可能精确指定需要修改的范围
测试验证：任何字符分类修改后，都应测试各种标点符号的显示效果

总结

thuthesis 模板中的这一问题展示了在 LaTeX 排版中字符分类机制的重要性。通过理解字符类别的工作原理和命令的具体行为特性，我们能够更精确地控制文档中各类字符的排版表现。对于学术论文写作，特别是包含大量中文内容的文档，确保标点符号的正确显示是保证文档专业性的重要环节。

thuthesis

LaTeX Thesis Template for Tsinghua University

项目地址：https://gitcode.com/gh_mirrors/th/thuthesis

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

atomcode

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

414

339

cherry-studio

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

LuaLaTeX 下 thuthesis 模板中文标点符号处理问题解析

问题背景

技术分析

字符分类机制

问题根源

LuaLaTeX 与 XeLaTeX 的差异

解决方案

正确实现方式

技术要点

最佳实践建议

总结

热门内容推荐

最新内容推荐

项目优选

LuaLaTeX 下 thuthesis 模板中文标点符号处理问题解析

问题背景

技术分析

字符分类机制

问题根源

LuaLaTeX 与 XeLaTeX 的差异

解决方案

正确实现方式

技术要点

最佳实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选