SILE排版引擎v0.15.10版本发布:CSL引用与索引功能全面升级
SILE是一款现代化的专业排版引擎,采用Lua脚本语言实现,旨在为复杂排版需求提供灵活而强大的解决方案。与传统的TeX系统不同,SILE采用了更现代化的设计理念,同时保持了处理复杂排版任务的能力。最新发布的v0.15.10版本带来了多项重要改进,特别是在参考文献管理和索引生成方面有了显著提升。
CSL引用成为默认参考文献处理方式
本次版本最重大的变化是将CSL(Citation Style Language)作为默认的参考文献处理引擎。CSL是一种基于XML的开放标准,被广泛应用于学术出版领域,能够精确控制文献引用的格式。SILE现在能够更好地支持:
-
分组引用:通过新增的
\cites命令,用户可以方便地输出多个文献的合并引用,这在学术写作中非常常见。例如可以将多个相关研究合并为一个引用组。 -
文献标记:新增的
\nocite命令允许用户将文献条目标记为已引用状态,即使正文中没有直接引用该文献,这在需要展示参考文献列表但不一定全部引用的场景下非常有用。 -
样式合规性:改进了对CSL样式的支持,包括文献缩进规则、名称部分格式化等细节处理,使得输出结果更加符合各种学术期刊的要求。
-
链接处理:修正了DOI、PMID等标识符的链接生成问题,确保这些学术资源链接能够正确呈现。
索引功能全面增强
索引功能在这个版本中获得了多项重要改进:
-
页码范围处理:新增了"minimal"和"minimal-two"选项,可以智能地折叠连续的页码范围。例如将"1,2,3,4"显示为"1-4",提高了索引的可读性。
-
样式定制:增加了多个样式钩子,允许用户更灵活地控制索引的外观。特别是新增了条目与页码之间填充物的自定义选项,可以满足不同出版风格的需求。
-
位置灵活性:现在索引可以出现在文档的任何位置,而不仅限于传统的位置限制,这为文档结构设计提供了更多可能性。
-
语言感知排序:索引条目现在会根据文档语言自动采用合适的排序规则,这对于多语言文档特别重要,确保不同语言的索引都能正确排序。
字体与排版质量改进
在字体处理方面,这个版本引入了基于x高度和大写字母高度的调整功能,特别改善了代码和逐字文本的显示效果:
-
精确度量:改进了对由多个字形组成的单个字符的度量计算,确保复杂字符(如某些语言的连字)能够正确显示。
-
代码显示优化:专门为代码和逐字文本应用了x高度调整,使得等宽字体中的代码显示更加整齐美观。
-
断行优化:新增了避免在连字符后分页的功能,减少了"孤行"现象,提升了排版的美观性。
多语言支持改进
针对多语言文档的处理也有多项改进:
-
维吾尔语断字:修复了维吾尔语特定的断字问题,确保这种右向左书写的语言能够正确断行。
-
UTF-16处理:改进了对UTF-16编码文本的处理,避免了可能的空终止符问题。
-
语言设置逻辑:优化了语言设置的声明时机,确保语言支持已加载后再进行设置。
开发者体验提升
对于开发者而言,这个版本也带来了便利:
-
模块加载简化:新增了
--luarocks-tree命令行参数,简化了第三方模块的加载过程,使得使用自定义安装的Lua模块更加方便。 -
警告信息优化:改进了关于不支持语言的警告信息,避免了重复输出,使开发过程更加清晰。
-
构建工具增强:增加了生成vendored crates压缩包的工具,方便开发者进行依赖管理。
总结
SILE v0.15.10版本在参考文献处理、索引生成、多语言支持和开发者体验等方面都带来了显著改进。特别是对CSL标准的全面支持,使得SILE在学术出版领域的实用性大大提升。这些改进不仅增强了核心功能,也提高了排版输出的质量和专业性,使SILE成为一个更加强大和易用的现代化排版解决方案。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00