jank-lang编译器优化：消除字符串全局变量装箱操作

2025-06-30 12:23:05作者：柏廷章Berta

在jank-lang编译器开发过程中，团队发现了一个可以优化的性能热点。当前在LLVM代码生成阶段处理字符串读取时，存在不必要的装箱(boxing)操作，这影响了编译器的效率。

问题背景

在llvm_processor.cpp文件中，当编译器需要生成对jank_read_string函数的调用时，当前实现会将字符串参数装箱成一个全局变量。这种设计虽然功能上可行，但从性能角度来看存在两个问题：

不必要的内存分配：每次调用都要创建新的box对象
额外的间接访问：需要通过box对象间接访问字符串内容

优化方案

经过分析，团队决定采用更高效的实现方式：

新增jank_read_string_c函数：直接在C API层添加支持原始C字符串的新接口
保持现有jank_read_string函数：确保向后兼容
修改LLVM代码生成：直接传递C字符串而非装箱后的对象

新方案的关键优势在于：

避免了中间对象的创建
减少了内存分配次数
保持了与现有runtime::context::read_string的兼容性

技术实现细节

优化后的实现将充分利用C字符串和string_view的特性：

runtime::context::read_string已经接受string_view参数，天然支持多种字符串表示
新增的jank_read_string_c直接传递原始字符串指针
LLVM IR生成阶段直接使用字符串字面量，无需额外包装

这种改变不仅提升了性能，还使代码更加简洁。由于string_view的轻量级特性，转换过程几乎没有额外开销。

兼容性考虑

为了确保平滑过渡，团队采取了以下措施：

保留原有jank_read_string接口
使用_c后缀命名新函数，建立一致的API命名规范
内部实现共享相同的核心逻辑

这种设计既满足了性能优化的需求，又保证了现有代码的稳定性。

性能影响

预期优化后将带来以下改进：

减少约30%的字符串处理时间
降低GC压力，减少内存分配次数
提升编译器整体吞吐量

特别是在处理大量字符串字面量的场景下，这种优化效果将更加明显。

总结

jank-lang团队通过这次优化展示了他们对编译器性能的持续关注。从消除不必要的装箱操作这个小切入点出发，实现了可观的性能提升。这种精细化的优化思路值得其他语言实现者借鉴，也体现了jank-lang追求高效的设计哲学。

jank

A Clojure dialect hosted on LLVM with native C++ interop

项目地址：https://gitcode.com/gh_mirrors/ja/jank

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

178

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

TSX

410

130