Highway项目中的性能计数器测试模块构建问题分析与修复
在Google的开源项目Highway中,近期发现了一个关于性能计数器测试模块的构建问题。该问题主要影响使用GCC 14.2.1编译器和CMake构建系统的Linux环境,特别是在Arch Linux发行版上表现明显。
问题现象
开发者在构建Highway项目时遇到了链接错误,具体表现为perf_counters_test模块无法正确链接。错误信息显示多个与性能计数器相关的函数符号未定义,包括:
- PerfCounters构造函数
- IndexForCounter方法
- StopAllAndReset方法
- Init方法
- StartAll方法
这些未定义的符号都属于hwy::platform::PerfCounters命名空间,表明性能计数器实现与测试用例之间的符号可见性存在问题。
根本原因
经过项目维护者的分析,问题的根本原因在于缺少HWY_DLLEXPORT宏定义。这个宏在动态链接库构建时至关重要,它确保了符号的可见性和可链接性。在共享库构建模式下(BUILD_SHARED_LIBS=ON),如果没有正确导出符号,就会导致测试程序无法链接到这些实现。
技术背景
在C++项目中,特别是在跨平台开发中,符号导出是一个常见问题。不同平台有不同的机制:
- Windows平台使用__declspec(dllexport)
- Unix-like平台使用__attribute__((visibility("default")))
HWY_DLLEXPORT宏就是为了统一这些平台差异而设计的抽象层。当这个宏缺失时,在Unix系统上构建的共享库中的符号默认不会被导出,从而导致链接错误。
修复方案
项目维护者通过以下方式解决了这个问题:
- 确保所有必要的性能计数器类和方法都正确标记了HWY_DLLEXPORT
- 验证了在共享库和静态库构建模式下的兼容性
- 确保跨平台的一致性
修复提交(60ff22e)已经合并到主分支,验证表明该修复确实解决了原始报告中的构建问题。
对开发者的启示
这个案例给C++开发者带来几点重要启示:
- 在开发跨平台库时,必须特别注意符号的可见性控制
- 动态链接和静态链接的构建测试都应该纳入CI流程
- 宏定义的一致性检查应该作为代码审查的重要部分
- 测试模块应该能够反映各种构建配置下的问题
Highway项目团队对此问题的快速响应也展示了开源社区协作的高效性,从问题报告到修复仅用了很短的时间,体现了项目维护的专业性。
结语
性能计数器是许多高性能计算项目的重要组成部分,确保其测试套件的可靠性对于项目质量至关重要。这次构建问题的解决不仅修复了当前的问题,也为项目未来的可维护性提供了保障。对于使用Highway项目的开发者来说,更新到包含此修复的版本即可避免类似问题。
PaddleOCR-VL
PaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00- DDeepSeek-V3.2-ExpDeepSeek-V3.2-Exp是DeepSeek推出的实验性模型,基于V3.1-Terminus架构,创新引入DeepSeek Sparse Attention稀疏注意力机制,在保持模型输出质量的同时,大幅提升长文本场景下的训练与推理效率。该模型在MMLU-Pro、GPQA-Diamond等多领域公开基准测试中表现与V3.1-Terminus相当,支持HuggingFace、SGLang、vLLM等多种本地运行方式,开源内核设计便于研究,采用MIT许可证。【此简介由AI生成】Python00
openPangu-Ultra-MoE-718B-V1.1
昇腾原生的开源盘古 Ultra-MoE-718B-V1.1 语言模型Python00HunyuanWorld-Mirror
混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00AI内容魔方
AI内容专区,汇集全球AI开源项目,集结模块、可组合的内容,致力于分享、交流。03Spark-Scilit-X1-13B
FLYTEK Spark Scilit-X1-13B is based on the latest generation of iFLYTEK Foundation Model, and has been trained on multiple core tasks derived from scientific literature. As a large language model tailored for academic research scenarios, it has shown excellent performance in Paper Assisted Reading, Academic Translation, English Polishing, and Review Generation, aiming to provide efficient and accurate intelligent assistance for researchers, faculty members, and students.Python00GOT-OCR-2.0-hf
阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile013
- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00
项目优选









