Hatch构建工具中SDist包大小优化实践

2025-06-02 09:30:32作者：范垣楠Rhoda

在Python包开发过程中，构建工具的选择和配置直接影响着最终发布包的质量和效率。本文将以Hatch构建工具为例，深入探讨如何优化源代码分发包(SDist)的大小，特别是如何处理测试文件包含问题。

SDist包大小问题分析

许多开发者在使用Hatch构建Python包时发现，生成的源代码分发包(SDist)体积异常庞大，有时甚至达到几MB，而对应的wheel包却只有几十KB。这种现象的主要原因是Hatch默认会将项目目录下的所有文件都包含在SDist包中，包括测试目录和测试数据。

这种默认行为虽然保证了构建的完整性，但在实际发布场景中却带来了几个问题：

Hatch提供了灵活的配置选项来解决这个问题。通过在项目配置文件中添加特定设置，开发者可以精确控制哪些文件应该包含在SDist包中。

最简单的解决方案是在项目的pyproject.toml文件中添加以下配置：

[tool.hatch.build.targets.sdist]
only-packages = true
exclude = [
  "tests/",
]

这个配置实现了两个优化：

Hatch为SDist构建提供了几个关键配置参数：

对于更复杂的项目结构，可以采用以下进阶配置策略：

[tool.hatch.build.targets.sdist]
only-packages = true
exclude = [
  "tests/",
  "benchmarks/",
  "docs/",
  "examples/",
  "*.md",
  "*.rst"
]

这种配置不仅排除了测试目录，还排除了文档、示例等非必要内容，进一步减小了包体积。

值得注意的是，Hatch的这种默认包含所有文件的行为并非特例。其他主流Python构建工具如pypa/build和flit也采用了类似的默认策略。这种设计哲学源于Python打包生态对"完整源代码"的传统理解，即SDist应该包含重建包所需的一切内容。

然而，在实际项目维护中，开发者需要根据项目特点权衡完整性和效率。对于开源库，可能希望包含测试以便用户验证；而对于私有项目或纯发布场景，精简包体积可能更为重要。

基于项目实践，我们总结出以下建议：

通过合理配置Hatch构建选项，开发者可以在保证功能完整性的同时，显著优化包分发效率，提升用户体验。

登录后查看全文