首页
/ Snakemake项目构建体系现代化改造:从传统setup.py迁移至pyproject.toml

Snakemake项目构建体系现代化改造:从传统setup.py迁移至pyproject.toml

2025-07-01 13:50:26作者:滕妙奇

在Python生态系统中,项目构建和打包方式正在经历重大变革。作为知名的生物信息学工作流管理系统,Snakemake近期完成了其构建体系的现代化改造,将原本基于setuptools、versioneer和setup.cfg的传统构建方式,全面迁移到了符合PEP 517/518标准的pyproject.toml配置体系。

传统构建方式的局限性

在改造前,Snakemake采用Python生态中常见的传统构建方案:

  • 使用setup.py作为构建入口
  • 通过versioneer工具管理版本号
  • 依赖setup.cfg进行静态配置

这种组合虽然在过去被广泛使用,但存在多个痛点:

  1. 构建逻辑分散在多个文件中,维护成本高
  2. versioneer作为独立工具增加了复杂性
  3. 不符合现代Python打包标准(PEP 517/518)
  4. 难以与新兴构建工具(如uv、pixi等)良好集成

现代化改造方案

项目团队决定采用pyproject.toml作为唯一的构建配置文件,这一改变带来了显著优势:

统一配置入口

所有构建配置集中到单个pyproject.toml文件中,包括:

  • 项目元数据(名称、版本、作者等)
  • 构建系统要求
  • 依赖声明
  • 开发工具配置

版本管理简化

移除了versioneer依赖,改为直接在pyproject.toml中管理版本,或通过构建时动态获取版本号的方式。

构建工具兼容性

新的配置方式完全符合PEP 517/518标准,可以:

  • 与pip最新版本无缝协作
  • 支持新兴构建工具如uv、pixi等
  • 保持与setuptools的向后兼容

技术实现要点

迁移过程中涉及几个关键技术决策:

  1. 构建后端选择:虽然可以继续使用setuptools作为后端,但更推荐使用现代替代方案如hatchling或pdm-backend

  2. 动态版本处理:对于需要从git tag获取版本号的情况,可以通过构建钩子实现,而不再依赖versioneer

  3. 多项目统一:不仅主Snakemake包完成迁移,所有相关插件和接口包也同步更新了构建方式

  4. 开发环境标准化:结合pyproject.toml,可以使用现代开发环境管理工具如uv或pixi,确保开发与生产环境一致

迁移带来的收益

这一架构改造为Snakemake项目带来了多方面改进:

  1. 更简单的贡献流程:新贡献者不再需要理解复杂的多文件构建系统

  2. 更快的构建速度:现代构建工具通常具有更好的性能

  3. 更好的工具集成:与CI/CD系统、IDE和新兴Python工具的集成更顺畅

  4. 面向未来的基础:为后续采用更多Python打包新特性奠定了基础

经验总结

对于考虑类似迁移的项目,Snakemake的经验表明:

  1. 迁移过程虽然需要一定工作量,但长期收益显著

  2. 建议分阶段进行,先确保pyproject.toml与原有系统共存,再逐步移除旧配置

  3. 需要全面测试各种安装场景(源码安装、wheel安装、开发模式等)

  4. 文档更新要与代码变更同步,特别是贡献指南部分

这一改造使Snakemake保持了在生物信息学工具链中的技术领先地位,也为其他科学计算项目的现代化提供了参考范例。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
197
2.17 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
208
285
pytorchpytorch
Ascend Extension for PyTorch
Python
59
94
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
973
574
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
549
81
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.02 K
399
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
393
27
MateChatMateChat
前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。 官网地址:https://matechat.gitcode.com
1.2 K
133