Poetry项目中的include默认行为不一致问题解析

2025-05-04 23:04:38作者：廉彬冶Miranda

诗歌(Poetry)是简化Python包管理和依赖处理的得力工具，让你的项目无论何处都能拥有精确的软件栈配置。告别杂乱无章的文件，只需一个`pyproject.toml`，即可整合`setup.py`、`requirements.txt`等的功能。通过直观的项目定义，轻松声明与管理版本依赖，支持精细到版本号的控制，甚至Git仓库直接引用。无论是核心依赖还是可选模块，或是组织良好的开发和文档生成需求，Poetry一手包办。简单的安装方式，全面的文档支持，加上活跃的社区，让Python项目的包装与部署变得前所未有的简单高效。加入千千万万开发者的选择，用Poetry优雅地编织你的Python世界。

项目地址：https://gitcode.com/gh_mirrors/poe/poetry

背景介绍

在Python打包工具Poetry中，存在两种不同的include机制，它们在默认行为上存在不一致性，这给开发者带来了困惑。本文将深入分析这一问题的技术细节、历史演变以及可能的解决方案。

两种include机制的区别

Poetry实际上提供了两种不同的include功能：

包包含机制：用于指定哪些Python包应该被打包，默认情况下会同时包含在源码分发(sdist)和轮子分发(wheel)中。
文件包含机制：用于指定额外的文件或目录，按照文档说明默认只包含在源码分发中。

这种设计差异可能源于实际使用场景的不同：通常我们希望Python包在所有分发形式中都可用，而像测试文件、变更日志等附加内容可能只需要包含在源码分发中。

问题本质

文件包含机制的实际行为与文档描述存在不一致：

对于单个文件：会被同时包含在sdist和wheel中
对于目录：则只包含在sdist中

这种不一致性源于早期的实现错误，并在后续的测试和文档更新中被无意中保留下来。

历史演变分析

最初实现时，文件包含机制就被错误地实现为对文件的双包含
后续的包包含机制修改意外地测试了文件包含的错误行为
文档经历了从"双包含"到"仅sdist"的修正
测试用例没有正确反映预期行为

技术权衡

仅包含在sdist中的优势

避免将非必要文件(如测试、文档)安装到site-packages目录
符合最小化安装原则
保持wheel的简洁性

双包含的优势

统一的行为更易于理解和记忆
对于需要覆盖VCS排除规则的文件，双包含更符合预期
与exclude机制保持对称性

解决方案建议

从技术合理性和用户体验角度考虑，建议采取以下方案：

统一默认行为：将所有include机制的默认行为统一为"仅sdist"
显式配置：需要wheel包含的文件应通过明确配置实现
文档完善：清晰区分两种include机制的不同用途

这种方案虽然牺牲了一些便利性，但能提供更一致的行为和更可控的打包结果。

实际影响

开发者需要注意：

需要wheel包含的文件必须显式配置
测试文件和文档等通常不应出现在wheel中
自动生成的文件需要特别注意包含规则

最佳实践

基于当前实现，建议开发者：

明确指定每个include的目标分发格式
对包使用packages配置，对额外文件使用include
定期检查生成的wheel内容是否符合预期

通过遵循这些实践，可以避免因默认行为不一致导致的问题。

诗歌(Poetry)是简化Python包管理和依赖处理的得力工具，让你的项目无论何处都能拥有精确的软件栈配置。告别杂乱无章的文件，只需一个`pyproject.toml`，即可整合`setup.py`、`requirements.txt`等的功能。通过直观的项目定义，轻松声明与管理版本依赖，支持精细到版本号的控制，甚至Git仓库直接引用。无论是核心依赖还是可选模块，或是组织良好的开发和文档生成需求，Poetry一手包办。简单的安装方式，全面的文档支持，加上活跃的社区，让Python项目的包装与部署变得前所未有的简单高效。加入千千万万开发者的选择，用Poetry优雅地编织你的Python世界。

项目地址：https://gitcode.com/gh_mirrors/poe/poetry

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss-server

openGauss kernel ~ openGauss is an open source relational database management system

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。