PEP 621 – 在 pyproject.toml 中存储项目元数据

作者:: Brett Cannon <brett at python.org>, Dustin Ingram <di at python.org>, Paul Ganssle <paul at ganssle.io>, Pradyun Gedam <pradyunsg at gmail.com>, Sébastien Eustace <sebastien at eustace.io>, Thomas Kluyver <thomas at kluyver.me.uk>, Tzu-ping Chung <uranusjr at gmail.com>
讨论地址:: Discourse 讨论帖
状态:: 最终版
类型:: 标准追踪
主题:: 打包
创建时间:: 2020-06-22
历史记录:: 2020-06-22, 2020-10-18, 2020-10-24, 2020-10-31
决议:: Discourse 帖子

摘要
动机
基本原理
规范
- 细节
- 示例
向后兼容性
安全影响
参考实现
被拒绝的建议
开放问题
版权

注意

此 PEP 是一个历史文档。最新的规范，pyproject.toml 规范，在 PyPA 规范页面上维护。

请查看 PyPA 规范更新流程，了解如何提出更改建议。

摘要

此 PEP 指定了如何在项目的核心元数据文件中写入一个 pyproject.toml 文件，以便与打包相关的工具能够使用它。

动机

此 PEP 的主要动机是

鼓励用户为了速度、易于指定、清晰性和确定性而静态地指定核心元数据，以便构建后端能够轻松地使用它
提供一种与工具无关的方式来指定元数据，以便用户能够轻松地学习和在构建后端之间进行切换
允许构建后端之间在项目元数据的“无聊部分”进行更多代码共享

具体来说，静态元数据的动机是打包生态系统的一直以来的目标。因此，使其易于静态地指定元数据非常重要。这也意味着提高将数据指定为动态的成本是可以接受的，因为用户应该更倾向于提供静态元数据。

要求区分静态和动态元数据还有助于消除元数据未指定时的歧义。当任何元数据都可能是动态的时，这意味着你永远不知道元数据的缺失是故意的，还是因为它将在以后提供。通过要求指定动态元数据，它消除了元数据未指定时的意图歧义。

此 PEP 不试图标准化构建后端所需的所有可能的元数据，而只是涵盖核心元数据规范的元数据，这些元数据在项目之间非常常见，并且可以从静态地和一致地指定中获益。这意味着构建后端仍然可以自由地在像如何指定包含在 wheel 中的文件这样的模式方面进行创新。还包括一个允许用户和构建后端使用的转义门，当他们选择部分放弃此 PEP 时（与完全放弃此 PEP 相比，这同样是可行的）。

此 PEP 也不试图以任何方式改变底层的核心元数据。此类考虑应在单独的 PEP 中进行，这可能会导致对此 PEP 指定的内容进行更改或添加。

基本原理

此 PEP 的作者遵循的设计指南是

在 pyproject.toml 中定义尽可能多的核心元数据表示
使用转义门静态地定义元数据，以便那些想要在以后通过构建后端动态地定义元数据的人
在有意义的地方使用熟悉的名称，但愿意使用更现代的术语
尝试在 TOML 文件中保持符合人体工程学的设计，而不是在有意义的情况下反映构建后端在低级别指定元数据的方式
向打包生态系统中其他使用 TOML 来存储其元数据的构建后端学习
不要试图标准化那些在低级别没有预先存在的标准的事物
当使用此 PEP 指定元数据时，它被认为是规范的

规范

在指定项目元数据时，工具 MUST 遵守并尊重此 PEP 中指定的元数据。如果元数据指定不正确，则工具 MUST 抛出错误以通知用户他们的错误。

使用此 PEP 指定的数据被认为是规范的。工具 CANNOT 删除、添加或更改静态指定的数据。只有在字段被标记为 dynamic 时，工具才能提供“新”值。

细节

表名

工具 MUST 在名为 [project] 的表中指定此 PEP 定义的字段。任何工具都不可添加此 PEP 或后续 PEP 未定义的字段到此表中。对于希望在 pyproject.toml 中存储自身设置的工具，他们可以使用 PEP 518 中定义的 [tool] 表。没有 [project] 表隐含地意味着构建后端将动态提供所有字段。

`name`

格式：字符串
核心元数据: Name (链接)
同义词
- Flit: module/dist-name (链接)
- Poetry: name (链接)
- Setuptools: name (链接)

项目的名称。

工具 MUST 要求用户静态地定义此字段。

工具 SHOULD 规范化此名称，如 PEP 503 中所述，以便在内部保持一致性。

`version`

格式：字符串
核心元数据: Version (链接)
同义词
- Flit: N/A (从 __version__ 属性读取) (链接)
- Poetry: version (链接)
- Setuptools: version (链接)

项目的版本，如 PEP 440 中所支持的。

用户 SHOULD 优先指定已规范化的版本。

`description`

格式：字符串
核心元数据: Summary (链接)
同义词
- Flit: N/A
- Poetry: description (链接)
- Setuptools: description (链接)

项目的摘要描述。

`readme`

格式：字符串或表
核心元数据: Description (链接)
同义词
- Flit: description-file (链接)
- Poetry: readme (link)
- Setuptools: long_description (link)

项目的完整描述（即README）。

此字段接受字符串或表格。如果为字符串，则为包含完整描述的文本文件的相对路径。工具必须假设文件的编码为UTF-8。如果文件路径以不区分大小写的.md后缀结尾，则工具必须假设内容类型为text/markdown。如果文件路径以不区分大小写的.rst结尾，则工具必须假设内容类型为text/x-rst。如果工具识别比此PEP更多扩展，则它们可以为用户推断内容类型，而无需将此字段指定为dynamic。对于未识别后缀且未提供内容类型的情况，工具必须引发错误。

readme字段也可以采用表格。file键的字符串值为包含完整描述的文件的相对路径。text键的字符串值为完整描述。这些键是互斥的，因此如果元数据同时指定了这两个键，则工具必须引发错误。

在readme字段中指定的表格还具有一个content-type字段，该字段采用一个字符串，指定完整描述的内容类型。如果元数据未在表格中指定此字段，则工具必须引发错误。如果元数据未指定charset参数，则假定为UTF-8。工具可以选择支持其他编码。工具可以选择支持它们可以转换为核心元数据支持的内容类型的备选内容类型。否则，工具必须针对不支持的内容类型引发错误。

`requires-python`

格式：字符串
核心元数据: Requires-Python (link)
同义词
- Flit: requires-python (link)
- Poetry: 在[tool.poetry.dependencies]表格中作为python依赖项 (link)
- Setuptools: python_requires (link)

项目的Python版本要求。

`license`

格式：表格
核心元数据: License (link)
同义词
- Flit: license (link)
- Poetry: license (link)
- Setuptools: license, license_file, license_files (link)

该表格可能具有两个键之一。file键的字符串值为包含项目许可证文件的相对文件路径。工具必须假设文件的编码为UTF-8。text键的字符串值为项目的许可证，其含义与核心元数据中的License字段的含义相同。这些键是互斥的，因此如果元数据同时指定了这两个键，则工具必须引发错误。

为了允许未来PEP指定对SPDX表达式的支持，license键的实用字符串值已被有意省略（相同的逻辑适用于任何类型的“类型”字段，指定file或text代表的许可证）。

`authors`/`maintainers`

格式：具有字符串键和值的内联表格的数组
核心元数据: Author/Author-email/Maintainer/Maintainer-email (link)
同义词
- Flit: author/author-email/maintainer/maintainer-email (link)
- Poetry: authors/maintainers (link)
- Setuptools: author/author_email/maintainer/maintainer_email (link)

被认为是项目“作者”的人或组织。确切含义可以解释——它可能列出原始作者或主要作者、当前维护者或包的所有者。

“维护者”字段类似于“作者”，其确切含义可以解释。

这些字段接受一个具有2个键的表格数组：name和email。两个值都必须是字符串。 name值必须是有效的电子邮件名称（即在RFC 822中可以作为电子邮件之前的名称放置的任何内容），并且不包含逗号。 email值必须是有效的电子邮件地址。两个键都是可选的。

使用数据填充核心元数据的方式如下

如果仅提供name，则该值将分别放入Author/Maintainer中。
如果仅提供email，则该值将分别放入Author-email/Maintainer-email中。
如果同时提供email和name，则该值将分别放入Author-email/Maintainer-email中，格式为{name} <{email}>（使用适当的引用，例如使用email.headerregistry.Address）。
多个值应以逗号分隔。

`keywords`

格式：字符串数组
核心元数据: Keywords (link)
同义词
- Flit: keywords (link)
- Poetry: keywords (link)
- Setuptools: keywords (link)

项目的关键字。

`classifiers`

格式：字符串数组
核心元数据: Classifier (link)
同义词
- Flit: classifiers (link)
- Poetry: classifiers (link)
- Setuptools: classifiers (link)

Trove 分类器适用于项目。

`urls`

格式：表格，具有字符串键和值
核心元数据: Project-URL (link)
同义词
- Flit: [tool.flit.metadata.urls] 表格 (link)
- Poetry: [tool.poetry.urls] 表格 (link)
- Setuptools: project_urls (link)

一个 URL 表格，其中键是 URL 标签，值是 URL 本身。

入口点

格式：表格（[project.scripts]、[project.gui-scripts] 和 [project.entry-points]）
核心元数据: N/A；入口点规范
同义词
- Flit: [tool.flit.scripts] 表格用于控制台脚本，[tool.flit.entrypoints] 用于其他部分 (link)
- Poetry: [tool.poetry.scripts] 用于定义控制台脚本的表格 (链接)
- Setuptools: entry_points (链接)

有三个与入口点相关的表格。 [project.scripts] 表格对应于入口点规范中的 console_scripts 组。表格的键是入口点的名称，值是对象引用。

[project.gui-scripts] 表格对应于入口点规范中的 gui_scripts 组。它的格式与 [project.scripts] 相同。

[project.entry-points] 表格是一个表格集合。每个子表格的名称都是一个入口点组。键值语义与 [project.scripts] 相同。用户**不得**创建嵌套的子表格，而是将入口点组保持在一级深度。

如果元数据定义了 [project.entry-points.console_scripts] 或 [project.entry-points.gui_scripts] 表格，构建后端**必须**抛出错误，因为它们在 [project.scripts] 和 [project.gui-scripts] 存在的情况下将产生歧义。

`dependencies`/`optional-dependencies`

格式： PEP 508 字符串数组 (dependencies) 和一个包含 PEP 508 字符串数组的表格 (optional-dependencies)
核心元数据: Requires-Dist 和 Provides-Extra (链接, 链接)
同义词
- Flit: requires 用于必需的依赖项， requires-extra 用于可选的依赖项 (链接)
- Poetry: [tool.poetry.dependencies] 用于依赖项（包括必需的和开发的）， [tool.poetry.extras] 用于可选的依赖项 (链接)
- Setuptools: install_requires 用于必需的依赖项， extras_require 用于可选的依赖项 (链接)

项目的（可选）依赖项。

对于 dependencies，它是一个键，其值为一个字符串数组。每个字符串代表项目的依赖项，**必须**格式化为有效的 PEP 508 字符串。每个字符串直接映射到核心元数据中的 Requires-Dist 条目。

对于 optional-dependencies，它是一个表格，其中每个键指定一个额外的依赖项，其值为一个字符串数组。数组中的字符串必须是有效的 PEP 508 字符串。键**必须**是核心元数据中 Provides-Extra 的有效值。因此，数组中的每个值都会成为与匹配的 Provides-Extra 元数据相对应的 Requires-Dist 条目。

`dynamic`

格式：字符串数组
核心元数据: N/A
没有同义词

指定了此 PEP 列出的哪些字段被故意未指定，以便其他工具可以/将动态提供此类元数据。这明确地区分了哪些元数据是有意未指定且预计将保持未指定，与后来通过工具提供相比。

构建后端**必须**遵守静态指定的元数据（这意味着元数据没有在 dynamic 中列出该字段）。
如果元数据在 dynamic 中指定了 name，则构建后端**必须**抛出错误。
如果核心元数据规范将一个字段列为“必需”，那么元数据**必须**静态指定该字段或将其列在 dynamic 中（构建后端**必须**抛出错误，否则，即必需字段不应该以任何方式不在 [project] 表格中）。
如果核心元数据规范将一个字段列为“可选”，则元数据**可以**将其列在 dynamic 中，如果预期构建后端将在稍后提供该字段的数据。
如果元数据静态指定了一个字段，并且该字段也在 dynamic 中列出，则构建后端**必须**抛出错误。
如果元数据没有在 dynamic 中列出某个字段，那么构建后端**不能**代表用户填写必需的元数据（即 dynamic 是允许工具填写元数据的唯一方式，用户必须选择进行填写）。
如果元数据在 dynamic 中指定了一个字段，但构建后端无法提供该字段的数据，则构建后端**必须**抛出错误。

示例

[project]
name = "spam"
version = "2020.0.0"
description = "Lovely Spam! Wonderful Spam!"
readme = "README.rst"
requires-python = ">=3.8"
license = {file = "LICENSE.txt"}
keywords = ["egg", "bacon", "sausage", "tomatoes", "Lobster Thermidor"]
authors = [
  {email = "hi@pradyunsg.me"},
  {name = "Tzu-ping Chung"}
]
maintainers = [
  {name = "Brett Cannon", email = "brett@python.org"}
]
classifiers = [
  "Development Status :: 4 - Beta",
  "Programming Language :: Python"
]

dependencies = [
  "httpx",
  "gidgethub[httpx]>4.0.0",
  "django>2.1; os_name != 'nt'",
  "django>2.0; os_name == 'nt'"
]

[project.optional-dependencies]
test = [
  "pytest < 5.0.0",
  "pytest-cov[all]"
]

[project.urls]
homepage = "https://example.com"
documentation = "https://readthedocs.org"
repository = "https://github.com"
changelog = "https://github.com/me/spam/blob/master/CHANGELOG.md"

[project.scripts]
spam-cli = "spam:main_cli"

[project.gui-scripts]
spam-gui = "spam:main_gui"

[project.entry-points."spam.magical"]
tomatoes = "spam:main_tomatoes"

最后修改时间：2023-12-06 16:17:05 GMT