使用attrs库处理复杂字典输入的多字段派生
2025-06-07 20:06:51作者:翟江哲Frasier
在Python开发中,我们经常需要处理复杂的嵌套字典数据结构,并将其转换为具有明确字段的类对象。attrs库是一个强大的工具,可以帮助我们简化这个过程。本文将介绍如何使用attrs库从单个复杂输入字典中派生出多个字段。
问题场景
假设我们有一个包含联系人信息的嵌套字典结构,其中可能包含多种联系方式(如手机号和电子邮件)。我们的目标是将这个复杂字典转换为一个具有明确字段的类对象,其中每个字段都从原始字典的特定部分提取数据。
解决方案
attrs库提供了几种处理这种情况的方法,其中最优雅的是使用派生属性(Derived Attributes)功能。派生属性允许我们在类初始化后,基于其他字段的值计算新字段的值。
基本实现
首先,我们定义一个辅助函数来处理联系人信息的提取:
def extract_contact(contact_type, contacts):
"""从联系人列表中提取特定类型的联系人信息"""
for contact in contacts:
if contact.get('type', {}).get('id') == contact_type:
if contact_type == 'cell':
return contact['value']['number']
elif contact_type == 'email':
return contact['value']
return None
然后,我们使用attrs定义我们的类:
from attrs import define, field
@define
class ContactInfo:
contacts: list = field() # 原始联系人列表
@property
def phone(self):
"""派生属性:手机号"""
return extract_contact('cell', self.contacts)
@property
def email(self):
"""派生属性:电子邮件"""
return extract_contact('email', self.contacts)
使用示例
data = {
'contacts': [
{
'type': {'id': 'cell', 'name': 'Mobile'},
'value': {'number': '111111'}
},
{
'type': {'id': 'email', 'name': 'Email'},
'value': 'my-email@example.com'
}
]
}
info = ContactInfo(**data)
print(info.phone) # 输出: 111111
print(info.email) # 输出: my-email@example.com
进阶技巧
使用缓存提高性能
如果派生属性的计算成本较高,我们可以使用缓存来优化性能:
from functools import cached_property
@define
class CachedContactInfo:
contacts: list = field()
@cached_property
def phone(self):
return extract_contact('cell', self.contacts)
@cached_property
def email(self):
return extract_contact('email', self.contacts)
使用转换器预处理数据
我们还可以在字段定义时使用转换器来预处理数据:
@define
class PreprocessedContactInfo:
phone: str = field(converter=lambda x: extract_contact('cell', x))
email: str = field(converter=lambda x: extract_contact('email', x))
@classmethod
def from_raw_data(cls, data):
return cls(contacts=data['contacts'])
最佳实践
-
保持派生逻辑简单:派生属性应该只包含简单的数据转换逻辑,复杂业务逻辑应该放在其他方法中。
-
明确文档:为每个派生属性添加清晰的文档字符串,说明其数据来源和格式。
-
考虑性能:对于计算密集型的派生属性,考虑使用缓存或惰性计算。
-
错误处理:在派生属性中添加适当的错误处理,避免因数据格式问题导致整个对象不可用。
通过使用attrs库的派生属性功能,我们可以优雅地处理复杂的数据结构转换,同时保持代码的清晰和可维护性。这种方法特别适合处理API响应、配置文件等需要从复杂结构中提取多个字段的场景。
登录后查看全文
热门项目推荐
相关项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0218
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0139
uni-appA cross-platform framework using Vue.jsJavaScript09
GLM-5.2智谱开源 GLM-5.2,这是针对长文本任务的最新旗舰模型。相较于前代产品 GLM-5.1,它在长文本任务处理能力上实现了显著飞跃,并且首次在稳定的 100 万 token 上下文中提供这一能力。Jinja00
SwanLab⚡️SwanLab - an open-source, modern-design AI training tracking and visualization tool. Supports Cloud / Self-hosted use. Integrated with PyTorch / Transformers / LLaMA Factory / veRL/ Swift / Ultralytics / MMEngine / Keras etc.Python00
tiny-universe《大模型白盒子构建指南》:一个全手搓的Tiny-UniverseJupyter Notebook03
项目优选
收起
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
471
465
deepin linux kernel
C
32
16
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
2.09 K
218
本项目是CANN提供的神经网络类计算算子库,实现网络在NPU上加速计算。
C++
700
1.4 K
暂无描述
Dockerfile
780
5.08 K
Ascend Extension for PyTorch
Python
758
968
本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本,由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用,3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。
Dart
1.04 K
271
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。
C++
880
2.03 K
MindQuantum is a general software library supporting the development of applications for quantum computation.
Python
183
111
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.11 K
682