Python集合(set)完全指南：从基础到高级操作

2025-06-24 16:03:15作者：舒璇辛Bertina

什么是Python集合(set)

Python中的集合(set)是一种无序且不重复的数据结构，它类似于数学中的集合概念。集合中的元素必须是可哈希的(不可变类型)，这与字典(dict)的键要求相同。集合在Python中主要有两种形式：

可变集合：使用set()创建
不可变集合：使用frozenset()创建

集合的主要特点包括：

无序性：元素没有固定顺序
唯一性：所有元素都是唯一的
可哈希性：元素必须是不可变类型

集合的创建与初始化

创建集合有几种不同的方式，每种方式会产生不同的结果：

# 空集合
empty_set = set()  # 注意：不能使用{}创建空集合，那会创建空字典

# 从字符串创建
chars_set = set('hello')  # 结果为 {'h', 'e', 'l', 'o'}

# 从列表创建
list_set = set([1, 2, 3, 2])  # 结果为 {1, 2, 3}

# 从元组创建
tuple_set = set((4, 5, 6))  # 结果为 {4, 5, 6}

需要注意的是，直接使用字符串初始化集合时，字符串会被拆分为单个字符。如果想将整个字符串作为单个元素，应该将其放入列表中：

word_set = set(['hello'])  # 结果为 {'hello'}

集合的基本操作

添加元素

向集合中添加元素有两种主要方法：

add()方法：添加单个元素

s = set()
s.add(1)  # {1}
s.add(2)  # {1, 2}
s.add(1)  # {1, 2} (重复元素不会被添加)

update()方法：添加多个元素（可迭代对象）

s = set()
s.update([1, 2, 3])  # {1, 2, 3}
s.update('abc')      # {1, 2, 3, 'a', 'b', 'c'}
s.update({'x':1, 'y':2})  # 只添加字典的键 {'x', 'y'}

删除元素

从集合中删除元素可以使用remove()方法：

s = {1, 2, 3}
s.remove(2)  # {1, 3}

如果尝试删除不存在的元素，remove()会引发KeyError。如果希望删除元素时不报错，可以使用discard()方法：

s = {1, 2, 3}
s.discard(4)  # 不会报错

集合运算

集合最强大的功能之一是支持数学上的集合运算，这使得处理数据关系变得非常方便。

基本集合运算

假设有两个集合：

A = {1, 2, 3}
B = {3, 4, 5}

并集(Union)：| 或 union()方法

A | B  # {1, 2, 3, 4, 5}
A.union(B)  # 同上

交集(Intersection)：& 或 intersection()方法

A & B  # {3}
A.intersection(B)  # 同上

差集(Difference)：- 或 difference()方法

A - B  # {1, 2}
A.difference(B)  # 同上

对称差集(Symmetric Difference)：^ 或 symmetric_difference()方法
```
A ^ B  # {1, 2, 4, 5}
A.symmetric_difference(B)  # 同上
```

集合关系判断

集合还支持多种关系判断操作：

A = {1, 2}
B = {1, 2, 3}

# 子集判断
A.issubset(B)  # True
A <= B  # True

# 真子集判断
A < B  # True

# 超集判断
B.issuperset(A)  # True
B >= A  # True

# 真超集判断
B > A  # True

# 不相交判断
A.isdisjoint({4, 5})  # True

集合的实用场景

集合在实际编程中有许多有用的应用场景：

去重：快速去除列表中的重复元素

lst = [1, 2, 2, 3, 3, 3]
unique = list(set(lst))  # [1, 2, 3]

成员测试：集合的成员测试比列表快得多

s = set(range(1000000))
999999 in s  # 非常快速

数据关系处理：处理两组数据之间的关系

# 找出两个列表的共同元素
list1 = [1, 2, 3, 4]
list2 = [3, 4, 5, 6]
common = set(list1) & set(list2)  # {3, 4}

过滤数据：快速筛选出符合条件的数据

valid_tags = {'python', 'java', 'javascript'}
user_tags = {'python', 'html', 'css'}
matched_tags = user_tags & valid_tags  # {'python'}

集合的性能特点

集合是基于哈希表实现的，因此具有以下性能特点：

添加元素：平均O(1)时间复杂度
删除元素：平均O(1)时间复杂度
成员测试：平均O(1)时间复杂度
并集/交集/差集运算：O(len(s)+len(t))时间复杂度

这使得集合在处理大量数据时非常高效，特别是需要频繁进行成员测试的场景。

不可变集合(frozenset)

不可变集合frozenset与普通集合set类似，但创建后不能修改。它的主要用途包括：

作为字典的键（因为它是不可变的）
作为另一个集合的元素

fs = frozenset([1, 2, 3])
d = {fs: 'value'}  # 合法

总结

Python的集合是一种强大而高效的数据结构，特别适合处理需要唯一性和集合运算的场景。通过掌握集合的各种操作和方法，可以编写出更简洁、更高效的Python代码。无论是数据去重、快速查找还是复杂的关系运算，集合都能提供出色的解决方案。

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

433

395

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.68 K

989

Python集合(set)完全指南：从基础到高级操作

什么是Python集合(set)

集合的创建与初始化

集合的基本操作

添加元素

删除元素

集合运算

基本集合运算

集合关系判断

集合的实用场景

集合的性能特点

不可变集合(frozenset)

总结

热门内容推荐

最新内容推荐

项目优选

Python集合(set)完全指南：从基础到高级操作

什么是Python集合(set)

集合的创建与初始化

集合的基本操作

添加元素

删除元素

集合运算

基本集合运算

集合关系判断

集合的实用场景

集合的性能特点

不可变集合(frozenset)

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选