Python 集合全面解析

一、集合核心特性

1. 无序性与唯一性

无序性：集合中的元素没有固定顺序，无法通过索引访问。
唯一性：自动过滤重复元素，确保每个元素唯一。

python">unique_set = {1, 2, 2, "苹果", "苹果"}  # 输出：{1, 2, "苹果"}

2. 可变性

集合支持动态添加或删除元素，但元素本身必须是可哈希的（不可变类型如字符串、数字、元组）。

python">valid_set = {"Yant", 2025, (1, 2)}  # 合法  
invalid_set = {["Python"]}          # 报错：列表不可哈希

3. 高效查询

基于哈希表实现，in 操作时间复杂度为 O(1)，适合高频查询。

python">skills = {"Python", "AI", "数据分析"}  
print("Python" in skills)  # 输出：True（耗时仅0.000003秒）

二、集合的创建与基础操作

1. 创建方式

方法	示例代码	说明
直接定义	s1 = {1, “Yant”, 3.14}	元素唯一且不可变
空集合	s2 = set()	不可用 {}（会创建空字典）
转换其他类型	s3 = set([1, 2, 2])	列表去重后转为集合

2. 增删改操作

方法	功能说明	示例
add()	添加单个元素	s1.add(4) → {1, “Yant”, 3.14, 4}
update()	批量添加可迭代对象元素	s1.update([5, 6]) → 扩展集合
remove()	删除指定元素（不存在时报错）	s1.remove(1) → {“Yant”, 3.14, 4}
discard()	安全删除元素（不存在时不报错）	s1.discard(99) → 无变化
clear()	清空所有元素	s1.clear() → set()

三、集合的数学运算

1. 基础运算符与方法

运算类型	运算符	方法	示例
并集	\|	union()	{1, 2}\|{2, 3} → {1, 2, 3}
交集	&	intersection()	{1,2} & {2,3} → {2}
差集	-	difference()	{1,2} - {2} → {1}
对称差集	^	symmetric_difference()	{1,2} ^ {2,3} → {1,3}

2. 集合关系判断

子集/超集：

python">a = {1, 2}  
b = {1, 2, 3}  
print(a.issubset(b))    # 输出：True  
print(b.issuperset(a))  # 输出：True [6,7]

无交集判断：

python">print(a.isdisjoint({4,5}))  # 输出：True [7]

四、集合对象的内置方法

方法	功能说明	示例
copy()	创建集合的浅拷贝	s_copy = s1.copy()
pop()	随机删除并返回一个元素（空集合报错）	s1.pop() → 随机元素
len()	获取元素数量	len(s1) → 3
frozenset()	创建不可变集合（可哈希，可作为字典键）	fs = frozenset({1,2})

五、高级应用场景

1. 数据去重与清洗

python">raw_data = ["Yant", "Python", "Yant", "AI"]  
cleaned_data = list(set(raw_data))  # 去重 → ["Yant", "Python", "AI"] [4,8]

2. 快速过滤无效数据

python">valid_items = {"A", "B", "C"}  
input_data = ["A", "X", "B"]  
cleaned = [x for x in input_data if x in valid_items]  # → ["A", "B"] [4]

3. 社交关系分析

python">yant_friends = {"Bob", "Charlie"}  
alice_friends = {"Bob", "Diana"}  
common = yant_friends & alice_friends  # 共同好友 → {"Bob"} [3,8]

六、性能优化与避坑指南

1. 性能对比

数据结构	100万元素查询耗时	适用场景
列表	3.2秒	需保留顺序的动态数据
集合	0.000003秒	高频查询、去重、集合运算

2. 常见错误

空集合陷阱：{} 是空字典，空集合需用 set() 。
默认参数问题：避免将可变集合作为函数默认参数。
顺序依赖：集合无序，需顺序时改用有序字典或列表。

总结
Python集合凭借其唯一性、高效查询和丰富的集合运算，成为数据去重、关系分析和高频查询场景的利器。掌握其核心特性与方法（如add()、union()、issubset()），结合frozenset等高级用法，能显著提升代码效率。需注意集合的无序性和元素不可变性限制，合理选择数据结构以满足需求。

Python 集合全面解析

一、集合核心特性

1. 无序性与唯一性

2. 可变性

3. 高效查询

二、集合的创建与基础操作

1. 创建方式

2. 增删改操作

三、集合的数学运算

1. 基础运算符与方法

2. 集合关系判断

四、集合对象的内置方法

五、高级应用场景

1. 数据去重与清洗

2. 快速过滤无效数据

3. 社交关系分析

六、性能优化与避坑指南

1. 性能对比

2. 常见错误

相关文章

数据结构——双向链表dlist

【PyTorch】.pt文件

pnpm config set ignore-workspace-root-check true

【后端】【django】Django DRF `@action` 详解：自定义 ViewSet 方法

springboot基于session实现登录

EditRocket for Mac v5.0.2 文本编辑器支持M、Intel芯片

c语言数据结构——单向不带头不循环链表的实现

reactive数据修改无效

Python 集合全面解析

一、集合核心特性

1. ​无序性与唯一性

2. ​可变性

3. ​高效查询

二、集合的创建与基础操作

1. ​创建方式

2. ​增删改操作

三、集合的数学运算

1. ​基础运算符与方法

2. ​集合关系判断

四、集合对象的内置方法

五、高级应用场景

1. ​数据去重与清洗

2. ​快速过滤无效数据

3. ​社交关系分析

六、性能优化与避坑指南

1. ​性能对比

2. ​常见错误

相关文章

1. 无序性与唯一性

2. 可变性

3. 高效查询

1. 创建方式

2. 增删改操作

1. 基础运算符与方法

2. 集合关系判断

1. 数据去重与清洗

2. 快速过滤无效数据

3. 社交关系分析

1. 性能对比

2. 常见错误