一 什么是集合(set)

集合(Set)是一种 无序、可变 的数据容器, 用于存放 不重复的元素

在 Python 中,可以通过 {}set() 创建集合。

fruits = {"apple", "banana", "cherry"}
print(fruits)   # {'banana', 'cherry', 'apple'}

集合中的元素是 唯一的,如果你放入重复项,Python 会自动去重。

nums = {1, 2, 2, 3, 3, 3}
print(nums)  # {1, 2, 3}

二 创建集合的几种方式

1. 使用花括号 {}

colors = {"red", "green", "blue"}

2. 使用 set() 函数

numbers = set([1, 2, 3, 4])

3. 创建空集合

注意:创建空集合必须用 set(), 因为 {} 默认是一个空字典。

empty_set = set()
print(type(empty_set))  # <class 'set'>

三 集合的常见操作

1. 添加元素

s = {1, 2, 3}
s.add(4)
print(s)  # {1, 2, 3, 4}

2. 更新(合并)多个元素

s.update([5, 6, 7])
print(s)  # {1, 2, 3, 4, 5, 6, 7}

3. 删除元素

s.remove(3)      # 删除指定元素,不存在时报错
s.discard(10)    # 删除指定元素,不存在也不报错
s.pop()          # 随机删除一个元素
s.clear()        # 清空集合

四 集合的运算(重点)

集合支持多种数学意义上的集合运算,非常直观。

假设我们有以下两个集合:

A = {1, 2, 3, 4}
B = {3, 4, 5, 6}
运算符号示例结果
并集```AB`{1, 2, 3, 4, 5, 6}
交集&A & B{3, 4}
差集-A - B{1, 2}
对称差集^A ^ B{1, 2, 5, 6}

示例代码:

print(A | B)  # 并集
print(A & B)  # 交集
print(A - B)  # 差集
print(A ^ B)  # 对称差集

五 集合的关系运算

集合之间可以比较包含关系:

A = {1, 2, 3}
B = {1, 2, 3, 4, 5}

print(A < B)   # True,A 是 B 的子集
print(B > A)   # True,B 是 A 的超集
print(A == B)  # False
print(A != B)  # True

六 集合推导式

Python 同样支持 集合推导式(set comprehension), 可以快速生成集合。

squares = {x**2 for x in range(1, 6)}
print(squares)  # {1, 4, 9, 16, 25}

还可以加条件过滤:

even_squares = {x**2 for x in range(1, 11) if x % 2 == 0}
print(even_squares)  # {4, 16, 36, 64, 100}

七 集合的去重功能

集合最常见的用途之一就是 去重

numbers = [1, 2, 2, 3, 3, 4]
unique_numbers = list(set(numbers))
print(unique_numbers)  # [1, 2, 3, 4]

注意:集合是无序的,因此去重后的顺序可能与原列表不同。


八 集合的遍历

集合是可迭代的,可以直接用 for 遍历:

fruits = {"apple", "banana", "cherry"}
for fruit in fruits:
    print(fruit)

由于集合无序,输出顺序可能每次都不一样。


九 集合的不可变版本:frozenset

在某些场景中,我们希望集合也能作为字典的键或放入另一个集合中。 这时可以使用 不可变集合(frozenset)

A = frozenset([1, 2, 3])
B = frozenset([3, 4, 5])

print(A | B)  # {1, 2, 3, 4, 5}

frozenset 支持所有集合运算,但不支持修改(add、remove 等)。


十 实战案例:网站用户分析

假设我们要分析两个网站的访问用户重叠情况:

site_A = {"Tom", "Lucy", "Jack", "Emma"}
site_B = {"Lucy", "Emma", "John"}

print("A站用户:", site_A)
print("B站用户:", site_B)
print("同时访问两站的用户:", site_A & site_B)
print("只访问A站的用户:", site_A - site_B)
print("所有用户:", site_A | site_B)

输出结果:

同时访问两站的用户: {'Lucy', 'Emma'}
只访问A站的用户: {'Jack', 'Tom'}
所有用户: {'Jack', 'Lucy', 'Emma', 'Tom', 'John'}

十一 小结

特点说明
是否有序 无序
是否可变 可变(frozenset 为不可变)
是否允许重复 不允许
创建方式{}set()
主要功能去重、集合运算、关系判断
常用操作add()update()remove()union()intersection()
推导式支持集合推导式

总结

  1. 集合(set)是无序且不重复的容器。
  2. 常用于数据去重、过滤和集合关系计算。
  3. 支持数学集合的四大运算:并集、交集、差集、对称差集。
  4. 可以使用集合推导式快速生成集合。
  5. 如果需要不可变集合,可使用 frozenset

本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:[email protected]