서로소 집합
- 공통 원소가 없는 두 집합
서로소 집합 자료구조
- 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
- 무방향 그래프 내에서의 사이클을 판별할 때 사용
- union, find
- union : 2개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산
- find : 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산
- union-find 자료구조라고도 불림
알고리즘
1. union(합집합) 연산을 확인하여, 서로 연결된 두 노드 A, B를 확인한다.
- A와 B의 루트 노드 A'와 B'를 각각 찾는다.
- A'를 B'의 부모 노드로 설정한다. (B'가 A'를 가리키도록 한다.)
2. 모든 union(합집합) 연산을 처리할 때까지 1번 과정을 반복한다.
* 실제로 구현할 때는 A'와 B'중에서 더 번호가 작은 원소가 부모 노드가 되도록 구현하는 경우가 많다.
과정
초기 단계에서, 노드의 개수 크기의 부모 테이블을 초기화한다.
모든 원소가 자기 자신을 부모로 가지도록 한다.
[union 1, 4]
노드 번호 1번과 4번의 루트 노드를 찾는다.
더 큰 번호에 해당하는 루트 노드 4의 부모를 1로 설정한다.
[union 2, 3]
노드 번호 2번과 3번의 루트 노드를 찾는다.
더 큰 번호에 해당하는 루트 노드 3의 부모를 2로 설정한다.
[union 2, 4]
노드 번호 2번과 4번의 루트 노드를 찾는다.
더 큰 번호에 해당하는 루트 노드 2의 부모를 1로 설정한다.
[union 5, 6]
노드 번호 5번과 6번의 루트 노드를 찾는다.
더 큰 번호에 해당하는 루트 노드 6의 부모를 5로 설정한다.
루트 노드는 즉시 계산할 수 없고, 부모 테이블을 계속해서 확인하며 거슬러 올라가야한다.
위의 그림에서 노드 3의 부모는 2라고 설정되어 있다. 다만, 노드 2의 부모 노드는 1이기 때문에 최종적으로 노드 3의 루트노드는 1이라고 볼 수 있다.
다시 말해, 서로소 집합 알고리즘으로 루트를 찾기 위해서는 재귀적으로 부모를 거슬러 올라가야 한다.
구현
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
# 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
if parent[x] != x:
parent[x] = find_parent(parent, parent[x])
return parent[x]
# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
a = find_parent(parent, a)
b = find_parent(parent, b)
if a < b:
parent[b] = a
else:
parent[a] = b
# 노드의 개수, 간선의 개수
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화
# 부모 테이블에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
parent[i] = i
# union 연산을 각각 수행
for i in range(e):
a, b = map(int, input().split())
union_parent(parent, a, b)
# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합 : ', end = '')
for i in range(1, v+1):
print(find_parent(parent, i), end = ' ')
print()
# 부모 테이블 내용 출력
print('부모 테이블 : ', end = '')
for i in range(1, v+1):
print(parent[i], end = ' ')
시간 복잡도
노드의 개수 V
union 연산 수 M
응용 - 사이클 발생 여부 확인
def find_parent(parent, x):
if parent[x] != x:
parent[x] = find_parent(parent, parent[x])
return parent[x]
def union_parent(parent, a, b):
a = find_parent(parent, a)
b = find_parent(parent, b)
if a<b:
parent[b]=a
else:
parent[a]=b
v, e = map(int, input().split())
parent = [0] * (v+1)
for i in range(1, v+1):
parent[i] = i
cycle = False
for i in range(e):
a, b = map(int, input().split())
# 사이클이 발생한 경우 종료
if find_parent(parent, a) == find_parent(parent, b):
cycle = True
break
else:
union_parent(parent, a, b)
if cycle:
print("사이클 발생함")
else:
print("사이클 발생하지 않음")
댓글