들어가기에 앞서

상호 배타적 집합 (Disjoint Set)

- 서로 중복되지 않는 부분 집합들로 나눠진 원소들에 대한 정보를 저장하고 조직하는 자료 구조

- 공통 원소가 없는 부분 집합들로 나누어진 원소들에 대한 자료구조

- 서로소 집합 자료구조

 

유니온 파인드

- 그래프 알고리즘, 합집합 찾기의 의미를 가짐

- 상호 배타적 집합 이라고도 한다.

- 여러 노드가 존재할 때 두 개의 노드를 선택하여 현재 두 노드가 서로 같은 그래프에 속하는지 판별하는 알고리즘

- 유니온과 파인드 크게 3가지 연산으로 이루어져 있습니다.

 

> Make-Set : 초기화, x를 유일한 원소로 하는 새 집합을 생성

> Union 연산 :  x가 어떤 집합에 포함되어 있는지 찾는 연산

> Find 연산 : x와 y가 포함되어 있는 집합을 합치는 연산

 

 

 

유니온 파인드 어디에 사용하는 걸까?

- 전체 집합을 구성 원소들이 겹치지 않도록 분할하는 데 자주 사용

- Krusakl MST 알고리즘 에서 새로 추가할 간선이 사이클을 형성하는지 판단

 

 

C언어로 구현한 유니온 파인드

int root[MAX_SIZE];
int rank[MAX_SIZE];
for (int i = 0; i < MAX_SIZE; i++) {
  root[i] = i;
  rank[i] = 0;
}


int find(int x) {
  if (root[x] == x) {
      return x;
  } else {
      return root[x] = find(root[x]);
  }
}


void union(int x, int y){
   x = find(x);
   y = find(y);

   if(x == y)
     return;

   if(rank[x] < rank[y]) {
     root[x] = y;
   } else {
     root[y] = x;

     if(rank[x] == rank[y])
       rank[x]++;
   }
}

 

참고 및 소스코드 블로그

https://gmlwjd9405.github.io/2018/08/31/algorithm-union-find.html

 

[알고리즘] Union-Find 알고리즘 - Heee's Development Blog

Step by step goes a long way.

gmlwjd9405.github.io

 

신장 트리, 스패닝 트리 (Spanning Tree)

- N개의 정점으로 이루어진 무방향 그래프에서 N개의 모든 정점과 N - 1개의 간선으로 만들어진 트리

 

최소 비용 신장 트리 (Minimum Cost Spanning Tree)

- 무방향 가중치 그래프에서 신장 트리를 구성하는 간선들의 가중치 합이 최소인 신장 트리

- 여기서 의미하는 가중치란 비용, 거리, 시간 등을 의미한다.

 

크루스칼 알고리즘 (Kruskal Algorithm)

- 최소 비용 신장 트리를 구할 수 있는 효과적인 알고리즘

- 가중치가 높은 간선을 제거하면서 최소 비용 신장 트리를 만드는 방법

- 탐욕적인 (Greedy한) 방법임 

 

크루스칼 알고리즘의 동작 방식 - 1 (가중치가 높은 간선을 제거하는 방식)

1. 그래프의 모든 간선을 가중치에 따라 내림차순으로 정렬

2. 그래프에서 가중치가 가장 높은 간선을 제거 (이 때, 정점을 그래프에서 분리시키는 간선은 제거할 수 없음)

-> 즉 간선을 제거했을 떄 더이상 그래프가 이어지지 않고 끊어지면 안된다는 말

3. 그래프의 간선이 N - 1개 남을 때 까지 2를 반복

 

크루스칼 알고리즘의 동작 방식 - 2 (가중치가 낮은 간선을 삽입하면서 만드는 방식)

1. 그래프의 모든 간선을 가중치에 따라 오름차순으로 정렬

2. 그래프의 가중치가 제일 낮은 간선을 삽입 (이 때, 사이클을 형성하는 간선은 삽입할 수 없음)

-> 즉, 간선을 놓았을 때 그래프가 사이클을 이루게 되면 안 된다는 말

3. 그래프의 간선이 N - 1개 남을 때 까지 2를 반복

 

 

그렇다면, 이 그래프가 사이클을 이루고 있는지는 어떻게 알아?

-> 유니온 파인드(Union-find) 알고리즘을 이용해 확인 할 수 있다.

 

Kruskal 알고리즘의 시간 복잡도는?

- 간선들을 정렬하는 초기 시간에 좌우

- 간선 e개를 효율적으로 정렬한다면 O(eloe2e)로 해결 가능

 

 

 

참고한 글 (자세한 설명)

https://blog.naver.com/diddnjs02/222000205465

collections의 counter 객체를 사용하는 방법을 배워보았다.

카운터 객체는 아이템에 대한 개수를 계산해 딕셔너리로 리턴하며, 다음과 같이 사용한다

from collections import Counter
a = [1, 1, 1, 1, 2, 2, 2, 3, 3, 4]
print(Counter(a).most_common())

실행시 -> [(1, 4), (2, 3), (3, 2), (4, 1)]

 

열거형 enumerate > iterable한 요소를 순서대로 (인덱스(0부터), 값) 순으로 반환해줌

파이썬에서 True, False는 각각 1, 0의 값을 가진다

print(int(True)), print(int(False))를 해보면 알 수 있는데

이를 이용해서 결과값을 출력할 때

 

print([ans, -1][ans == float('inf')])와 같이도 응용해서 쓸 수 있다

와 진짜 깔끔하다..

 

물론

print(1 if ans else 0 ) 같은 직관적인 코드를 자주 사용하겠지만

새로운 사실을 배워간다는건 언제나 즐겁다.

+ Recent posts