object detection에서 사용되는 일종의 ‘도구’이다. object detection에서 객체는 bounding box(경계선이 있는 박스) 형태로 인식된다. 최근엔 bounding box가 꼭 직사각형의 형태가 아니라 객체를 부드럽게 감싸는 geometric shape을 통칭한다. 이는 객체의 location, size를 정의하고 객체 조작, 분석을 용이하게 한다.
IoU는 서로 다른 두 bounding box A, B에서 교집합에 해당하는 영역의 비율을 나타낸다.
$$ \operatorname{IoU}=\frac{A\cap B}{A\cup B} $$
IoU threshold
: object detection에서 ground-truth에 해당하는 bounding box와 모델이 탐지한 bounding box의 IoU가 threshold
이상일 때 정답으로 판단한다.
많은 연구에서 0.5
를 채택하고 있다.
TP
: GT와 겹치는 PredictionFP
: GT가 아닌데 Prediction에 있는 부분FN
: GT인데 아예 Prediction에 없는 부분IoU가 threshold 이상인 bounding box는 다수 존재할 수 있다.
같은 class로 분류되고 서로 겹치는 bounding box 중에서 **가장 높은 IoU score를 갖는 bounding box만 남기는 ‘후처리 과정’**이다.
후처리하는 과정은 구현에 따라 달라질 수 있다.
일반적인 과정
candidate window에 대한 어떤 점수(e.g. confidence score)를 기준으로 정렬한다.
각 candidate window를 순환하며 아래를 반복
threshold
이상인 다른 candidate을 찾는다.threshold
이상인 다른 candidate이 없을 때까지 반복한다.모든 candidate window에 대해 반복하고 종료한다.