본문 바로가기
Visual Intelligence/Object Detection

[Object Detection] YOLO Inference

by goatlab 2022. 9. 3.
728x90
반응형
SMALL

YOLO Inference

 

입력 이미지를 7 x 7 그리드 셀로 나누며, 각각의 그리드 셀에 들어있는 2개의 bounding box 정보와 물체의 클래스 정보가 들어있는 7x7x (5+5+20) 데이터가 YOLO 예측 결과이다.

 

 

1st bounding box of a grid cell

 

 

2nd bounding box of a grid cell

 

 

Class score

 

 

class-specific confidence score 계산

 

 

YOLO에서는 동일한 객체에 대하여 많은 bounding box가 잡힐 수 있다. 98개 bbox 각각이 가지고 있는 class specific confidence score에 대해서 각 20개의 클래스에 대해 신뢰도가 가장 높은 bbox만 남기고 나머지 bbox를 없애는 NMS  (non-maximum suppression) 알고리즘을 이용하면, 객체에 대한 확률과 객체를 둘러싸고 있는 bbox 위치를 알아낼 수 있다.

 

https://towardsdatascience.com/non-maximum-suppression-nms-93ce178e177c

 

https://docs.google.com/presentation/d/1aeRvtKG21KHdD5lg6Hgyhx5rPq_ZOsGjG5rJ1HP7BbA/pub?start=false&loop=false&delayms=3000&slide=id.p 

 

YOLO

YOLO You Only Look Once: Unified, Real-Time Object Detection Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi

docs.google.com

 

728x90
반응형
LIST