본문 바로가기
728x90
반응형
SMALL

Visual Intelligence/Object Detection14

[Object Detection] YOLO Inference YOLO Inference 입력 이미지를 7 x 7 그리드 셀로 나누며, 각각의 그리드 셀에 들어있는 2개의 bounding box 정보와 물체의 클래스 정보가 들어있는 7x7x (5+5+20) 데이터가 YOLO 예측 결과이다. 1st bounding box of a grid cell 2nd bounding box of a grid cell Class score class-specific confidence score 계산 YOLO에서는 동일한 객체에 대하여 많은 bounding box가 잡힐 수 있다. 98개 bbox 각각이 가지고 있는 class specific confidence score에 대해서 각 20개의 클래스에 대해 신뢰도가 가장 높은 bbox만 남기고 나머지 bbox를 없애는 NMS (n.. 2022. 9. 3.
[Object Detection] labelimg labelimg LabelImg는 그래픽 이미지 주석 도구이다. Python으로 작성되었으며 그래픽 인터페이스에 Qt를 사용한다. 주석은 ImageNet에서 사용하는 형식인 PASCAL VOC 형식의 XML 파일로 저장된다. 또한, YOLO 및 CreateML 형식도 지원한다. 윈도우의 경우 https://github.com/heartexlabs/labelImg/releases/tag/v1.8.1에서 windows_v1.8.1.zip을 다운받는다. 압축 푼 후 디렉토리는 C: 또는 D: 바로 아래에 있어야 한다. 즉, D:/labelImg와 같이 위치해야 하며, 만약 D:/Test/labelImg 같이 임의의 디렉토리의 서브디렉토리면 실행이 되지 않는 경우가 많다. # 설치 pip3 install lab.. 2022. 9. 3.
[Object Detection] YOLO (You Only Look Once) YOLO (You Only Look Once) YOLO는 You Only Look Once 약어로써, 2015년 Joseph Redmon이 워싱턴 대학교에서 친구들과 함께 YOLO 아키텍처와 논문을 발표했다. 당시만 해도 two-shot-detection 방식인 Faster R-CNN (Region with CNN)가 가장 좋은 성능을 냈지만 실시간성이 굉장히 부족했다 (7 FPS 최대). 이때, one-shot-detection 방식으로 동작하는 YOLO가 등장하여 평균 45 FPS에서 실행되었으며 빠른 버전의 경우 최대 155 FPS을 기록했다. YOLO 아키텍처 YOLO 아키텍처는 feature extractor로써 Google LeNet+ 5개의 new layer를 사용하며, Flatten lay.. 2022. 9. 3.
Object Detection (객체 탐지) Object Detection (객체 탐지) Object Detection은 이미지나 비디오 내의 자동차, 사람, 동물, 물건 등의 위치와 종류를 알아내는 것을 Object Detection이라고 한다. Object Detection은 2012년 이전에는 모두 영상 처리 알고리즘으로 해결했으나, 2012년 AlexNet이 나타나고 부터는 딥러닝을 활용하여 문제를 처리하고 있다. Object Detection = Object Classification + Object Localization = Object Classification with Localization Object Classification using softmax 이미지에서 물체를 예측하기 위해서는 이미지를 ConvNet에 넣어주고, 출력 층.. 2022. 9. 3.
728x90
반응형
LIST