728x90 반응형 SMALL 시각 지능24 [Object Detection] labelimg labelimg LabelImg는 그래픽 이미지 주석 도구이다. Python으로 작성되었으며 그래픽 인터페이스에 Qt를 사용한다. 주석은 ImageNet에서 사용하는 형식인 PASCAL VOC 형식의 XML 파일로 저장된다. 또한, YOLO 및 CreateML 형식도 지원한다. 윈도우의 경우 https://github.com/heartexlabs/labelImg/releases/tag/v1.8.1에서 windows_v1.8.1.zip을 다운받는다. 압축 푼 후 디렉토리는 C: 또는 D: 바로 아래에 있어야 한다. 즉, D:/labelImg와 같이 위치해야 하며, 만약 D:/Test/labelImg 같이 임의의 디렉토리의 서브디렉토리면 실행이 되지 않는 경우가 많다. # 설치 pip3 install lab.. 2022. 9. 3. [시각 지능] Coffee Classification Coffee Classification 커피의 종류는 에스프레소, 아메리카노, 카푸치노, 카페 라떼, 카페 모카 등 다양한 메뉴가 있다. 구글에서 크롤링을 통해 이미지를 수집한다. 아메리카노, 라떼, 모카를 분류한다. import os import glob import math import shutil import numpy as np import tensorflow as tf from tensorflow.keras.layers import Dropout, Dense, GlobalAveragePooling2D from tensorflow.keras.applications import MobileNet from tensorflow.keras.models import Sequential from tensor.. 2022. 8. 28. [시각 지능] COVID-19 Radiography COVID-19 Radiography 카타르 도하의 카타르 대학교와 방글라데시 다카 대학교의 연구진과 파키스탄, 말레이시아의 협력자들이 의사들과 협력하여 COVID-19 양성 사례에 대한 흉부 X선 영상 데이터베이스를 만들었다. 정상 및 바이러스성 폐렴 이미지, COVID-19, 정상 및 기타 폐 감염 데이터 세트로 구성되어 있다. 3616건의 COVID-19 양성 사례와 10,192건의 정상, 6012건의 Lung Opacity (비-COVID 폐 감염), 1345건의 바이러스성 폐렴 이미지 및 해당 폐 마스크로 데이터베이스를 확장했다. 캐글의 데이터셋을 다운로드하여 구글 드라이브에 업로드 후, 마운트를 진행한다. import os import glob import numpy as np import m.. 2022. 8. 27. [시각 지능] Chest X-Ray Images (Pneumonia) Chest X-Ray Images (Pneumonia) 정상 흉부 X-선 (왼쪽 패널)은 이미지에서 비정상적인 혼탁 영역이 없는 깨끗한 폐를 나타낸다. 세균성 폐렴 (가운데)은 일반적으로 이 경우 우상엽 (흰색 화살표)에서 국소 대엽 경화 (lobar lobar consolidation)를 나타내는 반면, 바이러스성 폐렴 (오른쪽)은 양쪽 폐에서 더 확산된 '간질' 패턴으로 나타난다. 데이터 세트는 3개의 폴더 (train, test, val)로 구성되며 각 이미지 범주 (Pneumonia/Normal)에 대한 하위 폴더를 포함한다. 5,863개의 X-Ray 이미지 (JPEG)와 2개의 카테고리 (폐렴/정상)가 있다. 흉부 X선 영상 (전후부)은 광저우에 있는 광저우 여성 아동 의료 센터에서 1세에서 5.. 2022. 8. 27. [시각 지능] imgaug imgaug imgaug는 기계 학습 실험에서 이미지 증강을 위한 라이브러리이다. 다양한 증강 기술을 지원하고, 이들을 쉽게 결합하고 무작위 순서로 또는 여러 CPU 코어에서 실행할 수 있으며, 단순하지만 강력한 확률론적 인터페이스를 가지고 있으며, 이미지뿐만 아니라 키포인트 / 랜드마크, 경계 상자, 히트맵 및 세분화 맵을 포함한다. https://imgaug.readthedocs.io/en/latest/ imgaug — imgaug 0.4.0 documentation © Copyright 2020, Alexander Jung Revision 7443efbf. imgaug.readthedocs.io 2022. 8. 21. [시각 지능] 전이 학습 (Transfer Learning) 전이 학습 (Transfer Learning) CNN 기반의 딥러닝 모델을 훈련시키려면 많은 양의 데이터가 필요하지만 큰 데이터셋을 얻 는 것은 쉽지 않다. 이러한 현실적인 어려움을 해결한 것이 전이 학습인데, 전이 학습은 ImageNet처럼 아주 큰 데이터셋을 써서 사전 학습 모델 (pre-trained model)의 가중치를 가져와 분석하려는 데이터에 맞게 보정해서 사용하는 것을 의미한다. 특징 추출기 (feature extractor)는 컨볼루션 층과 풀링 층의 조합으로 구성되어 있으며 ImageNet 데이터에 대해 이미 학습되어 있다. 분류기 (classifier)는 완전 연결 층 (Dense) 조합으로 구성되며 이미지에 대한 정답을 분류하는 역할을 한다. Cats and Dogs 고양이와 개 이.. 2022. 8. 14. [시각 지능] Surface Crack Detection Surface Crack Detection Surface Crack Detection은 콘크리트 표면 결함 (concrete surface crack)을 발견하고 예측하기 위한 Kaggle의 공개 데이터이다. 평균적으로 227 x 227 크기를 가지는 color 이미지이며, crack 없는 Negative 데이터 2만개와 crack 발생한 Positive 데이터 2만개, 총 4만 개의 이미지 데이터로 구성되어 있다. 코랩에서 하고자 할 때 zip 파일을 구글 드라이브에 저장하고 마운트한다. import os import tensorflow as tf import tensorflow as tf from tensorflow.keras.layers import Dropout, Dense, Conv2D, Glo.. 2022. 8. 14. [시각 지능] GTSRB GTSRB (German Traffic Sign Recognition Benchmark) GTSRB (German Traffic Sign Recognition Benchmark)는 독일 신경정보학 연구원들이 작성한 것이다. 이것은 교통 표지판 (Traffic Sign)을 예측하기 위한 데이터이며, 평균적으로 32 x 32 크기의 작은 color 이미지와 43개 교통 표지판과 관련된 4만여 개의 이미지를 포함한다. import tensorflow as tf from tensorflow.keras.models import Sequential, Model from tensorflow.keras.layers import Dense, Dropout, Input from tensorflow.keras.layers .. 2022. 8. 13. [시각 지능] false prediction false prediction import tensorflow as tf from tensorflow.keras.layers import Flatten, Dense, Conv2D, MaxPool2D from tensorflow.keras.models import Sequential from tensorflow.keras.optimizers import Adam from tensorflow.keras.datasets import mnist import numpy as np from datetime import datetime import matplotlib.pyplot as plt (x_train, t_train), (x_test, t_test) = mnist.load_data() x_train = x_t.. 2022. 8. 6. [시각 지능] 컨벌루션 (Convolution) 컨벌루션 (Convolution) 수학 (특히 기능 분석)에서 컨벌루션은 함수의 모양이 다른 하나에 의해 수정되는 방식을 나타낸다. 컨볼루션이라는 용어는 결과 함수와 계산 프로세스를 모두 나타낸다. 그것은 하나가 반전되고 이동된 후 두 함수의 곱의 적분으로 정의된다. 적분은 모든 shift 값에 대해 평가되어 컨볼루션 함수를 생성한다. from tensorflow.keras.datasets import mnist import matplotlib.pyplot as plt # mnist data download (x_train, y_train), (x_test, y_test) = mnist.load_data() plt.imshow(x_train[0], cmap='gray') # 1번째 데이터 plt.show.. 2022. 7. 31. 이전 1 2 3 다음 728x90 반응형 LIST