본문 바로가기
728x90
반응형
SMALL

Visual Intelligence74

Object Detection (객체 탐지) Object Detection (객체 탐지) Object Detection은 이미지나 비디오 내의 자동차, 사람, 동물, 물건 등의 위치와 종류를 알아내는 것을 Object Detection이라고 한다. Object Detection은 2012년 이전에는 모두 영상 처리 알고리즘으로 해결했으나, 2012년 AlexNet이 나타나고 부터는 딥러닝을 활용하여 문제를 처리하고 있다. Object Detection = Object Classification + Object Localization = Object Classification with Localization Object Classification using softmax 이미지에서 물체를 예측하기 위해서는 이미지를 ConvNet에 넣어주고, 출력 층.. 2022. 9. 3.
[시각 지능] Coffee Classification Coffee Classification 커피의 종류는 에스프레소, 아메리카노, 카푸치노, 카페 라떼, 카페 모카 등 다양한 메뉴가 있다. 구글에서 크롤링을 통해 이미지를 수집한다. 아메리카노, 라떼, 모카를 분류한다. import os import glob import math import shutil import numpy as np import tensorflow as tf from tensorflow.keras.layers import Dropout, Dense, GlobalAveragePooling2D from tensorflow.keras.applications import MobileNet from tensorflow.keras.models import Sequential from tensor.. 2022. 8. 28.
[시각 지능] COVID-19 Radiography COVID-19 Radiography 카타르 도하의 카타르 대학교와 방글라데시 다카 대학교의 연구진과 파키스탄, 말레이시아의 협력자들이 의사들과 협력하여 COVID-19 양성 사례에 대한 흉부 X선 영상 데이터베이스를 만들었다. 정상 및 바이러스성 폐렴 이미지, COVID-19, 정상 및 기타 폐 감염 데이터 세트로 구성되어 있다. 3616건의 COVID-19 양성 사례와 10,192건의 정상, 6012건의 Lung Opacity (비-COVID 폐 감염), 1345건의 바이러스성 폐렴 이미지 및 해당 폐 마스크로 데이터베이스를 확장했다. 캐글의 데이터셋을 다운로드하여 구글 드라이브에 업로드 후, 마운트를 진행한다. import os import glob import numpy as np import m.. 2022. 8. 27.
[시각 지능] Chest X-Ray Images (Pneumonia) Chest X-Ray Images (Pneumonia) 정상 흉부 X-선 (왼쪽 패널)은 이미지에서 비정상적인 혼탁 영역이 없는 깨끗한 폐를 나타낸다. 세균성 폐렴 (가운데)은 일반적으로 이 경우 우상엽 (흰색 화살표)에서 국소 대엽 경화 (lobar lobar consolidation)를 나타내는 반면, 바이러스성 폐렴 (오른쪽)은 양쪽 폐에서 더 확산된 '간질' 패턴으로 나타난다. 데이터 세트는 3개의 폴더 (train, test, val)로 구성되며 각 이미지 범주 (Pneumonia/Normal)에 대한 하위 폴더를 포함한다. 5,863개의 X-Ray 이미지 (JPEG)와 2개의 카테고리 (폐렴/정상)가 있다. 흉부 X선 영상 (전후부)은 광저우에 있는 광저우 여성 아동 의료 센터에서 1세에서 5.. 2022. 8. 27.
[시각 지능] Brain Tumor Classification (MRI) Brain Tumor Classification (MRI) 뇌종양은 어린이와 성인 사이에서 공격적인 질병 중 하나로 간주된다. 뇌종양은 모든 원발성 중추신경계 (CNS) 종양의 85~90%를 차지한다. 매년 약 11,700명이 뇌종양 진단을 받는다. 암성 뇌 또는 CNS 종양이 있는 사람들의 5년 생존율은 남성의 경우 약 34%, 여성의 경우 36%이다. 뇌종양은 양성종양, 악성종양, 뇌하수체종양 등으로 분류된다. 환자의 기대수명을 향상시키기 위해서는 적절한 치료와 계획, 정확한 진단이 이루어져야 한다. 뇌종양을 탐지하는 가장 좋은 방법은 자기공명영상촬영 (MRI)이다. 스캔을 통해 엄청난 양의 이미지 데이터가 생성된다. 이 이미지는 방사선 전문의가 검사한다. 캐글에서 Brain Tumor Classif.. 2022. 8. 21.
[시각 지능] imgaug imgaug imgaug는 기계 학습 실험에서 이미지 증강을 위한 라이브러리이다. 다양한 증강 기술을 지원하고, 이들을 쉽게 결합하고 무작위 순서로 또는 여러 CPU 코어에서 실행할 수 있으며, 단순하지만 강력한 확률론적 인터페이스를 가지고 있으며, 이미지뿐만 아니라 키포인트 / 랜드마크, 경계 상자, 히트맵 및 세분화 맵을 포함한다. https://imgaug.readthedocs.io/en/latest/ imgaug — imgaug 0.4.0 documentation © Copyright 2020, Alexander Jung Revision 7443efbf. imgaug.readthedocs.io 2022. 8. 21.
[시각 지능] Image Data Augmentation + Transfer Learning Image Data Augmentation import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.applications import MobileNet, Xception from tensorflow.keras.layers import Flatten, Dense, Dropout, GlobalAveragePooling2D from tensorflow.keras.preprocessing.image import ImageDataGenerator !wget https://storage.googleapis.com/mledu-datasets/cats_and_dogs_filtered.zip import os .. 2022. 8. 20.
[시각 지능] Image Data Augmentation Image Data Augmentation 원본 이미지에 적절한 변형을 가해서 새로운 데이터를 만들어 내는 방식으로, 다양한 데 이터를 통해 딥러닝 성능향상 기대할 수 있다. TensorFlow는 이미지 데이터 보강을 위한 ImageDataGenerator class를 제공한다. ImageDataGenerator에서는 입력 파라미터를 통해서 rescale, rotation_range, width_shift_range, height_shift_range, shear_range, horizontal_flip, vertical_filp 등의 다양한 변화를 줄 수 있다. ImageDataGenerator를 사용할 경우 flow(), flow_from_directory() 등의 함수를 통해 이미 지 데이터를 보강.. 2022. 8. 20.
[시각 지능] 사전 학습 모델 (Pre-Trained Model) 사전 학습 모델 (Pre-Trained Model) 사전 학습 모델이란 기존에 자비어 (Xavier) 등 임의의 값으로 초기화하던 모델의 가중치들을 다른 문제 (task)에 학습시킨 가중치들로 초기화하는 방법이다. from tensorflow.keras.applications import VGG16, ResNet50, MobileNet, InceptionV3 mobilenet_model = MobileNet(weights = 'imagenet', include_top = True, input_shape = (224, 224, 3)) mobilenet_model.summary() Model: "mobilenet_1.00_224" ___________________________________________.. 2022. 8. 20.
[시각 지능] 전이 학습 (Transfer Learning) 전이 학습 (Transfer Learning) CNN 기반의 딥러닝 모델을 훈련시키려면 많은 양의 데이터가 필요하지만 큰 데이터셋을 얻 는 것은 쉽지 않다. 이러한 현실적인 어려움을 해결한 것이 전이 학습인데, 전이 학습은 ImageNet처럼 아주 큰 데이터셋을 써서 사전 학습 모델 (pre-trained model)의 가중치를 가져와 분석하려는 데이터에 맞게 보정해서 사용하는 것을 의미한다. 특징 추출기 (feature extractor)는 컨볼루션 층과 풀링 층의 조합으로 구성되어 있으며 ImageNet 데이터에 대해 이미 학습되어 있다. 분류기 (classifier)는 완전 연결 층 (Dense) 조합으로 구성되며 이미지에 대한 정답을 분류하는 역할을 한다. Cats and Dogs 고양이와 개 이.. 2022. 8. 14.
728x90
반응형
LIST