본문 바로가기
728x90
반응형
SMALL

AI-driven Methodology76

[ANN] CNN in the image area Weight parameter 감소 DNN에 비해 CNN에서는 weight의 수가 현저하게 줄어들면서도 edge 정보 등 수많은 위치 정보들을 그대로 유지하면서 feature를 확보한다. DNN은 fully connected layer 구조이다. 이것은 이전의 모든 neuron들이 다음 각각 neuron들에 전부 연결되어 있다. 따라서 이미지가 학습 데이터로 입력되면 굉장히 많은 parameter (weight)가 발생한다. 결과적으로 각각의 weight의 최적화를 위해 학습이 굉장히 오래걸리게 된다. Weight sharing / Sparse connection DNN에서는 하나의 출력값에 각각 다른 가중치들이 사용되고 있다. 반면, CNN은 하나의 출력값에 같은 가중치들이 사용되고 있다. 다시말해, .. 2021. 12. 29.
[Computer Vision] 이미지 다루기 이미지 읽기 cv2.imread (fileName, flag) 함수를 이용하여 이미지 파일을 읽는다. 이미지 파일의 경로는 절대 / 상대 경로가 설정할 수 있다. import cv2 img = cv2.imread('xx.jpg', cv2.IMREAD_COLOR) # read xx.jpg ◦ parameters: fileName (str) – 이미지 파일의 경로, flag (int) – 이미지 파일을 읽을 때의 option ◦ returns: image 객체 행렬 ◦ return type : numpy.ndarray ◦ cv2.IMREAD_COLOR : 이미지 파일을 color로 읽음. 투명한 부분은 무시되며, default 값 ◦ cv2.IMREAD_GRAYSCALE : 이미지를 grayscale로 읽음.. 2021. 12. 21.
[Computer Vision] 블록 매칭 및 3D 필터링 (Block-Matching and 3D filtering, BM3D) 블록 매칭 및 3D 필터링 (Block-Matching and 3D filtering, BM3D) 블록 일치 및 3D 필터링 (BM3D)은 주로 이미지의 noise 감소에 사용되는 3D 블록 일치 알고리즘이다. non-local means methodology의 확장 중 하나이다. BM3D에는 hard-thresholding 및 Wiener filter 단계와 둘 다 그룹화 (grouping), 협업 필터링 (collaborative filtering) 및 집계 (aggregation) 부분을 포함한다. 이 알고리즘은 변환 사이트의 증강 표현에 따라 다르다. Method 1. Grouping 이미지 조각은 유사성을 기반으로 함께 grouping되지만 표준 k-means 클러스터링 및 클러스터 분석 방법과.. 2021. 12. 15.
[ANN] 순환 신경망 (Recurrent Neural Network, RNN) (2) 매개변수 순환 신경망의 매개변수 (가중치 집합)는 Θ = 𝐔𝐔,𝐖𝐖, 𝐕𝐕, 𝐛𝐛, 𝐜𝐜 이다. 𝐔𝐔 : 입력층과 은닉층을 연결하는 p*d 행렬 𝐖𝐖 : 은닉층과 은닉층을 연결하는 p*p 행렬 𝐕𝐕 : 은닉층과 출력층을 연결하는 q*p 행렬 𝐛𝐛, 𝐜𝐜 : 바이어스로서 각각 p*1과 q*1 행렬 RNN 학습이란 훈련 집합을 최적의 성능으로 예측하는 Θ 값을 찾는 일을 말한다. 가중치 𝐮𝐮𝑗𝑗 = 𝑢𝑢𝑗𝑗1, 𝑢𝑢𝑗𝑗2, ⋯ , 𝑢𝑢𝑗𝑗𝑑𝑑 는 𝐔𝐔 행렬의 j번째 행 (ℎ𝑗𝑗에 연결된 에지의 가중치들) Vanishing Gradient Problem RNN 역시 경사하강법과 오류 역전파 (backpropagation)를 이용해 학습한다. 학습 데이터의 길이가 길어질수록 먼 과거의 정보를 현재에 전달하기 힘.. 2021. 12. 14.
[ANN] 순환 신경망 (Recurrent Neural Network, RNN) (1) 순환 신경망 (Recurrent Neural Network, RNN) RNN은 hidden node가 방향을 가진 edge로 연결돼 순환구조 (directed cycle)를 이루는 인공신경망의 한 종류이다. 입력과 출력을 시퀀스 단위로 처리하는 모델이다. 순환 신경망은 시계열 데이터 처리에 알맞게 변형된 딥러닝 구조이다. Sequence Data를 학습하여 Classification 또는 Prediction을 수행한다. 은닉 계층 안에 하나 이상의 순환 계층을 갖는다. 하나의 파라미터 쌍 (가중치와 편향)을 각 시간대 데이터 처리에 반복 사용한다. 시간대와 시간대 사이에 순환 벡터를 이용해 정보를 전달한다. 일정 시간 동안 모든 값이 계산되면, 모델을 학습하기 위해 결과값과 목표값의 차이를 loss fu.. 2021. 12. 14.
[Computer Vision] Morphological Operations 형태학적 연산 (Morphological Operations) kernel과 이미지를 convolution하여 수행할 수 있는 기본 연산이다. 변환은 binary 이미지에서 수행된다. 작업은 침식, 팽창, 열기, 닫기 및 기타 등이 있다. 이진화한 이미지에서는 같은 값을 가진 픽셀이 이웃하여 있으면 이를 형태학적 영역(morphological region)으로 생각할 수 있다. 이미지의 형태학적 변환(morphological transformation)은 이미지 필터링을 사용하여 영역을 변화시키는 방법이다. 변환에 적용할 커널은 getStructuringElement 함수로 생성한다. getStructuringElement(shape, ksize) shape : 커널 모양 cv2.MORPH_RECT: 사.. 2021. 12. 13.
[Computer Vision] Edge Detection Edge Detection 이미지의 edge를 감지하면 존재하는 물체를 식별할 수 있다. 따라서 CV의 중요한 사용 사례이다. 경계선을 인지하는 것 엣지 추출(edge detection)이라고 한다. 엣지 (경계선)는 이미지 안에서 픽셀의 값이 갑자기 변하는 곳이다. 따라서 엣지 추출을 하는 알고리즘은 이미지를 미분한 그레디언트 (gradient) 벡터의 크기로 판단한다. edge는 이미지의 인접한 pixel 강도의 상당한 변화에 의해 형성된다. 대표적인 엣지 추출 알고리즘으로 Sobel edge Detection과 Canny edge Detection이 있다. Sobel Edge Detection Sobel 검출기는 이미지의 pixel 기울기를 계산한다. pixel 강도가 밝은 곳에서 어두운 곳으로 변.. 2021. 12. 11.
[Computer Vision] Image Sharpening Image Sharpening 이미지 샤프닝 (Image Sharpening)은 blurring의 반대이다. 주변 pixel의 변화를 강조하여 edge가 더 선명하게 보인다. 2021. 12. 11.
[Computer Vision] Image Filtering 이미지 필터링 (Image Filtering) 이미지의 가장자리를 흐리게 하거나 선명하게 하거나 감지하는 등 다양한 용도로 사용할 수 있다. 여기에는 2D kernel 행렬로 이미지의 convolution을 수행하는 작업이 포함된다. convolution에는 입력 이미지 위로 kernel을 슬라이딩하고 요소별 곱셈을 수행한 다음 덧셈을 수행하는 작업이 포함된다. 이미지 필터링 (image filtering)은 필터 (filter) 또는 커널 (kernel) 또는 윈도우 (window)라고 하는 정방 행렬을 정의하고 이 커널을 이동시키면서 같은 이미지 영역과 곱하여 그 결과값을 이미지의 해당 위치의 값으로 하는 새로운 이미지를 만드는 연산이다. 기호 ⊗로 표기한다. filter2D() "filter2D().. 2021. 12. 10.
컴퓨터 비전 (Computer Vision) 컴퓨터 비전 (Computer Vision, CV) AI에서 가장 뜨거운 주제 중 하나이다. CV는 이미지/비디오 데이터를 분석하고 다양한 기계 학습 알고리즘을 사용하여 기계에 계산 기능을 다룬다 . 추상적으로, 인간과 같은 시각적 추론의 기술을 기계에 부여하는 것을 포함한다. CV를 시작하려면 컴퓨터 과학의 다양한 측면에 대한 지식이 필요하다. 또한, 자율주행차, 로봇은 물론 다양한 사진 보정 앱에서 엄청난 발전을 이루고 있다. 개체 감지에 있어 꾸준한 발전이 매일 이루어지고 있다. OpenCV 이미지 처리는 의도한 조작을 얻기 위해 이미지에 몇 가지 작업을 수행하는 것이다. 새로운 데이터 분석을 시작할 때 일부 데이터 전처리 및 기능 엔지니어링을 수행한다. 이미지 처리도 마찬가지다. 사진에서 유용한 .. 2021. 12. 10.
728x90
반응형
LIST