728x90 반응형 SMALL cnn15 자동 음성 인식 (Automatic Speech Recognition) 자동 음성 인식 (Automatic Speech Recognition) 자동 음성 인식 (Automatic Speech Recognition)이란 음성 신호(acoustic signal)를 단어(word) 혹은 음소 (phoneme) 시퀀스로 변환하는 시스템을 가리킨다. 자동 음성 인식 모델은 입력 음성 신호 X(x1, x2, ..., xt)에 대해 가장 그럴듯한 (likely) 음소/단어 시퀀스 Y(y1, y2, ..., yn)를 추정한다. 자동 음성 인식 모델의 목표는 P(Y∥X)를 최대화하는 음소/단어 시퀀스 Y를 추론 (inference)하는 데에 있다. 이를 식으로 표현하면 다음 수식과 같다. P(Y∥X)를 바로 추정하는 모델을 구축하는 것이 가장 이상적이다. 하지만 같은 음소나 단어라 하.. 2024. 7. 3. [Generative Model] 서로 다른 이미지 오토인코더 라이브러리 from matplotlib.pyplot import imshow import numpy as np import cv2 from tensorflow.keras.utils import img_to_array from tensorflow.keras.layers import Conv2D, MaxPooling2D, UpSampling2D from tensorflow.keras.models import Sequential SIZE=256 # Limiting to 256 size image as my laptop cannot handle larger images. img_data = [] img = cv2.imread('einstein.jpg', 1) # Change 1 to 0 for Grey scal.. 2022. 11. 25. [Generative Model] 노이즈 제거 (MNIST) 라이브러리 from tensorflow.keras.datasets import mnist from tensorflow.keras.layers import Conv2D, MaxPooling2D, UpSampling2D from tensorflow.keras.models import Sequential import numpy as np import matplotlib.pyplot as plt (x_train, _), (x_test, _) = mnist.load_data() x_train = x_train.astype('float32') / 255. x_test = x_test.astype('float32') / 255. x_train = np.reshape(x_train, (len(x_train), 28, .. 2022. 11. 25. [Generative Model] 단일 이미지 오토인코더 라이브러리 from matplotlib.pyplot import imshow import numpy as np import cv2 from tensorflow.keras.utils import img_to_array from tensorflow.keras.layers import Conv2D, MaxPooling2D, UpSampling2D from tensorflow.keras.models import Sequential np.random.seed(42) SIZE = 256 img_data = [] img = cv2.imread('monalisa.jpg', 1) # Change 1 to 0 for grey images img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB) # 이미.. 2022. 11. 25. [PyTorch] CNN 라이브러리 import torch import torchvision.datasets as dsets import torchvision.transforms as transforms import torch.nn.init device = 'cuda' if torch.cuda.is_available() else 'cpu' 데이터셋 # 랜덤 시드 고정 torch.manual_seed(0) # GPU 사용 가능일 경우 랜덤 시드 고정 if device == 'cuda': torch.cuda.manual_seed_all(0) # 데이터셋 가져오기 mnist_train = dsets.MNIST(root='MNIST_data/', train=True, transform=transforms.ToTensor(), downl.. 2022. 11. 21. [시각 지능] CNN (Convolutional Neural Network) CNN (Convolutional Neural Network) 합성곱 신경망 (콘볼루션 신경망, Convolutional neural network, CNN)은 시각적 영상을 분석하는 데 사용되는 다층의 feed-forward인 인공신경망의 한 종류이다. 필터링 기법을 인공신경망에 적용하여 이미지를 효과적으로 처리할 수 있는 심층 신경망 기법으로 행렬로 표현된 필터의 각 요소가 데이터 처리에 적합하도록 자동으로 학습되는 과정을 통해 이미지를 분류하는 기법이다. 합성곱 신경망은 정규화 된 버전의 다층 퍼셉트론이다. 다층 퍼셉트론은 일반적으로 완전히 연결된 네트워크, 즉 한 계층의 각 뉴런이 다음 계층의 모든 뉴런에 연결되는 신경망 구조이다. 이와 같이 네트워크가 완전 연결된 경우 주어진 데이터에 과적합 되.. 2022. 8. 6. [시각 지능] 컨벌루션 (Convolution) 컨벌루션 (Convolution) 수학 (특히 기능 분석)에서 컨벌루션은 함수의 모양이 다른 하나에 의해 수정되는 방식을 나타낸다. 컨볼루션이라는 용어는 결과 함수와 계산 프로세스를 모두 나타낸다. 그것은 하나가 반전되고 이동된 후 두 함수의 곱의 적분으로 정의된다. 적분은 모든 shift 값에 대해 평가되어 컨볼루션 함수를 생성한다. from tensorflow.keras.datasets import mnist import matplotlib.pyplot as plt # mnist data download (x_train, y_train), (x_test, y_test) = mnist.load_data() plt.imshow(x_train[0], cmap='gray') # 1번째 데이터 plt.show.. 2022. 7. 31. 시각 지능 (Visual Intelligence) 시각 지능 (Visual Intelligence) 시각지능 분야는 이미지 또는 영상 데이터를 인식하여 상황을 판단하거나 데이터를 가공하여 새로운 이미지 또는 영상을 생성하는 기술 분야이다. 시각지능의 상호작용 기술로는 영상/이미지 검색이 있다. 첩보 영화에서 자주 등장하는 범죄자 얼굴 검색을 한 가지 예로 생각할 수 있다. 물론 아직 기술적 수준이 매체에서 비춰지는 수준까지는 이르지 못한다. 그러나 이제는 일상적인 스마트폰의 지문, 홍채, 안면 인식부터 공항, 공연장 등 공공시설에서의 범죄자 식별 등 다양한 부문에서 활용되고 있으며 기술 수준이 높아지고 있다. 학습 시각지능에서 학습의 목표는 입력된 이미지 데이터에서 객체를 인식하는 것에 있다. 먼저 전체 이미지에서 배경과 구분되는 객체 영역을 식별한 후.. 2022. 7. 9. [Deep Learning] EEGNet EEGNet : A Compact Convolutional Network for EEG-based Brain-Computer Interfaces 뇌-컴퓨터 인터페이스 (BCI)는 신경 활동을 제어 신호로 사용하여 컴퓨터와 직접 통신할 수 있게 한다. 이 신경 신호는 일반적으로 잘 연구된 다양한 뇌파 신호에서 선택된다. 주어진 BCI 패러다임의 경우, 특징 추출기와 분류기는 예상되는 EEG 제어 신호의 고유한 특성에 맞게 조정되어 특정 신호로 적용을 제한한다. 컴퓨터 비전 및 음성 인식에 사용된 CNN (Convolutional Neural Networks)은 EEG 기반 BCI에 성공적으로 적용되었지만, 주로 단일 BCI 패러다임에 적용되었기 때문에 이러한 아키텍처가 다른 패러다임으로 일반화하는 방법은 .. 2022. 6. 16. EEG Time Series Analysis EEG Time Series Analysis CNN (Convolutional Neural Networks)을 사용하여 뇌파 (EEG) 기록을 분석하여 자폐증의 영향을 받는지 여부를 식별하는 방법에 대한 연구 접근 방식이다. CNN Keras Python 라이브러리에서 분류 성능이 높은 CNN 모델을 사용한다. CNN은 일반적으로 이미지 인식 / 분류에 사용되는 신경망 클래스이지만 시계열 분석에도 사용할 수 있다. 이것은 형식과 같은 회색조 이미지의 시계열을 변환하여 수행할 수 있다. 64개 필터, 5x5 커널 크기, ReLU (Rectified Linear Unit, Eq. 1) 기능 및 동일한 패딩으로 구성된 하나의 2D conv layer 32개의 필터, 5x5의 커널 크기, ReLU (정류 선형 .. 2022. 3. 29. 이전 1 2 다음 728x90 반응형 LIST