본문 바로가기
728x90
반응형
SMALL

전체 글1632

18. 로지스틱 회귀분석 (Logistic Regression Analysis) 로지스틱 회귀분석 (Logistic Regression Analysis) 2021. 12. 22.
17. 연관규칙분석 (Association Rule Analysis) 연관규칙분석 (Association Rule Analysis) 2021. 12. 22.
16. 유전자 알고리즘 (Genetic Algorithm) 유전자 알고리즘 (Genetic Algorithm) 문제에 대한 해를 표현하는 염색체가 집단을 이루어 해집단을 구성하고 유전 알고리즘의 진행 과정속에서 부모 세대와 자식 세대의 역할을 반복적으로 하게 된다. 유전 알고리즘은 생물이 살아가면서 교차, 돌연변이, 도태 등으로 환경에 적합하도록 진화한다는 가설에 기반을 둔 최적화 기법이다. 시간 축 상에서 여러 번 계산을 반복해 단계 수를 쌓아서 궁극적으로 구하고 싶은 결과에 수렴한다. 진화 연산의 과정에서 교차와 돌연변이 등 진화론 아이디어를 도입한 계산 방식이다. 진화 연산 1. 집단성 : 개체 다수를 집단으로 설정해 동시에 탐색할 때는 병렬 연산한다. 2. 가능성 : 탐색 공간( 설명 변수와 목적 변수 등이 취할 수 있는 값의 범위)의 자세한 사전 지식을.. 2021. 12. 22.
15. TF-IDF (Term Frequency-Inverse Document Frequency) TF-IDF (Term Frequency-Inverse Document Frequency) 2021. 12. 22.
14. 소셜 네트워크 분석 (Social Network Analysis) 소셜 네트워크 분석 (Social Network Analysis) 2021. 12. 22.
13. 랜덤 포레스트 (Random Forest) / 에이다부스트 (AdaBoost) 부스팅 (Boosting) 여러 개의 분류기가 순차적으로 학습 수행, 다음 분류기에게는 가중치 (weight)를 부여하면서 학습, 예측 진행한다. 예측 성능이 뛰어나 앙상블 학습을 주도한다. 학습 라운드를 차례로 진행하면서 각 예측이 틀린 데이터에 점점 가중치를 주는 방식이다. 라운드별로 잘못 분류된 데이터를 좀 더 잘 분류하는 모델로 만들어 최종 적으로 모델들의 앙상블을 만드는 방식으로 배깅 알고리즘이 처음 성능을 측정하기 위한 기준 (baseline) 알고리즘으로 많이 사용 된다면, 부스팅 알고리즘은 높은 성능을 내야 하는 상황에서 가장 좋은 선택지이다. 첫 번째 라운드 결과 모델에서 어떤 점은 오차가 큰 부분이다. 두 번째 라운드에서 오답으로 분류된 어떤 점에 가중치를 줘 학습한다. 다시 오류가 큰.. 2021. 12. 22.
12. 토픽 모델링 (Topic Modeling) 토픽 모델링 (Topic Modeling) 토픽 (Topic)은 한국어로는 주제라고 한다. 토픽 모델링 (Topic Modeling)이란 기계 학습 및 자연어 처리 분야에서 토픽이라는 문서 집합의 추상적인 주제를 발견하기 위한 통계적 모델 중 하나로, 텍스트 본문의 숨겨진 의미 구조를 발견하기 위해 사용되는 텍스트 마이닝 기법이다. 2021. 12. 22.
[Matplotlib] 이미지맵 (imshow) 이미지맵 (imshow) 원하는 사이즈의 pixel을 원하는 색으로 채워서 만든 그림이다. 원하는 크기의 행렬을 만들어서 각 칸을 원하는 색으로 채우는 것이다. 각 칸을 채우는 방법은 colormap, RGB, RGBA가 있다. colormap img = cv2.imread('8.jpg', cv2.IMREAD_GRAYSCALE) print("8") plt.imshow(img) plt.show() 보라색과 노란색이 나온 이유는 colormap의 디폴트 값이 viridis로 설정되어 있기 때문 보라색과 노란색이 나온다. viridis라는 colormap은 최솟값이 보라, 최댓값이 노랑이다. 입력한 숫자를 0~1 사이로 nomalize하여 색으로 나타낸다. colormap을 변경하고자 할때, cmap 옵션을 .. 2021. 12. 22.
Matplotlib Matplotlib 파이썬에서 데이터를 차트나 플롯 (plot)으로 그려주는 데이타 시각화 (Data Visualization) 라이브러리 패키지이다. matplotlib는 라인 plot, 바 차트, 파이차트, 히스토그램, Box Plot, Scatter Plot 등을 비롯하여 다양한 차트와 plot 스타일을 지원하며, Matplotlib.org 갤러리 웹페이지에서 다양한 샘플 차트를 볼 수 있다. 2021. 12. 22.
[TensorFlow] 레이어 (Layer) 레이어 (Layer) keras에서 사용되는 레이어(layer, 층)는 신경망 모델을 구성하는 주요한 요소이다. Feature Extraction (특징 추출) feature extraction은 초기 데이터 set를 처리하기 위해 더 관리하기 쉬운 그룹으로 축소하는 차원 감소 프로세스이다. 데이터 양을 효과적으로 줄이면서 원본 데이터 set를 정확하고 완전하게 설명하는 방법이라고 할 수 있다. Flatten Layer input으로 사용하기 위해 행렬이 아닌 list로 만들어주는 과정이 필요한데 flatten layer가 그 역할을 한다. flatten layer는 추출된 주요 특징을 전결합층에 전달하기 위해 1차원 자료로 바꿔주는 layer이다. 이미지 형태의 데이터를 list 형태로 flatten하.. 2021. 12. 22.
728x90
반응형
LIST