본문 바로가기
728x90
반응형
SMALL

전체 글1632

12. XML (Extensible Markup Language) XML (Extensible Markup Language) 인터넷 웹페이지를 만드는 HTML을 획기적으로 개선하여 만든 언어이다. 홈페이지 구축기능, 검색기능 등이 향상되었고, 웹 페이지의 추가와 작성이 편리해졌다. XML 만들기 from xml.etree.ElementTree import Element, dump node1 = Element("first") node1.text = "안녕" dump(node1) #결과 안녕 root.append(node1) # 노드에 노드 추가하기 node2 = Element("second") node2.text = "Hello" root.append(node2) dump(root) #결과 안녕Hello dump(root) # 속성 추가하기 #결과 안녕Hello XML .. 2021. 12. 15.
11. 파일 입출력 파일 생성하기 소스 코드를 에디터로 작성해서 저장한 후 실행하면 프로그램을 실행한 디렉터리에 새로운 파일이 하나 생성된다. # 파일 객체 = open(파일 이름, 파일 열기 모드) f = open("새파일.txt", 'w') f.close() 파일을 생성하기 위해 python 내장 함수 open을 사용한다. open 함수는 다음과 같이 "파일 이름"과 "파일 열기 모드"를 입력값으로 받고 결과값으로 파일 객체를 돌려준다. 파일을 쓰기 모드로 열면 해당 파일이 이미 존재할 경우 원래 있던 내용이 모두 사라지고, 해당 파일이 존재하지 않으면 새로운 파일이 생성된다. 디렉터리에 파일이 없는 상태에서 새파일.txt를 쓰기 모드인 'w'로 열었기 때문에 새파일.txt라는 이름의 새로운 파일이 현재 디렉터리에 생성.. 2021. 12. 15.
10. 예외처리 예외처리 프로그램을 만들다 보면 수없이 많은 오류를 만나게 된다. 이를 위해 python은 try, except를 사용해서 예외적으로 오류를 처리할 수 있게 해준다. 오류 예외 처리 기법 1. try, except만 쓰는 방법 try: ... except [발생 오류[as 오류 메시지 변수]]: ... 2. 발생 오류만 포함한 except문 try: ... except 발생 오류: ... 3. 발생 오류와 오류 메시지 변수까지 포함한 except문 try: ... except 발생 오류 as 오류 메시지 변수: ... try: # 1을 0으로 나누려고 하면 ZeroDivisionError가 발생 1 / 0 except ZeroDivisionError as e: print(e) try .. finally .. 2021. 12. 15.
10. 신경망 (Neural Network) 신경망 (Neural Network) 기계학습과 인지과학에서 생물학의 신경망 (동물의 중추신경계중 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘이다. 신경세포를 흉내 내며 어느 정도 이하의 자극은 무시된다. 퍼셉트론 (Perceptron) 퍼셉트론 (perceptron)은 인공신경망의 한 종류로서, 1957년에 코넬 항공 연구소(Cornell Aeronautical Lab)의 프랑크 로젠블라트 (Frank Rosenblatt)에 의해 고안되었다. 다층 퍼셉트론 (Multilayer Perceptron) 다층 퍼셉트론은 입력층과 출력층 사이에 하나 이상의 중간층이 존재하는 신경망이다. 네트워크는 입력층, 은닉층, 출력층 방향으로 연결되어 있고, 각 층내의 연결과 출력층에서 입력층으로 직접적 연결이 없다.. 2021. 12. 15.
09. 주성분 분석 (PCA)과 밀도기반 군집분석 (DBSCAN) 주성분 분석 (PCA)과 밀도기반 군집분석 (DBSCAN) 2021. 12. 15.
08. 텍스트 마이닝 (Text mining) 텍스트 마이닝 (Text mining) 비 / 반정형 텍스트 데이터에서 자연어처리 (Natural Language Processing) 기술에 기반하여 유용한 정보를 추출, 가공하는 것을 목적으로 하는 기술이다. - 자연어 처리 : 파싱, 형태소 분석, 품사 태깅, 관계 추출, 의미 추출한다. - 언어모델링 : 언어 감지, 규칙기반 개체명과 상용어를 인식한다. - ML 알고리즘 : 반복훈련을 통해 습득한 정보 사용능력을 개선한다. - 마이닝 기술 : 각종 통계적 기법을 활용한 정보 분류 및 분석 기술이다. 문서 수집 (Crawling) - html Parsing - BeautifulSoup 패키지 - 형태소 모듈 테스트 형태소 분석 (Konlpy) 1) 형태소 분석 개요 : 문서(document) > 문.. 2021. 12. 15.
07. SVM (Support Vector Machine) SVM (Support Vector Machine) 선형이나 비선형 분류, 회귀, 이상치 탐색 등에 사용할 수 있는 다목적 머신러닝 모델이다. 2개의 그룹을 분류하는 가장 일반화된 경계선을 찾기 위한 수학 이론에 의해 발전된 알고리즘이다. 예를 들어, 국경선 결정 문제, 양 국가의 불만을 최소화할 수 있는 최대 거리로 설정한다. 그리고 복잡한 패턴의 문제를 해결하기 위해 주로 사용한다. 중소형 크기의 데이터셋에 적합하다. SVM은 클래스 사이에 가장 폭이 넓은 도로를 찾는 것과 같다. 이에 SVM를 large margin classification 이라고도 한다. 분류 결정 경계는 도로 경계에 위치한 샘플에 전적으로 결정된다. 이러한 샘플을 support vector라고 한다 (동그라미 데이터). SVM.. 2021. 12. 15.
06. 나이브 베이즈 (Naive Bayes) 나이브 베이즈 (Naive Bayes) 나이브 베이즈는 분류기를 만들 수 있는 간단한 기술로써 단일 알고리즘을 통한 훈련이 아닌 일반적인 원칙에 근거한 여러 알고리즘들을 이용하여 훈련된다. 모든 나이브 베이즈 분류기는 공통적으로 모든 특성 값은 서로 독립임을 가정한다. 예를 들어, 특정 과일을 사과로 분류 가능하게 하는 특성들 (둥글다, 빨갛다, 지름 10cm)은 나이브 베이즈 분류기에서 특성들 사이에서 발생할 수 있는 연관성이 없음을 가정하고 각각의 특성들이 특정 과일이 사과일 확률에 독립적으로 기여 하는 것으로 간주한다. 나이브 베이즈의 장점은 다음과 같다. 첫째, 일부의 확률 모델에서 나이브 베이즈 분류는 지도 학습 (Supervised Learning) 환경에서 매우 효율적으로 훈련 될 수 있다... 2021. 12. 15.
[Computer Vision] 블록 매칭 및 3D 필터링 (Block-Matching and 3D filtering, BM3D) 블록 매칭 및 3D 필터링 (Block-Matching and 3D filtering, BM3D) 블록 일치 및 3D 필터링 (BM3D)은 주로 이미지의 noise 감소에 사용되는 3D 블록 일치 알고리즘이다. non-local means methodology의 확장 중 하나이다. BM3D에는 hard-thresholding 및 Wiener filter 단계와 둘 다 그룹화 (grouping), 협업 필터링 (collaborative filtering) 및 집계 (aggregation) 부분을 포함한다. 이 알고리즘은 변환 사이트의 증강 표현에 따라 다르다. Method 1. Grouping 이미지 조각은 유사성을 기반으로 함께 grouping되지만 표준 k-means 클러스터링 및 클러스터 분석 방법과.. 2021. 12. 15.
[ANN] 순환 신경망 (Recurrent Neural Network, RNN) (2) 매개변수 순환 신경망의 매개변수 (가중치 집합)는 Θ = 𝐔𝐔,𝐖𝐖, 𝐕𝐕, 𝐛𝐛, 𝐜𝐜 이다. 𝐔𝐔 : 입력층과 은닉층을 연결하는 p*d 행렬 𝐖𝐖 : 은닉층과 은닉층을 연결하는 p*p 행렬 𝐕𝐕 : 은닉층과 출력층을 연결하는 q*p 행렬 𝐛𝐛, 𝐜𝐜 : 바이어스로서 각각 p*1과 q*1 행렬 RNN 학습이란 훈련 집합을 최적의 성능으로 예측하는 Θ 값을 찾는 일을 말한다. 가중치 𝐮𝐮𝑗𝑗 = 𝑢𝑢𝑗𝑗1, 𝑢𝑢𝑗𝑗2, ⋯ , 𝑢𝑢𝑗𝑗𝑑𝑑 는 𝐔𝐔 행렬의 j번째 행 (ℎ𝑗𝑗에 연결된 에지의 가중치들) Vanishing Gradient Problem RNN 역시 경사하강법과 오류 역전파 (backpropagation)를 이용해 학습한다. 학습 데이터의 길이가 길어질수록 먼 과거의 정보를 현재에 전달하기 힘.. 2021. 12. 14.
728x90
반응형
LIST