시계열 분석은 시계열 데이터를 분석하는 것으로 시계열 예측으로도 부른다. 시계열 데이터 (time series)는 관측치가 시간적 순서를 가지는 시간의 흐름에 따른 관측된 데이터다. 일정 시점에 조사된 데이터는 횡단 자료 (cross-sectional)로 분류한다. 대표 횡단 자료로 소비자 물가 지수가 있다.
시계열 자료
시간의 흐름에 따라 관찰된 값들
주식가격 데이터, 실업률, 기후 데이터 등
시계열 데이터의 분석 목적
미래의 값을 예측
특성파악
경향, 주기, 계절성, 불규칙성 등
시계열 자료 종류
비정상성 시계열 자료
시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열자료가 이에 해당
정상성 시계열 자료
비정상 시계열을 변환해 다루기 쉬운 시계열 자료로 변환한 자료
정상성
정상성은 시계열의 수준과 분산에 체계적인 변화가 없고 엄밀하게 주기적 변동이 없다는 것으로 미래는 확률적으로 과거와 동일하다는 것을 의미한다.
평균, 분산, 공분산 3가지를 모두 만족해야 함
평균이 일정
모든 시점에서 일정한 평균을 가짐
평균이 일정하지 않은 시계열은 차분을 통해 정상화
분산이 일정
시점에 의존하지 않고 일정해야 함
변환을 통해 정상화
공분산
특정시점에서 t, s에 의존하지 않고 일정
정상 시계열
정상 시계열은 어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기공분산을 측정하더라도 동일한 값을 갖음
정상 시계열은 항상 그 평균값으로 회귀하려는 경향이 있으며, 그 평균값 주변에서의 변동은 대체로 일정한 폭을 가짐
정상 시계열이 아닌 경우 특정 기간의 시계열 자료로부터 얻은 정보를 다른 시기로 일반화 할 수 없음
비정상 시계열을 정상 시계열로 전환하는 방법
시계열 평균이 비일정하면 원시계열에 차분 (현 시점에서 전 시점의 자료 값을 뺌)하면 정상 시계열이 된다.
계절성을 갖는 비정상시계열은 정상시계열로 바꿀 때 계절차분을 사용한다.
분산이 일정하지 않은 경우 원계열에 자연로그 (변환)을 취하면 정상시계열이 된다.
대표적 정상시계열인 백색잡음으로 만드는 백색잡음 과정은 시계열의 평균이 0이고 분산이 일정한 값 2 시그마이고 자기공분산이 0인 경우를 의미한다.
* 자기상관 : 시점 t와 (t-1) 간 상관관계, 일정 기간동안 증가하거나 감소하는 경우 자기상관이 존재, 증감이 시점마다 반복되면 음의 자기상관인데 양의 자기상관이 일반적이다.
차분
현시점 자료에서 전 시점 자료를 빼는 것
일반차분
바로 전 시점의 자료를 빼는 방법
계절차분
여러 시점 전의 자료를 빼는 방법
계절성을 갖는 자료를 정상화 하는데 사용
시계열 자료 분석 방법
분석방법
회귀 분석 방법
Box-Jenkins 방법
지수 평활법
자료 형태에 따른 분석 방법
일변량 시계열 분석
Box-Jenkins (ARMA), 지수평활법, 시계열분해법
다중 시계열 분석
계량경제 모형, 전이함수 모형, 개입 분석, 상태 공간 분석 등
이동 평균법
과거로부터 현재까지의 시계열 자료를 대상으로 일정 기간별 이동 평균을 계산하고, 이들의 추세를 파악하여 다음 기간을 예측하는 방법
지수 평활법
모든 시계열 자료를 사용하여 평균을 구하며, 시간의 흐름에 따라 최근 시계열에 더 많은 가중치를 부여하여 미래를 예측하는 방법