AI 머신러닝

시계열 분석

KIMYOUNGIN 2019. 9. 7. 01:56
반응형

 

오늘 배워 볼 내용은 시.계.열.에 대한 내용입니다. 길지만 내용은 가능한 쉽게 적도록 노력쿠 했습니다.

 

우선 기초개념부터 알아봅시다!

시계열(時系列, Time Series)은 일정 시간 간격으로 배치된 데이터들의 수열을 말한다.

시계열 자료란?  시간의 흐름에 따라 변하는 현상을 관찰함으로써 얻어지는 자료다!

사회, 자연과학, 현상 등 모든 분야에서 볼 수 있어요.

EX) 연도별 강우량, 농업분야, 기상의 하루 최고온도, 저수량 ,의학분야에선 뇌파, 심전도 등등이 조사/관찰되고 있다. 

우리가 알고 있는 주식, 주가변동 등도 있어요

 

그렇다면 시계열 분석은 사용하나?...

시계열 분석의 목적Two 가지로 나눌 수 있어요.

1. 모형 수립(model building) :  관찰된 시계열의 성질을 조사, 확률적 특성을 체계화 해 적합한 시계열 모형을 찾는 것!

2. 예측(forecasting) : 수립된 모형을 토대로 미래의 값을 제시하는 것!

Q. 그럼 회귀분석이랑 뭐가 다르죠?

시계열은 기본적으로 확률구조가 종속(독립X)이예요. 무슨 말이냐면 앞의 데이터가 뒤의 데이터에 끼친다는 의미(자기상관성)다~이말입니다! ^^7 

이어서 시계열의 변동 요인과 모형에 대해 알아볼게요

설명을 위한 저세상 그림1

시계열 그래프를 보면 불안정한 느낌들어요. 막 불규칙적으로 변동되니까..분석한다는 것이 가능할까? 라는 의문을 품게 됩니다. 그럼에도 몇가지 가정을 해 시계열에서 나타나는 변동을 정의, 설명하고 측정하게 됩니다.

일반적으로 변동요인Four 가지가 있어요.

* 추세변동 (Trend Variation)  : T

* 계절변동(Seasonal Variation)  :  S

* 순환변동(Cyclical Variation)  : C

* 불규칙변동(Irregular Variation)  : I

 

그렇다면 변동요인에 대해 하나씩 파헤쳐 볼게요!  (벌써 힘들ㄷ...)

아참! 대표적인 4가지 변동요인을 파헤치기 전 널리 사용되고 알아두면 좋은 2가지 모형만 보고 갈게요.

그래프에서 임의의 점 T초일 때 관측된 시계열을 Zt이라고 하면 Zt는 이들 네 가지 성분들의 곱이나 합의 관계가 성립하는 것으로 가정해 나타냅니다!!

곱의 관계 = 승법모형 : Zt = T*S*C*I

합의 관계 =  가법모형 : Zt = T+S+C+I

이 두개는 옛날... 고전적 방법이지만 이용되고 있다고 하니 한번 보시길 바랍니다! ^^7

이제 변동요인에 대해 파헤쳐 봅시다!

1) 추세변동 (Trend Variation) : 

추세변동은 시계열의 장기간에 걸친 점진적이고 지속적인 변화를 나타내는 것!

시간의 흐름에 따른 시계열 자료들의 상승경향이나 하향경향의 상태를 의미한다.

대부분의 경우 시계열의 점진적인 상승이나 하강 패턴은 직선, 곡선으로 나타날 수 있다고 하는데...

예를 들면 도시의 인구성장을 나타내는 곡선은 S자를 길게 늘어놓은 형태고

한국인의 쌀 소비량은 2차 곡선 형태...라고 하는데 솔직히 무슨말인지 모르겠다...

설명용 저세상 그래프

쉽게 말해 1900년부터 판매량이 오르는 추세를 보이면 2019년, 2020년에도 판매량이 오른다는 것을 예측할 수 있다는 겁니다. 이게 추세변동!! 이정도면 추세변동에 대한건 다 말한거 같은데요?..

다음은 계절변동!

2) 계절변동(Seasonal Variation) : 

계절을 주기로 발생하는 변동요인을 계절변동이라 하는데 일 년 단위 혹은 짧은 기간의 주기로 기록 했을 때 

기후, 자연조건, 사회적 문제, 제도 등 영향을 받아 계절적인 차이를 나타낼 수 있다. 이떄 계절적인 차이를 계절변동이라 한다.

설명을 위한 저세상 그래프

예를 들면 여름에는 처량음료나 선풍기 등이 잘 팔리고 겨울에는 연료비가 많이 들고...

추석이나 연말엔 선물용품! 크리스마스!!도 있네요. 

그런데 계절변화에 따라 나타나는 변동요인만 계절변동이 아니고 음...성수기 비성수기에 따른 펜션값 상승?이거나 어버이날, 졸업식! 개강하는 날에 문구류 판매량 등 일정 기간마다 주기적으로 발생하는 변동요인도 계절변동이라 할 수 있어요.

 

TIP

계절변동이 순환변동과 다른 점은 순환주기가 짧다는 점이다. 

순환변동이 나타나는 주기는 2 ~ 3 년 정도인데 계절변동은 보통 계절에 따라 영향을 받으므로 1 년을 주기로 나타난다.

이렇게 계절변동을 알아보았어요.

 

 

이젠 순환변동과 불규칙변동에 대해 알아볼게요.      : (

왜 두개를 같이 썻냐?! 이유는 시계열에서 추세변동과 계절변동이 제거된다면 모형엔 순환과 불규칙만이 남게 됩니다..

3) 순환변동(Cyclical Variation) 과 불규칙 변동Irregular Variation) :

순환변동은 수년간의 간격을 두고 상승과 하락이 주기적으로 나타나는 변동을 의미!

기후조건 사회적 관습, 계절변동으로 설명하지 못하는 장기적인 주기변동!

회복기ㅡ번영기ㅡ후퇴기ㅡ침체기의 4 단계로 구성됩니다.  

이어서 불규칙 변동에는 2가지 형태가 있어요.

첫번째 형태는 지진, 전쟁. 홍수 등 사전적으로 예상할 수 없는 요인형태고

두 번쨰는 명확히 설명할 수 없는 요인에 의해 발생되는 우연변동입니다.

음....우연으로 발생하기 때문에 불규칙 변동을 예측하는 것은 어려워요...예측하는 것이 목적인데 변동이 많으면 시계열 자료에선 예측을 할 수 없어요...

 그렇다면! 시계열자료에 존재하는 추세변동, 순환변동, 계절변동과 불규칙변동은 어떻게 분석할 수 있을까?...

평활법 사용법!! 다음시간에 알려드릴게요^^

 

 

 

 

 

 

출처 : https://ko.wikipedia.org/wiki/%EC%8B%9C%EA%B3%84%EC%97%B4

반응형