본문 바로가기

카테고리 없음

Air Passengers 시계열데이터 분석흐름도

flowchart TD
A[데이터 불러오기]
A --> B[데이터 전처리]
B -->|결측치 처리 및 보간| C[시계열 시각화]
C --> D[정상성 검정 (ADF Test)]
D -->|비정상성| E[차분 및 로그 변환]
E --> F[이동평균 & 계절성 제거]
F --> G[ACF/PACF 분석]
G --> H[추세, 계절성, 잔차 분해]
H --> I[정상성 확보]
I --> J[train/test 데이터 분리]
J --> K[ARIMA 모델 학습 및 예측]
K --> L[예측 결과 시각화]
L --> M[성능 평가 (MSE, MAE, RMSE)]

 

📈 단계별 설명

A: 데이터 불러오기

  • 멜버른 일일 최저기온 데이터 또는 항공 승객 데이터 로드.

B: 데이터 전처리

  • 데이터 타입 변환, 결측치 처리, 보간법(interpolation).

C: 시계열 시각화

  • 원본 시계열 데이터의 흐름을 시각화.

D: 정상성 검정

  • Augmented Dickey-Fuller(ADF) Test로 정상성 여부 확인.

E: 차분 및 로그 변환

  • 정상성 확보를 위해 차분, 로그변환 적용.

F: 이동평균 & 계절성 제거

  • 이동평균/표준편차 및 계절성 제거로 안정성 강화.

G: ACF/PACF 분석

  • 자기상관, 부분자기상관 그래프로 모델 파라미터 추정.

H: 시계열 분해

  • 추세, 계절성, 잔차로 분해하여 시계열 패턴 확인.

I: 정상성 확보

  • 잔차의 정상성 검정 및 확보.

J: 학습/테스트 데이터 분리

  • 시계열 데이터를 train/test로 분리.

K: ARIMA 모델 학습 및 예측

  • ARIMA(14,1,0) 또는 SARIMA로 학습, 예측 수행.

L: 예측 결과 시각화

  • 학습/테스트 데이터와 예측 결과 비교 시각화.

M: 성능 평가

  • MSE, MAE, RMSE, MAPE 등으로 예측 정확도 평가.