flowchart TD
A[데이터 불러오기]
A --> B[데이터 전처리]
B -->|결측치 처리 및 보간| C[시계열 시각화]
C --> D[정상성 검정 (ADF Test)]
D -->|비정상성| E[차분 및 로그 변환]
E --> F[이동평균 & 계절성 제거]
F --> G[ACF/PACF 분석]
G --> H[추세, 계절성, 잔차 분해]
H --> I[정상성 확보]
I --> J[train/test 데이터 분리]
J --> K[ARIMA 모델 학습 및 예측]
K --> L[예측 결과 시각화]
L --> M[성능 평가 (MSE, MAE, RMSE)]
📈 단계별 설명
✅ A: 데이터 불러오기
- 멜버른 일일 최저기온 데이터 또는 항공 승객 데이터 로드.
✅ B: 데이터 전처리
- 데이터 타입 변환, 결측치 처리, 보간법(interpolation).
✅ C: 시계열 시각화
- 원본 시계열 데이터의 흐름을 시각화.
✅ D: 정상성 검정
- Augmented Dickey-Fuller(ADF) Test로 정상성 여부 확인.
✅ E: 차분 및 로그 변환
- 정상성 확보를 위해 차분, 로그변환 적용.
✅ F: 이동평균 & 계절성 제거
- 이동평균/표준편차 및 계절성 제거로 안정성 강화.
✅ G: ACF/PACF 분석
- 자기상관, 부분자기상관 그래프로 모델 파라미터 추정.
✅ H: 시계열 분해
- 추세, 계절성, 잔차로 분해하여 시계열 패턴 확인.
✅ I: 정상성 확보
- 잔차의 정상성 검정 및 확보.
✅ J: 학습/테스트 데이터 분리
- 시계열 데이터를 train/test로 분리.
✅ K: ARIMA 모델 학습 및 예측
- ARIMA(14,1,0) 또는 SARIMA로 학습, 예측 수행.
✅ L: 예측 결과 시각화
- 학습/테스트 데이터와 예측 결과 비교 시각화.
✅ M: 성능 평가
- MSE, MAE, RMSE, MAPE 등으로 예측 정확도 평가.