15분봉 ML/DL 분석

목차

  1. 분석 목표
    1. 데이터셋
  2. 타임프레임별 ML 성능 비교
  3. Tree-Based 모델 성능
  4. Walk-Forward Validation
  5. Top 20 중요 피처
    1. 피처 카테고리 분포
  6. 왜 15분봉 ML이 작동하지 않는가?
    1. 1. 노이즈 대비 신호 비율
    2. 2. 시장 미세구조
    3. 3. 피처 유효성
  7. 결론 및 권장사항
    1. ML 기반 필터 적용
    2. 15분봉 전략 운용
    3. 하이브리드 접근
  8. 추가 실험 제안

분석 목표

15분봉 데이터에서 SL(손절) vs TP(익절) 거래를 사전에 예측할 수 있는가?

데이터셋

항목
전략 설정 MA50, TP5%, SL2%
총 샘플 수 401 거래
SL (Label=1) 274 (68.3%)
TP (Label=0) 127 (31.7%)
피처 수 177개

타임프레임별 ML 성능 비교

항목 5분봉 15분봉 1시간봉
샘플 수 620 401 165
클래스 비율 (SL:TP) 55:45 68:32 77:23
최고 AUC (Tree) 0.55 0.53 0.62
예측력 없음 없음 의미있음

15분봉은 ML 예측에 적합하지 않습니다.

AUC 0.53은 랜덤 추측(0.5)과 거의 차이가 없습니다.


Tree-Based 모델 성능

Model Accuracy Precision Recall F1 AUC-ROC
XGBoost 56.8% 67.3% 68.5% 0.68 0.53
LightGBM 63.0% 68.2% 83.3% 0.75 0.51
RandomForest 67.9% 68.9% 94.4% 0.80 0.50
LogisticRegression 58.0% 68.5% 68.5% 0.69 0.51

XGBoost가 AUC 0.53으로 가장 높지만, 실전 적용에는 불충분합니다.


Walk-Forward Validation

Model AUC-ROC (mean ± std)
LogisticRegression 0.57 ± 0.11
LightGBM 0.54 ± 0.13
RandomForest 0.53 ± 0.12
XGBoost 0.50 ± 0.00

Walk-forward에서 모델 성능이 더 떨어집니다. 과적합 가능성을 시사합니다.


Top 20 중요 피처

순위 피처 중요도 카테고리
1 candle_body_pct_std 32.31 캔들 패턴
2 upper_shadow_pct_mean 30.27 캔들 패턴
3 mfi_mean 29.10 거래량
4 adx_std 24.42 추세
5 ma_50_100_cross_pct_std 21.13 이평선 교차
6 is_doji_mean 20.72 캔들 패턴
7 lower_shadow_pct_std 20.58 캔들 패턴
8 adx_slope_std 20.38 추세
9 upper_shadow_pct_last 17.06 캔들 패턴
10 ma_200_slope_std 15.81 이평선 기울기

피처 카테고리 분포

카테고리 Top 20 내 개수
캔들 패턴 5
이평선 4
추세 (ADX) 2
거래량 2
기타 7

캔들 패턴 피처가 가장 중요합니다. 15분봉에서는 단기 캔들 형태가 결과에 영향을 미칩니다.


왜 15분봉 ML이 작동하지 않는가?

1. 노이즈 대비 신호 비율

1시간봉: 신호 > 노이즈 → 패턴 학습 가능
15분봉: 노이즈 ≈ 신호 → 패턴 학습 어려움
5분봉:  노이즈 >> 신호 → 패턴 학습 불가

2. 시장 미세구조

  • 15분봉에서는 단기 변동이 SL/TP 결과를 좌우
  • 기술적 지표의 예측력이 중간 수준
  • 노이즈와 신호가 혼재

3. 피처 유효성

피처 유형 1시간봉 15분봉 5분봉
장기 MA 이격도 유효 약함 약함
캔들 패턴 보통 유효 보통
ADX/추세 유효 보통 약함
RSI/MACD 유효 보통 약함

결론 및 권장사항

ML 기반 필터 적용

ML 필터는 15분봉에서 권장하지 않습니다.

타임프레임 ML 필터 적용 권장도
1시간봉 O (AUC 0.62) 권장
15분봉 X (AUC 0.53) 비권장
5분봉 X (AUC 0.55) 비권장

15분봉 전략 운용

ML 없이 운용 시:

  1. 단순 규칙 기반 진입/청산만 사용
  2. 반익절 3% 적용으로 리스크 관리
  3. 1시간봉 ML 필터와 하이브리드 운용 고려

하이브리드 접근

# 1시간봉에서 ML 필터로 방향 결정
if hourly_ml_filter.predict(hourly_features) == "TP_LIKELY":
    # 15분봉에서 정밀 진입 타이밍 결정
    wait_for_15m_entry_signal()

추가 실험 제안

  1. 피처 엔지니어링: 15분봉 전용 캔들 패턴 피처 강화
  2. 앙상블: 1시간봉 + 15분봉 모델 결합
  3. 시간대 필터: 특정 세션(아시아/유럽/미국)만 분석