콘텐츠로 건너뛰기
Reddit

M1 브렌트 AI 스캘퍼: 54% 승률·PF 1.86 — 수익의 94%가 한 달에 몰림, 과적합일까? 🤔

r/Daytrading 조회 5
원문 보기 →
💡

현재 백테스트 수치는 겉으로 보기엔 괜찮지만 한 달에 수익이 과도하게 집중돼 있어 과적합 가능성이 큽니다. 표본 크기가 작고 특정 기간·세션에 의존하면 라이브 환경에서 기대수익이 사라질 위험이 큽니다. 독자들은 몬테카를로·파라미터 민감도·실거래 스프레드/슬리피지 시뮬레이션과 숏 로직 테스트에 집중해야 합니다.

안녕하세요. M1 타임프레임에서 브렌트 원유(XTIUSD)를 대상으로 완전 자동화된 봇을 만들고 있습니다. 제대로 된 백테스트를 돌려보니 표면적 지표는 그럴싸한데 뭔가 불안해서 경험자들의 현실 체크가 필요합니다.

전략 요약(코드 아님): M1 OHLCV를 그대로 받아 ATR, 세션 시간, 트렌드 필터 등 피처를 만들고, 레짐 감지기로 시장을 TREND_BULLISH, TREND_BEARISH, LIQUIDITY_SWEEP, RANGE_COMPRESSION, MIXED 등으로 분류합니다. 로컬 LLM이 각 셋업을 0–100으로 점수화하고, 점수 ≥45이면서 불리시 레짐일 때만 롱을 취합니다. 손절은 2.5×ATR, 목표가는 4.0×ATR(최소 1.6 R:R). 트레이드당 리스크 2%, 일당 최대 3건. 데이터는 깨끗한 M1로 2025년 10월~2026년 3월(약 5개월)입니다.

백테스트 핵심 숫자: 총 트레이드 63건, 승률 54%, 프로핏팩터 1.86, 평균 R:R 1.58, 트레이드 기대값 약 +$35, 최대 드로다운 $580, 최대 연속손실 5회.

월별 흐름: 10월 4건 +$24, 11월 1건 +$105, 1월 8건 -$204, 2월 7건 -$9, 3월 43건 +$2,306. 세션별로는 런던오픈에서 +$880(11건, 73% WR), NY오픈 +$187(3건, 67% WR), 데드존 26건 +$783, 런던중간 13건 +$335, NY중간 10건 +$38.

지금 제 불안 요약:

1) 3월 한 달이 계좌를 사실상 만들었다는 점. 63건 중 43건이 3월에 몰렸고 그 달만 +$2,306입니다. 딱 한 번 큰 유가 추세를 탄 것 같은데 이걸 전략의 진짜 엣지라고 봐야 할지 의문입니다.

2) 현 구조상 롱만 잡습니다. 레짐 감지기가 TREND_BULLISH일 때만 작동해서 5개월간 숏 포지션은 전혀 없습니다. 만약 유가가 급락하면 봇은 손을 놓고 있거나 잘못 판정할 위험이 있습니다.

3) 거래의 41%가 유동성 얇은 데드존에서 발생합니다. 백테스트는 스프레드가 완벽하지만 실거래에서는 스프레드/슬리피지가 승률과 수익을 잠식할 가능성이 큽니다.

4) 1~2월은 그야말로 별로였습니다. 5연패와 $580 드로다운은 계좌가 작으면 25~30% 급락을 의미하고, 회복 전 심리적으로도 버티기 어렵습니다.

질문들:

- 5개월, 63건으로 진짜 엣지를 주장할 수 있을까요, 아니면 여전히 노이즈인가요?

- 3월이 단순 운인지 전략 엣지인지 어떻게 테스트하시나요?

- 데드존 거래를 과적합 없이 걸러내는 스마트한 방법 있을까요?

- 숏 측 로직을 추가하되 최적화 리스크를 크게 늘리지 않는 깔끔한 방법이 있을까요?

자세한 에퀴티 커브나 더 granular한 통계는 보여드릴 수 있습니다. 전략 로직은 아직 다듬는 중이라 공개는 보류합니다. 솔직한 피드백 감사드려요.


🧐 배경 설명 및 요약

왜 이 글이 올라왔나: 작성자는 M1 브렌트 자동매매 봇을 백테스트한 결과를 공유하면서, 표면적 성과와 특정 기간(3월)에 수익이 몰린 점 사이의 괴리를 경험하고 있어 커뮤니티의 현실적인 검증을 받고자 게시했습니다. 즉, 통계적으로 유의한 엣지인지 아니면 우연한 한 달의 호재를 탄 것인지 판단이 필요합니다.

작성자가 실제로 걱정하는 포인트: (1) 표본 크기와 기간이 작아 과적합(커브피팅)일 가능성, (2) 특정 월/세션에 과도하게 의존하는 위험, (3) 데드존의 실거래 스프레드·슬리피지 영향, (4) 롱 전용 설계로 인한 하방 리스크와 숏 부재 문제입니다. 핵심 질문은 "이 결과를 신뢰해 라이브로 돌려도 괜찮은가" 입니다.

어려운 개념을 간단히 설명:

- 표본 크기와 노이즈: 트레이드 수(63건)와 기간(5개월)은 통계적으로 작습니다. 적은 표본은 우연이 실제 엣지처럼 보이게 만듭니다.

- 경로의존성/몬테카를로: 동일한 승률·분포를 가정해 무작위화를 반복하면 수익곡선이 얼마나 흔들리는지 확인할 수 있습니다. 결과가 크게 달라지면 우연일 가능성이 큽니다.

- 파라미터 민감도: 전략의 파라미터(예: ATR 배수, 점수 임계값)를 조금만 바꿔도 결과가 크게 바뀌면 과적합 의심이 강해집니다.

- 데드존 스프레드·슬리피지: 백테스트에서 스프레드를 고정·무시하면 데드존 실거래에서 이익이 급감할 수 있습니다. 실거래 환경을 모사한 슬리피지/스프레드 시뮬레이션이 필요합니다.

실무적으로 우선 점검할 것들(단계별 제안):

1) 몬테카를로 재샘플링으로 에퀴티 곡선의 경로 불안정성 확인.

2) 파라미터 민감도 테스트(하나씩 변경)로 결과의 안정성 확인. 큰 변동이 있으면 파라미터 재설계 고려.

3) 데드존에 보수적인 스프레드/슬리피지 모델 적용하고 백테스트 재실행. 그 결과가 크게 나빠지면 해당 세션을 제한하거나 크기 조절 검토.

4) 3월을 노치로 보고 아웃오브샘플(교차검증/워크포워드)에서 유사한 성과가 반복되는지 테스트. 반복되지 않으면 우연일 가능성 높음.

5) 숏 로직 추가는 단순한 대칭 규칙(롱 규칙을 반전)으로 먼저 실험하고, 별도 검증 데이터를 통해 최적화 리스크를 통제하세요. 숏을 도입하면 포트폴리오 리스크·코릴레이션도 다시 평가해야 합니다.

결론 요약: 현재 성과는 흥미롭지만 한 달에 과도하게 집중된 점, 샘플 크기, 데드존 노출이 걸립니다. 제안한 검증(몬테카를로·파라미터 민감도·슬리피지 시뮬레이션·아웃오브샘플)을 먼저 수행해 진짜 엣지인지 가려보세요.

💬 원문 댓글 (1)

u/Exarctus ▲ 1
아마 노이즈일 가능성이 큽니다.

경로 의존성(몬테카를로 시뮬레이션)을 확인해 보세요. 또한 파라미터를 조금 바꿨을 때 결과의 안정성도 점검하세요. 작은 파라미터 변화에 결과가 크게 달라지면 완전히 난장판입니다.
원문 보기
Probably noise.

Try looking into path dependence (Monte Carlo sims). Also take a look into the stability of the outcomes with respect to changes in the parameters. If outcomes change appreciably given a small parameter change it’s a hot mess sir.

댓글 (0)

로그인하고 댓글을 작성하세요.

아직 댓글이 없습니다.