콘텐츠로 건너뛰기
Reddit

백테스팅 데이터셋, 어느 정도가 적당할까? 📊

r/Daytrading 조회 12
원문 보기 →
💡

대부분 투자자들은 백테스팅을 위한 데이터 깊이를 고민합니다. 충분한 데이터가 있어야 과거 성과를 제대로 확인할 수 있지만, 과거 데이터가 많아질수록 분석 결과가 달라질 수도 있습니다. 따라서 초기에는 적당한 기간의 데이터를 활용하되, 샘플 내외 테스트를 꼭 병행하는 것이 중요합니다.

안녕하세요,

요즘 데이트레이딩과 스윙트레이딩을 진지하게 배우고 싶어서 백테스팅을 시작하려 합니다. 코딩은 어느 정도 할 수 있지만 전문가 수준은 아니고 그래서 백테스팅 도구를 쓰면서 차근차근 배워나갈 생각입니다.

가장 궁금한 건 백테스팅에 적절한 데이터 기간과 깊이입니다. Databento에서 신규 가입자에게 115달러 크레딧을 주는 프로모션이 있어서 미국 주식 데이터를 5년치 정도 한꺼번에 내려받아 보려 해요.

근데 그 중 어떤 수준의 데이터가 개인 투자자가 수동으로 트레이딩할 때 의미가 있고, 어디서부터는 불필요한지 잘 감이 안 옵니다. 나중에 알고리즘 트레이딩도 생각 중이라 데이터 종류에 대해 고민 중입니다.

만약 한 달 구독권을 써 본 분이 있다면, 어떤 데이터 범위와 용량이 적당했는지 경험 공유해 주시면 감사하겠습니다.

감사합니다.


🧐 배경 설명 및 요약

이 글은 데이트레이딩과 스윙트레이딩을 막 시작하는 개인 투자자가 백테스팅을 해보고자 하면서 데이터 양과 범위에 대해 고민하다가 올린 질문입니다. 글쓴이는 어느 정도 코딩은 할 줄 알지만 전문가는 아니라 실무에서 쓰기 좋은 데이터 양과 구독 시 얻을 수 있는 데이터 규모가 궁금한 상태입니다. 백테스팅은 과거 데이터를 통해 전략의 성과를 확인하는 과정인데, 너무 적은 데이터만 쓰면 신뢰도가 떨어지고, 너무 많으면 분석이 복잡해질 수 있어 적절한 기간 선택이 중요합니다. 따라서 샘플 내 테스트와 샘플 외 테스트를 병행하여 과최적화(overfitting)를 피하는 것이 필요하다고 이해하면 좋습니다.

💬 원문 댓글 (2)

u/M0r** ▲ 2
저는 Trading View를 썼어요. 더 복잡한 기능이나 비싼 서비스도 많지만, 원하는 데이터 유형에 따라 괜찮은 출발점이 될 수 있습니다. 무료 체험도 제공하고, 필요 없으면 취소할 수 있어요.
원문 보기
I used Trading View. I'm sure you can get a lot more complex with it and pay a lot more elsewhere. Depending on the type of data you're after it could be a good start. They offer a free trial which you can cancel.
u/Hot********** ▲ 1
솔직히 샘플 내외 테스트만 제대로 한다면 낮은 시간대 기준으로 1년 데이터도 충분할 수 있습니다. 제가 경험한 사례로는 2년간 180% 수익을 낸 전략이 있었는데, 앞선 3년 데이터를 더해 보니 전체 수익률이 40% 손실로 바뀌더군요. 그래서 실제 운용은 못 했는데, 처음에 좋은 결과만 보고 무작정 믿었다면 큰일 날 뻔했어요.
원문 보기
To be honest, as long as you're testing in and out of sample, even 1 year can be enough for low timeframes.

As a warning, I found a strategy that was doing 180% in 2 years, but when I added the previous 3 years, the overall result went to a loss of 40%. Never deployed it live for that reason, but imagine how easy it would've been to be naive and blindly trust that great result at first.

댓글 (0)

로그인하고 댓글을 작성하세요.

아직 댓글이 없습니다.