콘텐츠로 건너뛰기
Reddit

말도 안 되는 변수로 ML 모델 돌려볼까? 🤖

r/Daytrading 조회 28
원문 보기 →
💡

작성자는 터무니없는 변수들로 머신러닝 모델을 학습시켜 실제로 시장을 예측할 수 있는지 실험해보겠다고 밝혔다. 이 실험은 우연한 상관관계와 과적합 위험, 그리고 비직관적 팩터의 실효성을 검증하는 데 의미가 있다. 독자들은 실험 설계, 변수 선택, 백테스트 결과와 과적합·데이터 스누핑 위험에 집중해 보길 권한다.

머신러닝 모델을 가장 무작위에 가깝고 말도 안 되는 상관관계들로 학습시키는 연재를 해볼까 생각 중이다.

예를 들어 독일 출산율이 오를 때 매수하거나, 뉴욕의 기온이 10도 아래로 떨어지면 매도하는 식의 엉뚱한 규칙들을 집어넣어 보는 거다 😂

진짜로 작동하는지 결과를 있는 그대로 공개하고, 작동하지 않으면 그 이유까지 보여주려고 한다. 스포일러: 학계에도 이런 터무니없는 상관관계를 다룬 논문들이 있고, 일부는 의외로 버티는 경우가 있다.

난 S&P를 이길 거다. 가장 미친 아이디어들을 댓글로 달아줘👇👇👇👇


🧐 배경 설명 및 요약

왜 이런 글이 나왔나: 글쓴이는 호기심과 실험 정신으로 '말도 안 되는' 외부 변수들을 머신러닝 입력으로 넣어 실제 성과가 나오는지 확인해보려 한다. 자극적인 제목과 자신감 있는 한마디(“난 S&P를 이긴다”)로 관심을 끌면서, 결과를 투명하게 공개하겠다는 의도를 보이고 있다.

작성자가 실질적으로 묻고 걱정하는 것: 이런 터무니없는 변수들이 단순한 우연의 상관관계인지, 아니면 실제로 예측력이 있는지 알고 싶어 한다. 또한 실험 과정에서 과적합(overfitting)이나 데이터 스누핑(data snooping) 같은 함정에 빠지지 않을지 우려하고, 실패와 성공 모두를 공개할 생각이다.

핵심 개념을 쉽게 설명하면 다음과 같다. 1) 상관관계 vs 인과관계: 두 변수가 함께 움직여도 한쪽이 다른 쪽을 일으킨다고 보긴 어렵다. 2) 과적합(오버피팅): 모델이 과거 데이터에 지나치게 맞춰져 미래에서는 성과가 나지 않을 수 있다. 3) 백테스트의 한계: 과거 성과가 미래 성과를 보장하지 않으므로 검증과 샘플 분할이 중요하다. 4) HMM(히든 마르코프 모델) 같은 모델은 상태 전이와 관측을 이용해 복잡한 패턴을 잡아내며, 퀀트들은 때때로 상식적으로 이상한 수많은 팩터를 만들어 테스트하기도 한다. 5) FinBERT 등 금융 특화 언어모델은 실적 발표나 콜에서 감성·신뢰도를 추출하는 데 쓰인다.

요약하면: 이 실험은 재미와 학습 목적 모두에서 의미가 있지만, 결과 해석 시 우연성과 과적합을 항상 의심해야 한다. 독자들은 실험의 재현성, 검증 방법, 그리고 실패 사례까지 함께 보는 것을 우선적으로 확인하면 좋다.

💬 원문 댓글 (4)

u/Naruto_goku21 ▲ 2
HMM은 사실 이랑 꽤 비슷하고 아주 엉뚱한 정보들도 입력할 수 있어. 나는 지금 실적 발표를 읽는 FinBERT 분석을 넣고 신뢰도 점수를 출력으로 받는 모델을 작업 중이야. 지금 네가 말한 것 같은 외부 요인들을 어떻게 넣을지 실험 중인데, 메달리온 퀀트들이 너가 말한 것처럼 온갖 터무니없는 팩터들을 HMM에 개발했다는 꽤 확실한 정보를 얻었고 그 결과는 모두 알고 있지.
원문 보기
HMMs are actually pretty similar to this and you can feed them very wild information. I’m currently working on a model that feeds Finbert analysis which reads earning calls and I request a confidence score as output. Currently experimenting on how to feed in external factors like what you just mentioned, I’ve had pretty solid info that the medallion quants developed a myriad of absurd factors like you mentioned in their HMMs and we all know how that played out
u/Neoneq_ ▲ 2
새로운 마인크래프트 스피드런이 업로드된 시간
원문 보기
Time of new Minecraft speedruns uploaded
u/Xelonima ▲ 1
축하해, 방금 헤지펀드가 어떻게 돌아가는지 알아냈네
원문 보기
Congratulations you just discovered how hedge funds work 
u/maciek024
과거의 상관관계는 미래의 상관관계와 같지 않아. 그래서 재미로 해보는 건 괜찮지만, 그걸로 돈 벌지는 못할 거야
원문 보기
correlation in the past != correlation in the future
So, for fun sure, but you wont make money

댓글 (0)

로그인하고 댓글을 작성하세요.

아직 댓글이 없습니다.