"inLanguage": "ko" }

이번 주 백테스트 회고: 최고 콤보는 빛났지만 그리드는 한 발 뒤로

2026-05-30 · 백테스트 회고

이번 주 결과 한 줄

이번 주 백테스트에서 가장 두드러진 건 그리드 평균과 최고 콤보 사이의 격차다. 지난 주 그리드 평균 승률이 41.4%였는데 이번 주는 31.5%로 9.9%p 빠졌다. 같은 9개 조합을 같은 방식으로 돌렸는데 평균이 이 정도 내려앉으면, 시장 환경 쪽을 먼저 의심해보는 게 순서다. 가중치 자동 적용은 이번에도 보류됐다. 안정성 기준을 못 넘었다는 뜻이다.

핵심 수치

30일 백테스트 기준 그리드 평균 승률은 30.5%, 수익 팩터는 1.67, 샤프 비율은 1.25다. 시그널은 총 1,154건, runs는 9회 돌렸다. 지난 주 대비 승률은 △-9.9%p, 수익 팩터는 △-0.33, 샤프는 오히려 △+0.38 올랐다. 샤프만 보면 변동성 대비 효율은 나쁘지 않았다는 얘긴데, 승률과 수익 팩터가 같이 내려간 걸 보면 베팅당 기대값 자체가 얇아진 한 주였다.

90일 누적으로 보면 평균 승률 50.4%, 평균 수익 팩터 2.29, 평균 샤프 0.60이다. 이번 주 수치들이 90일 평균보다 명확히 아래에 있다는 게 솔직한 그림이다.

최고 콤보 vs 그리드 평균

여기가 이번 주 가장 솔직해야 하는 부분이다. 최고 조합은 임계값 80, 이벤트 윈도우 10. 승률 66.7%, 수익 팩터 2.92. 숫자만 보면 박수가 나오지만, 표본이 14건이다. 14건짜리 승률 66.7%는 9건 맞고 5건 틀린 정도다. 한두 건이 빠지면 통계 모양이 흔들리는 구간이다.

같은 그리드의 평균은 승률 30.5%, 수익 팩터 1.67. 최고 콤보와 평균의 격차가 승률 36.2%p, 수익 팩터 1.25다. 이 격차가 의미하는 건 두 가지 중 하나다. 임계값 80 부근에 진짜 신호가 몰려 있거나, 표본이 작은 구간에서 운이 좋은 outlier가 잡혔거나. 90일 데이터에서 자동 적용이 26회 중 단 1회뿐이라는 점을 같이 놓고 보면, 후자 쪽 가능성에 더 무게가 실린다. 모델이 '이 조합 믿어도 된다'고 손을 들어준 적이 거의 없다는 뜻이다.

이번 주 새로 측정된 종목 글

7일 forward 기준 5건이 새로 측정됐고 그 중 1건만 방향이 맞았다. 20% 적중인데, 표본 5건이라 통계로 다루긴 무리다. 다만 개별 사례 두 개는 짚어둘 만하다.

베스트는 ARM. 'cautious' 톤으로 작성한 글이었는데 7일 동안 +25.5% 갔다. 사상 최고가에서 200일선과의 괴리율 76%를 짚은 글이었으니, 방향 자체는 신중했지만 시장이 그 신중함을 비웃은 셈이다. 워스트는 ADBE. 'bullish'로 봤는데 -1.1%. 펀더멘털 살아있다는 톤이었으나 7일 안에서는 차트가 답을 안 줬다. 60일 누적으로 보면 저널 sentiment 7일 적중률이 25% (1/4), 평균 수익률은 +8.7%다. 적중률은 낮은데 평균 수익률은 플러스라는 건, 맞춘 한 건이 나머지를 끌고 가는 분포라는 얘기다.

좋았던 것, 안 좋았던 것

좋았던 건 샤프 비율이 지난 주 0.92에서 1.30으로 올라온 점. 평균 수익은 줄었어도 변동성 대비 효율은 개선됐다는 신호다. 최고 콤보가 임계값 80에서 계속 잡힌다는 일관성도 의미가 있다. 다만 이건 동시에 약점이기도 하다.

안 좋았던 건 그리드 평균이 두 자릿수 p 빠졌다는 사실, 가중치 자동 적용이 또 보류됐다는 점, 그리고 docs 누적 백테스트에서 임계값 60·이벤트 윈도우 5 조합의 승률이 26.1%, 7 조합이 27.6%로 여전히 낮은 구간에 머물러 있다는 점이다. 티커별로 보면 AMZN, MSFT, GOOGL, AAPL, NVDA가 승수 0건인 경우가 많은데 그래도 토털 수익이 플러스인 건 평균 손실보다 평균 수익이 큰 추세 추종 성격이 작동했다는 뜻이다. 반대로 AVGO와 ORCL은 누적 마이너스다.

의미

이걸 어떻게 읽어야 하나. 지난 주는 그리드 전체가 좋았고 이번 주는 최고 콤보만 좋다. 시장 환경이 분산을 키운 한 주였을 가능성, 임계값을 낮춘 구간에서 노이즈가 많이 들어온 가능성, 5월 말 특유의 종목 양극화 가능성이 떠오른다. 모델 한계도 분명하다. 14건짜리 best를 신뢰할지, 1,154건짜리 그리드 평균을 신뢰할지 사이에서 매주 같은 질문이 반복된다. 자동 적용 게이트가 안 열리는 건 모델이 그 질문에 아직 답을 못 정했다는 솔직한 신호다.

다음 주 검증할 가설

첫째, 최고 콤보가 임계값 80에서 계속 잡히는지 한 주 더 확인. 세 주 연속 같은 자리면 outlier가 아니라 구조다. 둘째, 그리드 평균 승률이 30% 부근에서 안정되는지 아니면 더 빠지는지. 셋째, 새로 측정된 종목 글의 7일 적중률이 20% 부근을 유지하는지. 표본이 쌓이기 전엔 그냥 관찰만 한다. 넷째, ARM처럼 '신중' 톤이었는데 큰 폭 상승한 사례가 또 나오는지. 톤과 결과의 어긋남이 패턴인지 단발인지가 다음 한 주의 관전 포인트다.

+ Recent posts