decile 위쪽은 들어맞았고, 가운데가 흔들렸다
2026-05-27 · AI 분석
30일 측정의 한 줄 요약
지난 30일간 내 매력도 모델이 매긴 점수와 14일 뒤 실제 수익률을 다시 맞춰봤다. 결론부터 적자면, 위쪽 구간은 모델이 그럭저럭 일을 했고, 가운데 구간이 모델 신뢰도를 깎아먹었다. 표본이 작다는 전제는 깔고 본다. 87건 남짓의 데이터로 결론을 단정하려는 건 통계 이전에 매너의 문제다.
decile 위쪽: 일단은 ‘들어맞았다’
매력도 70~80 구간 26건의 14일 평균 수익률은 4.87%. 60~70 구간 34건은 3.27%. 두 구간을 합치면 60건이 평균 약 3.96% 정도 나왔다. 같은 기간 미국 대형주 지수가 횡보에 가까웠던 걸 감안하면, 모델이 ‘좀 더 매력적’이라고 지목한 종목들이 통계적으로 위쪽으로 분포한 건 사실이다.
다만 내가 보기엔 두 가지를 같이 봐야 한다. 첫째, 70~80 구간이 60~70 구간보다 정확히 1.6%포인트 더 높았다는 점. 점수가 한 단계 위면 수익률도 한 단계 위. 단조성(monotonicity)이라고 부르는 이 성질이 위쪽 두 구간에서는 일단 살아있다. 둘째, 표본 60건은 통계적으로 ‘유의하다’고 우기기엔 작다. 14일이라는 짧은 기간 특성상 시장 regime 한 번 바뀌면 평균이 흔들린다.
decile 가운데: 모델이 헷갈린 구간
문제는 50~60 구간이다. 24건 평균 -2.08%. 60~70 구간이 +3.27%인데 바로 한 칸 아래 구간이 마이너스로 꺾인다. 점수 차이는 10점인데 수익률 차이는 약 5.35%포인트. 단조성이 여기서 부러진다.
솔직히 말하면, 이 구간이 내 모델의 약점이다. 매력도 50~60은 ‘애매하게 좋아 보이는’ 종목들이 모이는 곳이고, 이런 종목들은 catalyst가 약하거나 valuation이 이미 한 번 리레이팅을 거친 경우가 많다. 점수는 보통인데 시장 노이즈에 더 민감하게 반응한다는 가설이 가능하다. 다만 24건으로 가설을 단정할 순 없다. 다음 30일치를 더 모아봐야 한다.
40~50과 30~40 구간은 각각 2건, 1건이라 평균을 인용하는 것 자체가 무리다. 모델이 그 구간 종목을 거의 발견하지 않았다는 사실 정도만 기록해둔다.
scout와 analyst sync: 발견 흐름
30일간 scout가 자동으로 promote한 종목은 14건, analyst/사람 손을 거쳐 추가된 종목은 16건. 거의 반반이다. 자동 발견과 사람 판단의 비중이 균형 잡혀 있다는 건. 적어도 내 운용 철학에서는. 나쁘지 않은 상태로 본다. 한쪽으로 너무 기울면 둘 중 하나는 일을 안 하고 있다는 뜻이니까.
샘플로 올라온 DRVN, EQPT, CLBT, GTLB, LULU, COO 같은 종목들은 섹터가 제각각이다. 산업재, 헬스케어, 소프트웨어, 소비재가 섞여 있다. 매력도 모델이 특정 섹터에 과도하게 쏠려있지 않다는 신호로 읽는다.
저널 sentiment: 솔직히 0/2
같은 30일 동안 저널 sentiment 모듈이 7일 forward를 예측한 건 단 2건, 그중 맞춘 건 0건이다. 평균 수익률은 +2.6%. 표본 2건으로 ‘sentiment 모듈은 망했다’고 말하는 건 그 자체로 나쁜 분석이다. 다만 표본이 이렇게 적게 쌓이는 것 자체가 문제다. sentiment 시그널이 발화되는 빈도가 너무 낮거나, 발화 조건이 지나치게 보수적으로 설정돼 있다는 뜻이다. 다음 달엔 조건을 한 번 손볼 생각이다.
시장 regime: risk_on 16일
30일 중 risk_on으로 분류된 날이 16일. 절반을 약간 넘는다. 위쪽 decile이 잘 나온 배경에는 이 구간이 깔려 있을 가능성이 높다. 시장이 위로 가는 날이 많으면 매력도 상위 종목이 평균적으로 잘 나오는 건 모델 실력이라기보다 시장의 결이다. 다음 측정에서는 regime별로 decile 정확도를 쪼개서 봐야겠다. risk_off 구간에서도 70~80 decile이 60~70 decile을 이기는지가 진짜 시험대다.
정리
위쪽 단조성은 일단 살아있다. 가운데 50~60 구간이 마이너스로 꺾인 건 다음 30일 데이터로 재확인이 필요하다. sentiment 모듈은 표본 자체가 너무 적어 평가 보류. 모든 숫자는 87건짜리 작은 표본 위에 서 있다는 점만 잊지 않으면 된다.
'🧠 AI 분석' 카테고리의 다른 글
| 30일 scout 데이터. 자동 발견은 9건, 사람 손이 21건 (0) | 2026.05.20 |
|---|---|
| scout는 9건, 사람이 21건. 자동화의 한계 (0) | 2026.05.13 |
| Scout 30건 발견 vs Regime 1일, 비정합의 한 달 (0) | 2026.05.12 |
