1. 과거 데이터 기반 모델은 새로운 패턴에 취약하다
시가 예측 모델은 과거 상장 사례의 패턴을 학습해서 새 종목의 시초가를 추정한다. 경쟁률, 확약 비율, 유통 물량, 공모가 대비 업종 PER 같은 변수들의 과거 관계를 기반으로 예측값을 내놓는다. 이 접근은 과거와 유사한 조건이 반복될 때는 꽤 잘 작동한다.
하지만 시장에 새로운 유형의 종목이 나타나거나, 투자자 행동 패턴이 크게 바뀌면 과거 학습 데이터가 무력해진다. 예를 들어 그동안 없던 업종의 대형 IPO가 나오거나, 개인 투자자의 참여 비율이 갑자기 급증하는 시기에는 모델이 참고했던 과거 패턴 자체가 유효하지 않을 수 있다.
- 과거 패턴이 반복되는 환경에서 모델의 정확도가 가장 높다.
- 새로운 업종, 새로운 투자자 구성은 모델의 학습 범위 밖이다.
- 시장 체제 변화(regime change) 시점에서는 모든 과거 기반 모델이 취약하다.
2. 시장 심리는 숫자로 완전히 포착되지 않는다
경쟁률이 같아도 시장 분위기에 따라 시초가는 크게 달라진다. 전체 증시가 상승장일 때의 1000대 1과 하락장일 때의 1000대 1은 다른 의미를 가진다. 모델은 경쟁률이라는 숫자를 넣을 수 있지만, 그 숫자 뒤에 있는 투자자 심리의 온도까지 정밀하게 반영하기는 어렵다.
특히 공모주 시장에서는 "기대감"과 "불안감"이 비선형적으로 가격에 반영된다. 좋은 신호가 하나 더 추가되었다고 시초가가 선형으로 올라가는 것이 아니라, 특정 임계점을 넘으면 급격하게 올라가거나, 반대로 불안 요인 하나에 기대가 급격히 무너지기도 한다. 이런 비선형적 반응은 과거 데이터의 평균적 관계에서 벗어나기 때문에 모델이 놓치기 쉽다.
3. 한계를 알면 모델을 참고 도구로 쓸 수 있다
예측 모델의 한계를 인식한다고 해서 모델을 안 쓰라는 뜻은 아니다. 오히려 한계를 알아야 제대로 활용할 수 있다. 모델이 내놓은 예측값 자체보다, 모델이 높은 확신을 가진 구간과 낮은 확신을 가진 구간을 구분해서 보는 것이 더 유용하다.
IPO LAB에서 백테스트 히스토리를 제공하는 이유도 여기에 있다. 모델이 과거에 어떤 조건에서 잘 맞았고 어떤 조건에서 빗나갔는지를 공개해야, 사용자가 현재 종목에 모델을 적용할 때 스스로 가감할 수 있다. 예측 모델은 답을 주는 도구가 아니라, 질문을 더 정교하게 만드는 도구로 써야 한다.
- 모델 예측값 자체보다 확신 구간을 구분해서 참고한다.
- 백테스트 기록으로 모델이 약한 조건을 사전에 파악할 수 있다.
- 예측 모델은 답이 아니라 더 나은 질문을 만드는 도구다.