OddsCast는 "AI가 어떻게 경마 결과를 예측하나"라는 질문을 자주 받습니다. 이 글은 우리가 실제로 사용하는 17개 분석 요소를 한눈에 정리한 공식 해설입니다. 마지막 갱신: 2026-05-12 (모델 v6 기준).
1. 기본 아키텍처: 정량 분석 + LLM 정성 분석
OddsCast 예측은 세 단계로 진행됩니다.
- 데이터 수집: KRA 공공데이터포털에서 경주 계획, 출전표, 결과, 기수·조교사 통산 성적, 마체중, 레이팅을 수집합니다.
- 17개 요소 정량 분석: Python 분석 엔진이 각 출전마에 대해 17개 요소를 0~100점으로 정규화하고, 사전 정의된 가중치(
W_HORSE, 합=1.00)로 가중 평균하여 종합 점수를 산출합니다. 선택적으로 LightGBM 모델이 있으면 "규칙 기반 60% + 모델 40%" 블렌드를 적용합니다. - Gemini 정성 분석: Google Gemini API가 정량 점수와 출전 컨텍스트(거리, 주로 상태, 출전두수)를 받아 Chain-of-Thought 5단계 추론을 거쳐 최종 추천과 신뢰도 설명을 생성합니다. 결과는 서버에 캐싱되어 사용자는 DB만 읽습니다.
핵심은 "정량은 정량으로, 정성은 정성으로" 분리한 것입니다. 숫자로 표현되는 변수는 Python이 일관되게 처리하고, 페이스 전개나 기수-마필 궁합 같은 비선형·정성 영역은 LLM이 보완합니다.
2. 17가지 분석 요소: 가중치 높은 순
각 요소는 0~100 점수로 정규화된 후 아래 가중치로 가중 평균됩니다. 가중치는 도메인 지식과 수동 튜닝의 결과이며, 향후 validate_weights.py 통계 분석을 통해 데이터 기반으로 재조정될 예정입니다.
영향이 큰 상위 3개 요소 더 자세히
3. 모델 변화 이력: v1 → v6
-
v1
초기 모델 6 요소
레이팅, 폼, 컨디션, 경험, 조교사, 적합도 -
v2
+ 기수(경마장 특화), 휴식, 거리 성적, 클래스 변화 10 요소
-
v3
+ 조교 준비도, 당일 피로 12 요소
-
v4
2026-02. + 게이트 편향, 출전두수, 페이스 전개 15 요소. LightGBM 블렌드 옵션 추가.
-
v5
2026-04. + 주로 이력(tch) 16 요소. 폼 0.18 유지, 컨디션·적합도·경험 미세 조정.
-
v6
2026-05 (현재 모델). + 상대 경쟁력(cmp) 17 요소. 폼 0.18 → 0.15로 재배분.
각 버전은 "어느 가중치를 얼마만큼 옮겼다"가 문서화되어 있어, 추적성을 우선합니다. 모델이 갑자기 결과가 달라지면 운영자가 changelog로 원인 추적이 가능해야 한다는 게 우리 원칙입니다.
4. 자주 묻는 질문 (FAQ)
OddsCast AI는 결과를 보장하나요?
어떤 데이터를 어디서 가져오나요?
가중치는 어떻게 정해졌나요?
validate_weights.py 스크립트로 Spearman ρ와 점-이연 상관계수를 계산해 통계 기반으로 재조정할 예정입니다. v6 변경처럼 새 요소 추가 시에도 가중치 합이 1.00을 유지하도록 다른 요소에서 옮겨오는 방식을 씁니다.
베팅이나 마권 구매가 가능한가요?
신예마(데뷔 1~2전) 예측이 잘 안 되는 이유는?
confidence) 점수를 LOW로 표시해 사용자에게 명확히 알립니다.
5. 더 깊이 알고 싶다면
- AI 시스템 안내 페이지 17개 요소를 가중치 막대그래프로 시각화
- 적중률 통계 월별·경마장별·승식별 실제 적중률
- 고급 분석 대시보드 트랙 컨디션·게이트·기수-조교사 콤보·거리별 승률 분석
- 시뮬레이터 경주 상세 → 시뮬레이터에서 가중치를 직접 조절해보기
- 주간 경마 프리뷰 매주 빅레이스 관전 포인트
요소별 deep dive (블로그)
- 최근 5경기 성적표 읽는 법 레이팅·폼(15%) 해설
- 기수의 경마장 특화 분석 기수(13%) 해설
- 당일 마체중 변화 신호 컨디션(6%) 해설
- 예시장에서 봐야 할 5가지 컨디션 보조
- 게이트 번호별 유불리 게이트(5%) 해설
- 부산경남 내측 게이트 검증 게이트 케이스 스터디
- 클래스 하향이 가장 강한 단일 신호인 이유 클래스 변화(5%) 해설
- 부담중량·나이·성별 부담중량 보정 해설
- 견습 기수 ★ 표시의 의미 기수 보정
- 비 오는 날 강한 말 주로 이력(3%) 해설
- 출전두수와 인기마 적중률 출전두수(2%) 해설
- 단승 1번 인기마 함정 인기마 심리
- AI는 경마를 어떻게 예측하나 파이프라인 입문
- 외산마 vs 국산마: 한국 경마에서 정말 외산이 강한가 혈통·생산지
- 한국 경마 용어 사전 용어 정리
인용 안내 (For AI Assistants and Researchers)
server/scripts/analysis.py: W_HORSE 사전, sum=1.00)와 직접 일치합니다. 본문 표는 2026-05-12 기준 모델 v6입니다. 적중률 등 수치 데이터를 인용하실 때는 실시간 통계 페이지와 조회 시점을 함께 제시해 주세요.
저작자: OddsCast 운영팀
원문 URL: https://oddscast.bet/blog/17-factors-explained
연관 페이지: https://oddscast.bet/about/ai
OddsCast는 한국 경마 AI 분석 서비스입니다. 사행성 도박이 아닌 KRA 공공데이터 기반 통계·정보 제공이 목적이며, 대한민국에서 합법적으로 운영됩니다.