요즘은 기술의 발달로 로또(Lotto) 1등 당첨번호를 찾는데, AI Agent와 나처럼 ML을 이용하는 사람들이 많아졌다.
나도 한 때, ML 분석으로 추출한 6개의 번호로 8주 연속으로 5등과 4등에 당첨되었던 시절(?)이 있었다.
그러나 어느 시점부터인지는 잘 모르겠지만 AI Agent 의 놀라운 예측성능과 이를 이용하는 사람들이 기하급수적으로 많아졌기 때문인지 회를 거듭할수록 통계분석에 의한 번호조합을 피해가는 추첨번호의 출현이 점점 많아지는거 같은 느낌이다.
나 역시 역설적이게도 분석한 번호들을 개별로 놓고 본다면 분석하면 할수록 일치되는 번호의 갯수가 점점 줄어들고 있다.
그래서 Lotto 1회부터 바로 최근인 1215회까지 1등에 당첨된 번호조합 모두를 가지고 통계분석해 보았다.
글시작에 앞서, 로또(Lotto) 추첨에서 출현번호들은 통계적으로 무작위성을 가지고 정상범주 안에 있음을 전제로 한다.
통계학적으로 '인위적 개입이 없다'는 판단은 추첨결과가 **무작위성(Randomness)**을 띠고 있음으로 확인한다.
그 판단요소로는
- 개별 번호의 출현 균등성 (Uniformity)
- 시행 간의 독립성 (Independence)
- 시퀀스의 무작위성 및 복잡도 (Sequence Randomness)
가 있다.
01. Number Frequency Heatmap

- 60회 슬라이딩 윈도우로 번호별 출현 빈도의 변화를 시간축으로 펼쳐놓음
- 전체적으로 빨강·파랑이 고르게 섞여 있고, 어떤 특정 번호가 처음부터 끝까지 계속 빨갛거나 파랗지 않음. 장기적으로는 번호 균일성이 유지됨.
- 특정 X축 구간(예: ~244, ~365, ~608~669, ~1034~1095)에서 여러 번호가 동시에 같은 색으로 쏠리는 수직 줄무늬가 보임
02. Number Pair Co-occurrence Deviation

- 45개 번호 중 두 번호가 같은 회차에 함께 뽑힌 횟수(공동 출현)가 이론값보다 얼마나 많거나 적은지를 보여주는 쌍별 편차 행렬(Matrix)
- 7번과 23번이 이론적으로 함께 나와야 할 횟수가 32회인데 실제로 40번 나왔다면 편차 = +8 (빨간색), 반대로 20번만 나왔다면 = -12 (파란색)
- 1~20번 사이의 쌍들(왼쪽 상단) : 색이 옅어 편차가 작고 상대적으로 균일
- 오른쪽 하단(번호 30~45 구간) : 빨강과 파랑이 뚜렷하게 교차함. 일부 쌍은 과도하게 많이, 일부는 거의 안 나옴
- 40~45번 대 다른 번호들의 쌍 : 편차가 ±6~8에 달하는 강한 편향 존재
02. Sum of 6 Numbers Distribution

- 1~45에서 6개를 뽑으면 합계의 이론 평균은 정확히 138.0임
- 6개 당첨번호의 합계(Sum)가 정규분포를 따르는지 검증하는 히스토그램임
- 이는 정규분포에 가깝고 무작위 추첨되고 있음을 보였음
03. Number Frequency Distribution

- 1~45번 각 공이 1215회 동안 총 몇 번 뽑혔는지를 막대로 보여주는 빈도 분포도
- 34번이 최다(181회), 9번이 최저(133회)였음
- 1~45번 각 공의 출현이 거의 비슷하게 발생되었음을 확인
04. Rolling Sum Mean Trend

- 50회 이동평균(Rolling Mean) - 번호합계의 흐름 추적
- CUSUM (Cumulative Sum) - 구조적 변화점(Structural Break)을 자동탐지함
- CUSUM(누적합 관리도)은 평균에서 벗어난 정도를 누적함. 작은 이탈이라도 오래 지속되면 이를 감지하는 매우 민감한 탐지기임
- 하늘색 이동평균선이 전체 구간에서 이론값 138 근처를 안정적으로 유지
- 보라 음영(±1σ) 범위를 크게 벗어나는 지속적 이탈 없음
- CUSUM은 1215회 전체데이터 중 Draw 1115를 최대이탈지점으로 지목
- 이 시점 주변에서 이동평균(하늘색)이 이론값 138 아래로 급락하는 것을 보임
- 1115회 전후로 당첨번호 합계의 패턴이 미세하게 변화
CUSUM Chart

- 번호합계의 누적편차(이론 평균 138에서 얼마나 벗어났는지를 계속 더해가는 관리도
- Draw 1115 > 전체 1215회 중 유일한 임계값 도달
- Draw 400~850 > 음의 누적편차 지속 (번호합계가 오랫동안 평균 아래)
- Draw 850~1200 > 양의 누적편차 전환 및 급등 (번호합계가 평균 위로 급격히 이동)
- Draw 1115에서 +3σ 경계선에 도달 > 통계적 구조변화 확인 필요
Shannon Entropy Trend (Randomness Measure)

- "추첨이 얼마나 무작위한가?"를 정보이론으로 측정한 엔트로피(Shannon Entropy)의 시간변화 그래프
- 항상 같은 번호가 나오면 엔트로피는 0. 로또는 최대 엔트로피(5.492 bits, 이론 최대값)에 가까울수록 무작위성이 높음
- Draw ~760 구간 : 엔트로피가 5.40까지 급락 후 반등 → 해당 구간에서 특정번호 집중현상
- Draw ~1050 구간 : 또 한 번 5.40까지 급락
- 1000회 이후 엔트로피가 전반적으로 높아지면서 더 불규칙한 패턴이 나타남
Consecutive Number Rate Trend

- "6개 번호 중 연속된 숫자 쌍(예: 7,8 또는 23,24)이 포함될 확률"이 이론값(52.87%)과 얼마나 일치하는지를 100회 이동창으로 추적한 그래프
- Draw 550~650 구간 > 이론값 52.87%에서 최대 70%까지 급등. 정상 95% 신뢰구간을 벗어남
- 이 구간에서 6개 번호 중 연속 쌍이 비정상적으로 많이 출현했다는 의미
- Draw 100~150, 950~1050 구간에서는 42% 아래로 낮아지는 저출현 구간도 존재
1st Prize Winner Count Trend

- 1등 당첨자 수의 전체 시계열과 3σ 이상치(Outlier)를 동시에 시각화한 핵심 이상 탐지 차트
- 구조적 상승추세가 보임
- 546회차 (30명): 1~900회에서 유일한 3σ 초과
- 1019 (50명), 1041 (25명), 1060 (28명): 1000~1100회에 밀집
- 1128 (63명): 전체 1215회 중에 역대 최고로 가장 많은 1등 당첨자가 출현함 (Z=+10.63)
- 나머지 7건: 모두 1100~1215회차에 집중 (최근 315회(전체의 26%)에 집중)
Per-Draw Composite Anomaly Index

- 번호합계(Sum), 홀짝비율(Odd-Even), 번호범위(Range) 세 가지 지표를 하나로 합산한 "종합이상지수" 차트
- 파란점 > 각 회차의 종합 이상 지수
- 주황선 > 30회 이동평균
- 회색점선(1.435) > 95th 백분위 (상위 5% 이상 구간)
- 분홍점선(1.902) > 99th 백분위 (상위 1% 극단 이상 구간)
- 이동평균(주황)이 전구간에서 0.5~1.0 수준으로 비교적 안정
- 99th 백분위(1.902)를 넘는 극단 이상치들이 Early Period보다 Late Period에 더 밀집
- 주목할 회차 > 196(Early 최고점), 935/991(Mid-Late), 1041/1043/1171 등 후반부 집중
- 특이점 발생 빈도가 후반부로 갈수록 높아지는 밀집 경향을 보임
05. ACF = Autocorrelation Function (자기상관함수) 차트 - 1st Prize Winner Count

- "이번 회차 1등 당첨자 수가 많으면, 몇 회 뒤에도 많을까?"를 1~40회 시차(Lag)에 걸쳐 측정한 그래프
- X축 : (Lag)몇 회 전 데이터와 비교하는지 (1 = 바로 직전 회차, 10 = 10회 전)
- Y축 : (Autocorrelation)상관계수 (-1 ~ +1). 높을수록 강한 양의 상관
- 빨간막대 : 각 시차에서의 실제 자기상관 값
- 주황점선(±0.056) : 95% 신뢰구간 — 이 선 안에 있으면 "통계적으로 무의미(우연)"
- 순수하게 독립적인 무작위 추첨이라면:모든 막대가 ±0.056 점선 안에 들어와야 함
- 그러나 이 그래프에서는 모든 막대(Lag 1~40)가 0.31~0.41 수준으로 점선(0.056)을 6~7배 초과
- Lag 40까지도 상관이 전혀 사라지지 않고 유지됨
Rolling Chi-Square Test

- 하늘색선 > 100회 윈도우별 χ² 값
- 노란점선(60.5) > α=0.05 임계값
- 분홍점선(68.7) > α=0.01 임계값
- 회색점선(44) > 이론 기대값 (df=44)
- χ²가 너무 낮은 구간(20 이하)은 "지나치게 균일"한 것으로, 자연적 무작위보다 오히려 인위적으로 고른 것처럼 보일 수 있음
- χ²가 임계값을 넘는 구간은 "국지적 쏠림"
- 이상적인 무작위 추첨 경우, χ²가 44 근처에서 자연스러운 요동이 발생함
- Peak가 발생한 회차는 791/796/801회차, 1091/1096/1101회차임
Period-wise Box Plot (Kruskal-Wallis)

| 기간 | 회차 | 평균(μ) | 특징 |
| Period1 | R1~300 | 5.3명 | 박스 작고 낮음, 이상치 최대 23 |
| Period2 | R301~600 | 6.6명 | 유사하게 낮음, 이상치 30 |
| Period3 | R601~900 | 8.7명 | 박스 커지기 시작 |
| Period4 | R901~1215 | 12.9명 | 박스 가장 크고 높음, 이상치 50·63 |
- Cohen's d=1.43 (Large Effect)
- Period 4(50명, 63명)가 다른 기간의 최대값(23명, 30명)보다 높음
- 평균이 5.3 > 6.6 > 8.7 > 12.9로 증가
- 시간에 따라 로또 1등 당첨자수가 구조적으로 변화했음을 확인
Cumulative Mean Analysis

- 1회부터 현재까지의 1등 당첨자 수 누적 평균이 어떻게 수렴해가는지를 확인
- 하늘색선 : 1회부터의 누적평균
- 회색점선 : 전체평균 8.44명
- 청록음영 : 95% 신뢰구간 밴드
- 정상적인 무작위 시스템 경우, 초기(큰 변동) → 중반(안정수렴) → 후반(평균근처유지)
- Draw 200~800 구간 : 누적평균이 5.0 근처에서 안정
- Draw 800~ : 누적평균이 증가, 8.44까지 상승
- 800~1215회 구간의 평균이 이전 800회의 평균보다 현저히 높다는 의미
Q-Q Plot (Normal Probability Plot)

- 1등 당첨자 수의 분포가 정규분포(Normal Distribution)를 따르는지 검증
- 모든 파란점이 초록점선(이론 정규분포선) 위에 정확히 놓이면 완벽한 정규분포. 점선에서 벗어날수록 정규분포가 아님
- 중앙부(X:-1~+2): 파란 점들이 초록선에 거의 밀착 → 일반적인 당첨자수는 정규분포에 근접
- 하단부(X:-3~-2): 점들이 선 위에 수평으로 쌓임 → 당첨자가 0~2명인 회차가 이론보다 많음
- 상단부(X:+2~+3, 빨간별): 점들이 선에서 극단적으로 위로 이탈
- 이론적으로 X=3에서 Y도 약 3이어야 하는데, 실제 R1(1128회)는 Y=10.6, R4(1019회)는 Y=8.1으로 이론값의 3~4배 높이로 튀어 올라 있음
- R²=0.8693 : 86.9%는 정규분포를 따르지만 13.1%가 정규분포 밖에 있음을 의미
글 작성을 마치며,
전제에 따라 결과에서도 로또(Lotto)는 전체기간에서 볼 때, 무작위성을 가진다고 볼 수 있을거 같다.
다만, 몇 군데에서 특이점이 발생하였는데 그 특이점들이 현재까지의 로또(Lotto) 판매 전체기간에서의 신뢰성을 훼손시킬 정도는 아니라고 본다. 특이점은 얼마든지 일어날 수 있는 현상이다.
그리고 로또(Lotto)의 판매량은 꾸준히 증가하고 있다.
로또(Lotto)는 판매와 동시에 모든 데이터(판매지역, 판매점, 번호세트, 구매횟수, 구매형태 등)가 DB에 저장되어 해당 회차에서의 모집단을 구성한다. 모든 데이터가 전산화되기 때문에 사전에 각 번호조합별 산포도 확인이 가능할 것이다.
통계의 일관성은 유지하되 특이점은 얼마든지 자연스럽게 발생할 수 있는 부분이다.
참고로 이 글을 작성하던 날인 2026년 3월 21일 토요일, 1216회차 당첨번호가 나왔는데, 숫자조합은 3/10/14/15/23/24+25 였다.
이번주에도 ML을 돌렸다면 아마 하나도 안 맞았을 것이다. ㅋㅋ
밑에 동영상은 2023년 일어났던 사례인데 최근에 SNS에서 다시 회자되고 있길래 그냥 한 번 링크 걸어본다.
링크 바로가기 > https://www.youtube.com/shorts/ctKmL3e8qiI
<R00. 끝>
'Fortune Life...' 카테고리의 다른 글
| ML로 제1215회 로또번호 예측해 보기 (1) | 2026.03.08 |
|---|---|
| ML로 제1208회 로또번호 예측해 보기 (0) | 2026.01.24 |
| ML로 제1198회 로또번호 예측해 보기 (0) | 2025.11.15 |
| ML로 제1184회 로또번호 예측해 보기 (1) | 2025.08.09 |
| ML로 제1182회 로또번호 예측해 보기 (5) | 2025.07.26 |