도박에 관해 모두가 아는 사실이 하나 있다면, 바로 하우스(카지노)는 결국 이긴다는 점이다. 그리고 실제로 카지노는 항상 이익을 남긴다. 그럼에도 불구하고 시스템의 빈틈을 노리는 여러 접근이 존재하며, 그중에는 놀랍게도 법의 테두리 안에서 가능한 방법도 있다. 온라인 환경에서도 이러한 시도는 기술과 데이터 덕분에 점점 더 정교해지고 있다.
약 반세기 전, 수학자 에드워드 소프(Edward Thorp)는 “카드 카운팅(card counting)”을 통해 블랙잭(Blackjack)에서 덱에 남은 카드의 구성을 추적해 우위를 얻는 법을 소개한 획기적인 책을 출간했다. 그 이후 카지노는 카운팅을 색출·억제하려는 시도를 이어 왔고, 반대로 플레이어는 들키지 않는 숙련도를 높여 왔다. 그렇다면 오늘날에도 카지노를 ‘합법적으로’ 이길 수 있을까? 그리고 미래에는 무엇이 달라질까?
카지노가 돈을 버는 방식: 하우스 엣지
카지노는 사업이며, 기본적으로 마진(하우스 엣지, house edge)을 내장한다. 예를 들어 유럽식 룰렛에서 단일 숫자에 베팅하면 배당은 35:1이지만, 실제 확률은 36:1이다. 미국식 룰렛에서는 실제 확률이 37:1에 가깝다.
즉, 배당이 실제 확률보다 낮게 책정되는 구조 자체가 하우스 엣지이며, 장기적으로 카지노가 이기는 이유다. 물론 누군가는 이겨야 게임이 유지된다. 그렇지 않다면 카지노는 존재할 수 없다.
어드밴티지 플레이어란 누구인가
카지노가 가장 꺼리는 손님은 어드밴티지 플레이어(advantage player), 즉 하우스보다 우위를 확보하려는 사람들이다. 이 중에는 부정·불법 행위도 섞여 있다. 예컨대 패스트 포스팅(past posting)(베팅 마감 후 베팅), 포커에서의 공모(collusion), 컴퓨터로 의사결정 보조 등이 있다.
그러나 카드 카운팅 자체는 ‘합법’이다.
블랙잭의 목표는 딜러보다 21에 더 가깝게 합을 맞추되 21을 넘기지 않는 것이다. 여러 손이 같은 덱에서 이어지기 때문에 이전 결과가 다음 손에 영향을 미친다. 예를 들어, 어떤 라운드에서 10이 이미 다수 소모되었다면 다음 라운드에서 10이 나올 확률은 낮아진다. 이는 각 스핀이 서로 독립적인 룰렛과 본질적으로 다르다.
카드 카운팅의 핵심과 ‘기본 전략’
핵심 아이디어는 남은 카드에 높은 값(10·J·Q·K)이 많을수록 플레이어가 유리하다는 점이다. 플레이어는 16에서 ‘히트’를 참을 수 있지만, 딜러는 하우스 룰에 따라 반드시 받아야 할 때가 많다. 그래서 높은 카드 비중이 커질수록 딜러의 버스트 확률이 높아진다.
여기에 ‘기본 전략(Basic Strategy)’을 결합한다. 이는 수백만 판 시뮬레이션으로 도출한, 각 상황별 최적 행동(히트·스탠드·더블다운·스플릿 등) 지침이다. 카운팅 + 기본 전략의 조합은 합법적이면서도 통계적으로 우위를 추구하는 대표적 방법이다.
끝나지 않는 공방: 카지노의 대응
카지노는 카운팅 억제를 위해 여러 방어 장치를 도입했다.
- 카운터 식별 후 퇴장·출입 금지,
- 덱 수 증가(1덱 → 6~8덱)로 변동성 완화,
- 덱의 약 75%만 쓰고 셔플,
- 자동 셔플 머신으로 상시 섞기 등.
그럼에도 블랙잭을 없애지 않는 이유는 명확하다. 여전히 인기 있고 수익성 있는 게임이며, 숙련되지 않은 ‘예비 카운터’들은 실수로 오히려 하우스 수익에 기여한다. 즉, 블랙잭은 고객 유입과 수익의 균형을 맞춰주는 종목이다.
개인에서 팀으로: MIT가 보여준 방식
많은 숙련 플레이어는 “기술을 쓰는 게 왜 문제냐”며, 실력 기반 게임성을 인정하라고 주장한다. 개인 카운터는 집중·베팅 증액 패턴 등으로 들키기 쉬운 반면, 팀 플레이는 이를 분산시킨다.
MIT 팀은 카운터(관찰자)와 베터(실행자)를 분리해 운영했다. 카운터는 테이블 밖에서도 카운트를 유지하고, 임계값에 도달하면 신호를 보내 베터가 입장해 고액 베팅을 시작한다. 탐지가 훨씬 어려운 구조다. 이에 맞서 카지노는 셔플 이후에만 신규 입장을 허용하는 식으로 전술을 무력화하기도 한다.
결론: 50년의 싸움, 그리고 알고리즘의 시대
소프의 책이 나온 지 50년, 블랙잭 플레이어와 카지노의 두뇌 싸움은 여전히 진행형이다. 최근에는 인공 신경망(ANN)을 이용해 전략을 ‘학습’시키는 연구도 이루어졌다. 수천·수만 판을 반복 학습하면서 상황별 최적 행동을 스스로 개선하는 방식이다.
앞으로 자동화된 프로그램이 더 정교한 전략을 스스로 터득할 여지가 크다. 결국 사람 대 카지노의 대결은 데이터·알고리즘의 경쟁으로 더 깊어질 수 있다. 합법의 선을 지키며 기대값을 끌어올리는 시도는, 기술이 진화할수록 더 창의적이고 복합적인 형태로 확장될 것이다.