고양시갑 수수께끼 - 총선 사전투표/당일투표 차이에 대한 약간의 분석 일기/잡담

총선 사전투표 조작 음모이론과 관련하여 이전 게시물에서 서울 종로구의 개별투표단위 일부(5개)에 대해서 관내사전투표의 분포와 당일투표의 분포를 비교했었는데, 매우 신기한(?) 결과가 나왔기 때문에, 이번에는 민주당/통합당 대결이 아니라 민주당/통합당/정의당 3파전이 벌어진 곳에 대해서 일부 계산을 해 보았다. 가정은 이전 게시물에서 제시한 것과 동일하며, 아래와 같다. (아마도 이전 게시물을 먼저 읽어야 이해가 쉬울 것이다. 여기로)

가정 1. 솔직히 회의적이지만, 일단 백번 양보해서 조작이 있었다 치자. 조작이 가해진 쪽은 당일투표가 아니라 사전투표다. 투표일과 개표일 사이에 시간적 여유가 있기 때문에 조작할 확률이 훨씬 더 높을 테니까.

가정 2(수정). 사전투표와 당일투표의 통계적 특성 차이는 두가지 원인에서 비롯될 가능성이 있는데, 하나는 보수 유투버들의 영향력이고 나머지 하나는 가정 1에서 상정한 사전투표 조작이다. 어느쪽이 얼만큼의 비중으로 영향을 주었는지는 규명할 수 없지만 어쨌든 사전투표와 당일투표가 통계적으로 차이를 보일 가능성은 충분히 존재한다.

계산 방식은 이전 게시물과 동일하다. 즉, "사전투표가 당일투표와 동일한 득표 분표를 가지고 있다고 가정하여 예상한 가상의 사전투표 득표"와 "실제 사전투표 득표"와의 차이가 어떻게 되는지 계산했다.

개표결과 자료는 선관위 선거통계시스템에 공개되어 있다. 여기로.

대상은 경기도 고양시갑(고양시 덕양구)이다. 더불어민주당 문명순 후보, 미래통합당 이경환 후보, 정의당 심상정 후보가 3파전을 벌였고 심상정 후보가 당선되었다. 양강 구도가 아니라 3파전이라 이번엔 어떨까 싶어서 골라 보았다.

[ 고양시 덕양구 주교동 : 투표소 4개 ]

주교동 관내사전투표에서 민주당 문명순 후보는 976표, 통합당 이경환 후보는 883표, 정의당 심상정 후보는 1166표를 획득했다.

관내사전투표 소계는 976+883+1166=3025표.

주교동 당일투표의 개표 현황은 아래와 같다.
민주당 문명순 1215표(254+356+259+346=1215)
통합당 이경환 1952표(377+590+440+545=1952)
정의당 심상정 1633표(276+473+440+444=1633)

당일투표 소계는 4800표(1215+1952+1633=4800).

당일투표 득표율은 아래와 같다.
민주당 문명순 25.313%(1215/4800*100=25.313)
통합당 이경환 40.667%(1952/4800*100=40.667)
정의당 심상정 34.021%(1633/4800*100= 34.021)

만약 사전투표의 통계적 특성이 당일투표와 동일했다면, 각 후보는 사전투표에서 아래와 같이 득표했어야 한다.
민주당 문명순(가상) 765표(3025*25.313/100=765)
통합당 이경환(가상) 1230표(3025*40.667/100=1230)
정의당 심상정(가상) 1029표(3025*34.021/100=1029)

위의 가상 득표와 실제 사전투표 득표수와의 차이는 아래와 같다.
민주당 문명순 211표(976-765=211)
통합당 이경환 -347표(883-1230=-347)
정의당 심상정 137표(1166-1029=137)

위의 차이를 관내사전투표수 기준으로 비율을 계산하면 아래와 같다.
민주당 문명순 6.975%(211/3025*100=6.975)
통합당 이경환 -11.471%(-347/3025*100=-11.471)
정의당 심상정 4.529%(137/3025*100=4.529)

[ 고양시 덕양구 원신동: 투표소 5개 ]

원신동 관내사전투표에서 민주당 문명순 후보는 703표, 통합당 이경환 후보는 581표, 정의당 심상정 후보는 1100표를 획득했다.

관내사전투표 소계는 703+581+1100=2384표.

주교동 당일투표의 개표 현황은 아래와 같다.
민주당 문명순 1969표(405+71+561+493+439=1969)
통합당 이경환 2713표(550+193+737+679+554=2713)
정의당 심상정 3951표(1147+110+766+1124+804=3951)

당일투표 소계는 8633표(1969+2713+3951=8633).

당일투표 득표율은 아래와 같다.
민주당 문명순 22.808%(1969/8633*100=22.808)
통합당 이경환 31.426%(2613/8633*100=31.426)
정의당 심상정 45.766%(3951/8633*100= 45.766)

만약 사전투표의 통계적 특성이 당일투표와 동일했다면, 각 후보는 사전투표에서 아래와 같이 득표했어야 한다.
민주당 문명순(가상) 543표(2384*22.808/100=543)
통합당 이경환(가상) 749표(2384*31.426/100=749)
정의당 심상정(가상) 1091표(2384*45.766/100=1091)

위의 가상 득표와 실제 사전투표 득표수와의 차이는 아래와 같다.
민주당 문명순 160표(703-543=160)
통합당 이경환 -168표(581-749=-168)
정의당 심상정 9표(1100-1091=9)

위의 차이를 관내사전투표수 기준으로 비율을 계산하면 아래와 같다.
민주당 문명순 6.711%(160/2384*100=6.711)
통합당 이경환 -7.047%(-168/2384*100=-7.047)
정의당 심상정 0.378%(9/2384*100=0.378)


둘 다 민주당의 관내사전투표 격차 비율이 7%수준이고, 희한하게도 원신동의 정의당 득표는 관내사전투표와 당일투표가 거의 유사하다. 하나 더 해 본다.


[ 고양시 덕양구 흥도동: 투표소 11개 ]

원신동 관내사전투표에서 민주당 문명순 후보는 1212표, 통합당 이경환 후보는 912표, 정의당 심상정 후보는 1863표를 획득했다.

관내사전투표 소계는 1212+912+1863=3987표.

원신동 당일투표의 개표 현황은 아래와 같다.
민주당 문명순 4161표(91+422+351+499+336+471+548+301+261+390+491=4161)
통합당 이경환 5212표(269+474+505+479+371+627+750+354+296+597+490=5212)
정의당 심상정 7926표(143+404+1135+1154+483+589+642+834+922+1102+518=7926)

당일투표 소계는 17299표(4161+5212+7926=17299).

당일투표 득표율은 아래와 같다.
민주당 문명순 24.053%(4161/17299*100=25.313)
통합당 이경환 30.129%(5212/17299*100=31.426)
정의당 심상정 45.818%(7926/17299*100= 45.818)

만약 사전투표의 통계적 특성이 당일투표와 동일했다면, 각 후보는 사전투표에서 아래와 같이 득표했어야 한다.
민주당 문명순(가상) 959표(3987*24.053/100=959)
통합당 이경환(가상) 1201표(3987*30.129/100=1201)
정의당 심상정(가상) 1826표(3987*45.818/100=1826)

위의 가상 득표와 실제 사전투표 득표수와의 차이는 아래와 같다.
민주당 문명순 253표(1212-959=253)
통합당 이경환 -289표(912-1201=-289)
정의당 심상정 37표(1863-1826=37)

위의 차이를 관내사전투표수 기준으로 비율을 계산하면 아래와 같다.
민주당 문명순 6.345%(253/3987*100=6.345)
통합당 이경환 -7.249%(-289/3987*100=-7.249)
정의당 심상정 0.928%(37/3987*100=0.928)


이번에도 정의당만 관내사전투표와 당일투표의 분포가 거의 비슷하다. 대체 뭐냐 -_-;

이전 게시물에서 인용했던 이준석 후보의 발언 관련 조선일보 기사 내용을 여기에 다시 적어 보면 아래와 같다.

“보수 유튜버 중심으로 사전투표에 CCTV가 없으니 그건 정부에서 부정을 일으킬 수 있으니까 본투표로 가라고 했다. 실제로 본투표에 보수가 몰렸고 사전투표에 보수가 안 갔다”면서 “사전투표가 부정이라는 분들은 지고도 정신 못 차리는 것”이라고 했다.
 
사전투표에서 보수 지지층이 대거 이탈해서 본투표로 갔다고 가정해 보자. 민주당과 정의당 지지층은 보수 유튜버가 뭐라고 말했던지 무시하고 그냥 원래 하던 대로 투표했을 것이다. 미래통합당 지지자들만 사전투표에서 대거 빠졌으므로, 관내사전투표와 당일투표와의 격차를 조사하면 관내사전투표 득표 비율 격차가 민주당과 정의당에서 동시에 올라가야 한다.

첫번째로 계산한 주교동의 경우 위의 가설에 부합한다고 볼 수 있을 듯하다.

반면에 원신동과 흥도동은 뭔가 굉장히 희한한데, 통계적 격차는 오로지 민주당/통합당 사이에서만 발생하고 정의당은 관내사전투표와 당일투표의 통계적 차이가 매우 적다. 이것을 보수층의 사전투표 이탈 현상을 가지고 설명할 수 있느냐의 문제가 생긴다.

황당하게도, 원신동/흥도동은 오히려 사전투표 조작 음모이론과 부합하는 측면을 보여주고 있다. 보수층의 사전투표 이탈은 그리 크지 않은 상태에서 누군가가 사전투표 소계 대비 일정 비율 만큼을 통합당 표에서 제거하고 그만큼을 민주당 표로 채워 넣었고, 정의당 표는 건드리지 않고 그대로 두었기 때문에 통계적 특성이 보존되었다는 식의 시나리오를 쓸 수 있게 되는 것이다. -_-;; 물리적으로 투표용지를 바꿨는지, 개표/결과집계와 관련된 장비/소프트웨어에 조작을 가했는지, 아니면 둘 다인지는 모르겠지만;

원래 이러한 계산을 시작했던 이유는 사전투표 조작 음모이론이 얼마나 판타지적인 주장인지 수치 계산을 통해서 드러내기 위해서였는데, 이런 결과를 놓고 보니 이제는 나도 뭐가 뭔지 잘 모르겠다. 대체 어떻게 된거냐 -_-;;

개표단위 일부 몇개만 가지고는 뭐라 얘기하기 애매하고, 수작업으로 이렇게 계산하기도 귀찮고, 아무래도 스프레드시트를 만들어서 좀 더 계산해 봐야할 듯.



핑백

덧글

  • 2020/04/19 20:14 # 답글 비공개

    비공개 덧글입니다.
  • 2020/04/19 21:51 # 비공개

    비공개 답글입니다.
  • 티피 2020/04/19 22:23 # 답글

    이것도 딱 3가지 동의 투표소만 분석했는데 바로 조작설과 부합하지 않는 주교동이 튀어나오는 걸 보면 조작설에 신빙성을 더하는 게 아니라 오히려 조작설의 일관성에 의문이 들게 하는 글 같은데요;;

    그리고 이 분석은 어디까지나 '민주당과 정의당 지지층은 그냥 원래 하던대로 투표했을 것이다' 라는 전제가 맞아야만 성립이 되죠. 전국 단위라면 거의 그렇게 수렴되겠지만 동 단위의 미시적인 상황이라면 그 원래 하던대로 투표하지 않는 여러 가지 변수가 나타날 수 있어요. 어떻게 보면 그 열렬한(?) 민주당과 정의당 지지자를 너무 수동적으로 상정한 가설이 아닌가 싶기도 하고요. 당장 주교동과 원신동의 심상정 지지자들의 구체적인 충성심이나 상대에 대한 견제 심리가 달라서 사전사후 격차에 영향을 줬다고도 할 수 있죠. 이 표만 제거하고 저 표를 채우고 여기는 가만히 놔둬서 이렇게 되었다... 라는 설명이 아니어도 된다는 것입니다.

    아시겠지만 조작설로도 설명할 수는 있는 상황이 아니라 조작설로만 설명되는 상황이어야 조작설을 신빙성있다고 말할 수 있습니다. 사실 개표단위 몇개만 가지고는 뭐라고 할 수 없다는 그 말이 정답이긴 하겠지만, 원래 가설의 증명에 있어서는 반례 하나도 치명적으로 작용할진데 그 반례에 대해서는 상대적으로 서술을 축소해서 조작설에 관대한 태도를 보이는 게 아닌가 싶어요.
  • 반달가면 2020/04/19 22:57 #

    이전 게시물이나 이번 게시물이나 원래 작업의 시작은 객관적인 산술계산으로 음모이론을 논파하기 위한 목적이었고, 스프레드시트를 구성해서 특정 선거구 전체를 일일이 계산할 가치는 없을 것 같아서 시험 삼아 몇개만 뽑아본 것이었습니다.

    그런데 제가 예상했던 것과는 상당히 다른 양상이라 오히려 궁금증이 증폭되고 있어서 어쨌든 스프레드시트는 만들어 볼 예정입니다. 동단위도 통상 투표인원 규모가 수백명 이상이므로 같은 모집단의 표본이라면 관외사전/관내사전/본투표에서 어느 정도 통계적 경향성이 부합해야 되지 않나 싶은데, 어쨌든 범위를 넓혀서 고양시갑 투표소 전체를 살펴보면 좀 더 합리적인 설명 내지는 흥미로운 논의가 가능하지 않을까 싶네요.

    반례의 문제에 대한 의견을 잠깐 말씀드리면, 만약 누군가 조작을 한다고 해도 해당 선거구를 100% 다 동일한 비율/파라메터로 조작하는 멍청한 짓은 안 할 겁니다.

    제가 만약 조작을 한다면 어떤 동은 조작하고 어떤 동은 놔두고 이런 식으로 할 겁니다. 조작하는 동 역시 어떤 동은 15% 정도 하고 어떤 동은 10% 정도 해서 정상적인 분포와 이상한 분포를 뒤섞을 겁니다. 조작이라 하기도 애매하고 아니라고 하기도 애매하도록 말이죠.

    총선의 규모를 볼 때 반례가 단 1개도 없는 완벽한 조작 가설은 아예 나올 일이 없습니다. 이걸 가지고 조작이라고 우길 생각도 없고요.

    적극적인 의견 개진에 감사드리며, 선거가 조작되었다는 주장을 하고 싶어서 이 글을 쓴 것으로 오해하지는 않으셨으면 합니다.
  • 잘모르겠다 2020/04/20 00:01 # 삭제

    https://blog.naver.com/windlee5/221917531251
  • 티피 2020/04/20 00:24 #

    잘모르겠다// 저기 관외 관내 문제는 이미 비슷한 숫자가 나오는 게 당연하다고 제 블로그에서도 글을 써놨는데요...

    [우선 말씀하신 관외/관내 득표수 비율은 비슷한 것이 정상입니다. 같은 모집단(선거구)의 표본이므로 모집단과 표본의 규모가 충분히 클 경우 관내투표의 지지율 분포와 관외투표의 지지율 분포가 비슷한 통계적 특성을 보이는 것은 전혀 이상하지 않습니다. ]

    심지어 여기 주인인 반달가면님도 관외관내 문제는 이런 의견입니다. 조작설 중에서도 하필 그 관외관내 이야기라면 특히 매우 곤란해요.
  • 티피 2020/04/20 00:45 #

    반달가면// 당연히 한두개의 반례는 오차범위 내에서 자연스럽게 나올 수도 있고 심지어 조작을 하는 사람이 일부러 넣을 수도 있겠지만, 그렇게 되면 데이터 자체는 별 의미가 없고 그 성격을 주관적으로 해석하는 문제로 비화되죠.

    더 많는 지역을 조사해도 결국 이렇게 가설에 부합하는 데이터와 아닌 데이터가 혼재해서 나올텐데 조작설을 믿는 쪽에서는 자신의 가설에 부합하는 데이터만 주목하고 아닌 데이터는 '그건 일부러 집어넣은 블러핑이다!' 라고 말해버릴 겁니다. 이른 바 가불기죠.

    이러면 막상 전 지역의 데이터를 다 분석해도 유의미한 결과가 될지 모르겠습니다. 특정 데이터가 어떤 과정과 목적을 지녔는가에 대한 추론과 해석까지 곁들여야 하는 문제라면 어느 쪽도 다른 쪽응 제대로 설득하기 어려울 거예요.
  • 깜찍한 동장군 2020/04/20 01:07 #

    왜 당연한지 설득이 안되는군여
  • 티피 2020/04/20 10:06 #

    깜찍한 동장군// [우선 말씀하신 관외/관내 득표수 비율은 비슷한 것이 정상입니다. 같은 모집단(선거구)의 표본이므로 모집단과 표본의 규모가 충분히 클 경우 관내투표의 지지율 분포와 관외투표의 지지율 분포가 비슷한 통계적 특성을 보이는 것은 전혀 이상하지 않습니다.]

    관외/관내가 왜 당연한지는 이 설명을 보고 이해해주세요. 위 문장은 심지어 저도 아니고 여기 주인 반달가면님이 앞선 다른 글에서 설명한 내용입니다.
  • 깜찍한 동장군 2020/04/20 11:36 #

    근데 그게 다른 후보자들에게서 여러차례 중복해서 나타나고 있잖아요
    그리고 프듀 조작투표도 그런식으로 잡은 모양이더군요
  • 티피 2020/04/20 12:14 #

    아니 그러니까 다른 후보자들에게서 여러차례 중복해서 나타나는 게 매우 자연스러운 현상이라니까요;;

    관외사전투표니 관내사전투표니 거창한 용어를 써서 그렇지 근본적으로 생각해보면 그 차이는 4월 10~11일에 자기 선거구 밖에서 투표했느냐 안에서 투표했느냐의 차이일 뿐입니다. 즉 몸의 위치 차이일 뿐이라는 거죠.

    연수구을 밖에는 정일영을 좋아하게 만드는 가스가 살포되어있어서 관외로 나간 사람은 정일영을 더 찍게 되는 것도 아니고, 연수구을 안에는 민경욱을 좋아하게 만드는 전자파가 방출되고 있어서 관내에 있는 사람은 민경욱을 더 찍게 되는 게 아니잖아요.

    결국 몸이 어디에 있든 대다수의 A후보자 지지자는 A후보를 지지하고 B후보자 지지자는 B후보를 지지할테니 관외든 관내든 후보들이 나눠먹는 지지율은 동일 비율로 배분되는 것입니다. 이 현상은 표본이 클수록 더 비슷해지고요.

    반대로 관외/관내 계산값의 유사성이 여러 곳에서 중복해서 나타나지 않으면 그게 오히려 더 의심스러운 일이에요;; 여당과 야당이 비밀리에 세뇌가스 살포전을 하는 것도 아니고 말이죠.
  • 반달가면 2020/04/20 12:23 #

    잘모르겠다, 깜찍한 동장군// 이미 티피님께서 제가 해당 사안에 대해 언급한 부분을 인용해 주셨고 구체적으로 설명해 주셨으니 별도로 답글은 달지 않겠습니다. 티피님 설명대로 관내/관외 통계 분포가 비슷하지 않으면 그게 더 괴상한 겁니다.


    티피//

    이전 댓글에서 말씀드렸듯이 개표결과만을 가지고 조작 여부를 명백하게 판단하는 것은 어차피 불가능합니다.

    반면에 통계적 특성이 모두 부합할 경우 조작이 없었다고 충분히 명백하게 판단할 수 있는 여지가 존재합니다.

    문제는, 조작이 아니라고 명백하게 판단할 수 있을 줄 알고 시작했는데 좀 이상하게 결과가 나와버렸죠 -_-;

    어쨌든 개표결과는 수자들의 집합일 뿐이기 때문에, 조작 여부의 판단은 그림자를 보고 그 사람의 얼굴을 알아내라는 것이나 마찬가지 상황입니다. 하지만 그림자는 어느 정도 그 사람의 윤곽을 보여주기 때문에, "어? 이 그림자는 내가 알던 그 사람과는 좀 차이가 있는데?"라는 생각이 들 수는 있습니다. 그러면 왜 모양이 이렇게 보이는지 궁금해지겠죠.

    작업의 시작은 사전투표 조작설 얘기를 들었기 때문이었지만, 지금은 그냥 이게 왜 이런지가 굉장히 궁금합니다. 스프레드시트 구성은 대충 해놨고 오늘 저녁에 실제 값들을 넣어서 계산해 보려고 합니다.
  • 깜찍한 동장군 2020/04/20 20:48 #

    여전히 관내 관외 비율이 전혀 관련이 없고 랜덤이여야 마땅할 다른 지역구의 후보자들 사이에서 소숫점까지 비슷한 양상이 받아들이기 어렵습니다
댓글 입력 영역
* 비로그인 덧글의 IP 전체보기를 설정한 이글루입니다.

Google Analytics


B-Side


adsense(w160_h600)2

통계 위젯 (화이트)

151646
3914
2013163

ad_widget_2