여론조사의 편향성 문제를 완화시키는 데 효과적인 베이지안 통계학을 활용해 2019년 4.3 국회의원 보궐 선거 결과를 예측하고자 함
Analysis Process
Method: R의 MCMCpack 함수(MCmultinomdirichlet) 사용
data: 중앙선거여론조사위원회 등록된 여론조사결과 수집, 각 여론조사 내용은 중앙선거여론조사심의위원회 홈페이지 참조
Prior: 창원 성산 지역 대상 2018년 12월 정당 지지도, 통영 고성 지역 대상 2019년 2월 정당 지지도
Weight: 선거일 기준 ‘7/(선거일 – 현재일수)’ 계산, 선거일을 1로 하고, 앞서 실시된 여론조사의 가중치는 7/10, 7/12 등의 형식
Analysis Result_창원 성산
빨간색 선은 강기윤 후보의 여론조사 결과를, 노란색 선은 여영국 후보의 여론조사 결과를 의미
3월 25일 민주당 권민호 후보와 정의당 여영국의 단일화가 시행되면서 노란색 선을 의미하는 여영국 후보의 여론조사 결과가 급격하게 상승하는 것을 살펴볼 수 있음
창원 성산 지역의 국회의원 4.3 보궐선거 여론조사 결과와 이를 활용한 베이지안 통계 결과의 차이를 살펴보고자 함
좌측 시계열 그래프에서 빨간색 선은 시간에 따른 여론조사의 결과로 계산된 두 후보자의 지지율 차이를 의미하며, 파란색 선은 여론조사 결과 데이터를 바탕으로 지역 정당지지도가 반영되지 않은 베이지안 통계 결과 차이를 의미함. 오른쪽 히스토그램은 강기윤 후보와 여영국 후보의 최종 득표를 예측한 내용임
좌측 시계열 그래프에서 확인할 수 있듯 2018년 12월 4일 실시된 여론조사 결과에서는 강기윤 후보가 여영국 후보에 비해 약 11.5%p 앞서고 있었으나 3월 25일 후보 단일화를 기점으로 여영국 후보가 강기윤 후보 보다 높은 결과를 보이고 있음
여론조사 공표 마지막 날인 3월 25일 발표된 결과에 따르면 여영국 후보가 강기윤 후보에 비해 약 9.1%p 앞서 있으나, 과거의 정보를 담는 베이지안 통계 모델에서는 두 후보자의 격차는 더 적게 나타남.
창원 성산 지역의 정당지지도를 반영하지 않은 4.3 국회의원 보궐선거의 최종 특표를 예측한 오른쪽 히스토그램에 따르면 여영국 후보가 강기윤 후보에 비해 6.9%p 앞설 것으로 예측하며, 두 후보자의 득표 격차는 95%의 확률로 6.84~6.94%p가 될 것으로 보임
다음의 그래프는 창원 성산 지역의 정당지지도를 prior로 반영한 결과를 의미함
좌측 시계열 그래프의 빨간색 선은 위와 마찬가지로 여론조사에서 두 후보자의 지지율 차이이며, 파란색 선은 여론조사 결과 데이터를 이용한 베이지안 통계 결과 차이임
지역 정당 지지도가 반영되었어도 좌측 그래프의 경우 여영국 후보가 3월 25일을 기점으로 강기윤 후보에게 앞서는 것을 볼 수 있음. 반면 베이지안 통계 결과를 의미하는 파란색 선의 경우 두 후보자의 득표 격차가 더 적게 나타날 것이라고 예측함
지역 정당 지지도를 반영한 창원 성산의 국회의원 선거 예측 모델에서는 여영국 후보가 강기윤 후보 보다 6.9%p 높을 것으로 예측되며, 95%의 확률로 두 후보자의 득표 차이는 6.84~6.94%p가 될 것으로 보인다.
Analysis Result_통영 고성
빨간색 선은 정점식 후보의 여론조사 결과를, 파란색 선은 양문석 후보의 여론조사 결과를 의미
여론조사 결과에서 정점식 후보가 양문석 후보에 비해 꾸준하게 높게 나타났으며, 3월 25일 발표된 여론 결과에서는 정점식 후보가 양문석 후보에 비해 약 27.5%p 앞서 있음
좌측의 그래프에서 확인할 수 있듯 여론 조사의 차이를 의미하는 빨간색 선 보다 베이지안 통계 결과의 차이를 의미하는 파란색 선이 더 적은 득표차이를 보일 것으로 예측하고 있음
우측의 히스토그램에 따르면, 지역 정당 지지도가 포함되지 않는 예측 모델에서는 정점식 후보가 양문석 후보에 비해 24.3%p 높은 득표를 할 것으로 예측하고 있으며, 두 후보자의 득표 차이는 95%의 확률로 24.23~24.39%p가 될 것으로 예상됨
다음의 그래프는 통영 고성 지역의 정당 지지도를 반영된 선거 예측 결과임
지역 정당 지지도가 모델에 반영이 되었더라도 앞서 살펴본 그래프와 동일하게 정점식 후보가 양문석 후보에 비해 높은 득표를 보이고 있음
지역 정당 지지도가 포함된 통영 고성 국회의원 선거의 예측 모델에서도 정점식 후보와 양문석 후보의 격차는 24.3%p로 예측되며, 95%의 확률로 두 후보자의 득표 차이는 24.27~24.37%p가 될 것으로 보임
Conclusion
foresight의 2019년 4.3.보궐선거 예측 결과에 따르면 창원 성산에서는 여영국 후보가, 통영 고성에서는 정점식 후보가 당선이 될 것으로 보임
창원 성산 여영국 후보는 강기윤 후보에 비해 약 6.9%p 앞선 실제 특표율을 받을 것으로 보임
통영 고성에서는 정점식 후보가 양문석 후보에 비해 약 24.3%p 앞선 결과를 보일 것으로 예측됨
본 모형의 한계로는 실시된 여론조사의 수가 적다는 것이었으며, 두 지역 모두 양자 대결이 아님에도 주요 후보자들만 예측을 했다는 점임
또한 여론조사가 발표되지 않는 일주일 사이에 경남 FC 경기장에서 유세 활동 등 예기치 않은 변수들이 나타나 실제 득표 결과에 영향을 미칠 수 있음