Chris Choi's Blog

Obama 재선, Big Data와 통계 분석의 승리

with 8 comments

무명의 Barack Obama를 스타로 만든 것은 Twitter를 비롯한 Social Media였습니다. 2012년 11월, Obama를 재선으로 이끈 것은 Big Data였습니다. 이제는 선거에서도 Big Data 열풍이 불고 있습니다. 더 이상 소위 정치 전문가 혹은 선거 전략가들의 직관에 의존할 수 없으며, Big Data 분석가들이 선거 전문가로서 참여해야 한다는 뜻으로 해석됩니다. Obama 대통령의 Campaign Manager인 Jim Messina는 Time과의 인터뷰에서 다음과 같이 언급했습니다.

“We are going to measure every single thing in this campaign.”

“Inside the Secret World of the Data Crunchers Who Helped Obama Win”, Michael Scherer, November 7th, 2012, Time

 

선거 운동에 관한 한 직관에 의존한 추측은 금하고, 방대하고 정확성 높은 데이터를 바탕으로 전략을 펼치겠다는 의미입니다.

Big Data관리: One Database

선거에 관련된 데이터는 여러 곳에서 다양한 형태로 존재하기 마련입니다. 당에서 보유하고 있는 데이터가 있을 것이고, Social Media 상에서 유권자들의 활동에 관한 데이터가 있을 것입니다. 또한 선거 운동을 통해 수시로 생성되는 데이터가 있을 것이고, 여론 조사에 관련된 데이터가 있을 것입니다. 이처럼 데이터가 분산되어 있다는 것은 데이터를 분석하는 주체가 다를 경우 다른 해석과 결정을 낳을 수 있다는 문제를 내포합니다. 의사 결정의 일관성을 유지하기가 어렵게 될 수 있으며, 이곳 저곳의 데이터를 찾아 보아야 하는 수고도 큽니다. 따라서 Obama Camp는 Narwhal, Dreamcatcher 프로젝트를 통해 여러 곳에 흩어져 있던 복수의 Database를 하나의 Database로 통합했습니다. 이를 위해 Obama는 4년 전보다 다섯 배 확대된 통계 분석팀을 투입했으며, Database의 통합을 통해 노력과 시간, 비용을 줄일 수 있게 되었습니다.[i]

 Obama 재선, Big Data와 통계 분석의 승리_Image 1

[Figure 1. 일관된 의사결정을 위해 다양한 데이터를 통합했습니다.]

통합된 데이터에는 어떤 브랜드를 선호하는지, 그리고 어떤 잡지를 구독하는지에 대한 개인적인 사항까지도 담겨 있습니다. 결국 위의 통합된 데이터는 유권자의 행동과 생각에 대한 데이터인 것입니다.

통합 데이터의 기초가 되는 부분들을 살펴 보도록 하겠습니다. 먼저 BarackObama.com입니다. 유권자들 중 Obama 대통령에 관심이 있는 사람은 누구나 BarackObama.com에 가입하실 수 있습니다. e-mail 주소와 ZIP Code만 입력하면 시작하실 수 있습니다.

 Obama 재선, Big Data와 통계 분석의 승리_Image 2

[Figure 2. BarackObama.com 출처: BarackObama.com]

이름, 주소, 전화 번호, 성별, 나이, 지역 등의 정보를 추가로 입력하게 되며, 이 정보는 Obama Camp의 Database에 곧바로 저장됩니다.

다음은 Social Media입니다. Facebook은 Obama 선거 캠프에 큰 보탬이 되었습니다. BarackObama.com에서는 Facebook을 이용해 로그인을 할 수 있으며, 이를 통해 유권자의 BarackObama.com 상에서의 정보와 Facebook 상에서의 정보를 통합할 수 있습니다.

Obama 재선, Big Data와 통계 분석의 승리_Image 3

[Figure 3. Facebook을 이용해 BarackObama.com에 로그인 할 수 있습니다. 출처: BarackObama.com]

 

또한 유권자가 Obama 대통령의 Facebook에서 ‘Like’를 누르게 되면 해당 유권자의 Profile 정보와 친구 정보가 Database에 저장됩니다. 이를 바탕으로 경합 지역에 친구를 둔 유권자에게 Obama를 지지하는 내용의 메시지를 등록하도록 요청합니다. Social Media의 영향력을 효과적으로 사용한 셈입니다. 이 때 친구 간의 친밀도를 파악하는 데 Facebook의 Social Graph인 Open Graph가 유용하게 사용되었습니다.

 

Obama 재선, Big Data와 통계 분석의 승리_Image 4

[Figure 4. Obama 대통령의 Facebook 출처: Barack Obama’s Facebook]

 

이 외에도 Google, Flickr, Tumblr 등에서 유권자와 관련된 사항을 분석해 Database에 추가했습니다.

이와 더불어 미국 선거 제도 하에서는 유권자 자료를 사용할 수 있습니다. 후보자는 주의 모든 유권자의 자료를 확인할 수 있습니다. 이처럼 다양한 데이터가 하나의 Database로 통합되어 Obama 재선에 큰 보탬이 되었습니다.

 

Big Data and Micro Targeting

무작위 전화와 지역 유세는 그 효과를 입증하는 것이 쉽지 않습니다. 더욱 세밀한 선거 전략이 필요합니다. Big Data 분석을 바탕으로 Obama는 세밀한 선거 전략을 펼칠 수 있었습니다. 그것은 바로 ‘Micro Targeting’입니다. 특정 유권자들에게 특정한 메시지를 전달하는 것이 Micro Targeting의 목적입니다. 이미 기부금 상한선에 도달한 사람들에게 더 많은 기부금을 요청할 필요가 없습니다. 확고한 민주당 지지자에게 많은 힘을 쏟을 필요가 없습니다. 즉, 유권자의 세밀한 분석을 통해 맞춤형의 캠페인을 진행한다는 것입니다.

 Obama 재선, Big Data와 통계 분석의 승리_Image 5

[Figure 5. Obama Campaign은 Big Data 분석에 근간한 Micro Targeting을 진행했습니다.]

대표적인 Micro Targeting은 e-mail입니다. Obama 진영은 동일한 내용의 e-mail을 단체로 보내는 법이 없었습니다. 심지어 부부에게도 다른 내용의 e-mail을 보내는 경우가 있습니다. 유권자의 개인적 특성에 따라 e-mail의 내용이 달라집니다. 예를 들어 교육, 세금 등 개인의 관심사와 기부 금액 등에 따라 내용이 달라지는 것입니다. e-mail의 효과를 극대화 하기 위해 사전에 표본을 대상으로 제목, 발신자, 내용 등을 다르게 해 클릭 수, 기부 금액 등의 반응을 살핀 후 최적의 조합을 찾아내 전체에게 발송했습니다.

그 결과 Fundraising이 2008년 대선에서의 5억 달러에서 이번 대선에서는 6억 9천만 달러로 크게 증가했으며, 대부분은 e-mail을 통해 거둬 들인 것입니다.[ii] 정치 기금 마련은 선거 승리의 척도입니다. 자존심이 걸린 문제이기도 합니다. Obama Camp는 추측과 직관이 아닌, Big Data 분석에 기초해 기금을 성공적으로 마련했고, 대선에서 승리할 수 있었습니다.

유권자 방문도 마찬가지입니다. 방문하기 전에 Big Data를 조회할 수 있는 Dashboard를 통해 방문하려는 사람이 Obama 대통령에게 기부금을 낸 사람인지, 투표를 자주 하는지, Obama 대통령을 지지하고 있는지 등에 대해 사전에 확인했습니다. 사전 정보에 따라 방문 시에 나누는 대화도 달라질 수밖에 없습니다. 방문자가 관심 있는 내용에 대해 이야기를 나누다 보면 Obama에 대한 지지를 이끄는 것이 좀 더 자연스러웠을 것입니다.

정치 기금 모금을 위해 Obama 대통령은 ‘Dinner with Barack’이라는 이름으로 저녁 식사 행사를 열었습니다. 서부에서 George Clooney를 초대했는데, 응모한 유권자들 중 상당수가 40대 여성이라는 점을 포착했습니다. 이 데이터를 바탕으로 동부에서 열린 행사에는 40대 여성에게 인기가 높았던 Sarah Jessica Parker를 초대해 다시 한 번 대성공을 거두었습니다.

 

Nate Silver

미 대선과 Big Data는 또 다른 승자를 낳았습니다. 바로 Nate Silver입니다. 2008년에 50개 주 중 49개 주에서 대선 승자를 정확히 예측했고, 이번 대선에서도 선거인단 수와 국민투표 승률을 근소한 차이로 맞추었습니다. Nate Silver 역시 통계 전문가입니다. 그의 통계 분석은 독특한데, 여론 조사를 자신만의 방식으로 분석해 선거 결과를 예측하는 방식입니다. 그의 방법론은 다음과 같이 7단계로 구성됩니다.[iii]

  • Step 1: Weighted Polling Average
  • Step 2: Adjusted Polling Average
  • Step 3: FiveThirtyEight Regression
  • Step 4: FiveThirtyEight Snapshot
  • Step 5: Election Day projection
  • Step 6: Error analysis
  • Step 7: Simulation

 

Implication

선거에서 가장 중요한 것은 후보자의 훌륭한 자질이라고 생각합니다. 그러나 최근의 대통령 선거를 보면 박빙인 경우가 대부분입니다. 후보가 선거 운동의 방향성을 잘 잡기 위해서는 좋은 정책과 좋은 조직이 필수적입니다. 여기서 Big Data 분석을 통한 세밀한 Targeting이 어우러진다면 더욱 효과적인 선거 운동이 될 것입니다. 즉, 앞으로의 선거 전문가는 Big Data 전문가가 될 것입니다.

Big Data 기반의 선거 운동은 하루아침에 이루어지는 것이 아닙니다. 따라서 시간을 두고 관련 기술과 인력의 확보가 필요합니다.

References


Advertisements

Written by Chris Choi

January 1, 2013 at 1:44 pm

8 Responses

Subscribe to comments with RSS.

  1. […] [ii]  Obama 재선, Big Data와 통계 분석의 승리 […]

  2. […] 미 대통령은 대통령 선거에서 IT를 가장 훌륭하게 활용한 정치인입니다. 특히 지난 재선을 승리로 이끈 원동력 중 하나는 데이터 분석이었습니다. 이제는 정치인도 IT와 무관할 수 없는 […]

  3. […] [Link 1. “Obama 재선, Big Data와 통계 분석의 승리”] […]

  4. […] 2013년: Obama 재선, Big Data와 통계 분석의 승리 […]

  5. […] [Link 1. “Obama 재선, Big Data와 통계 분석의 승리”] […]

  6. […] Obama 재선, Big Data와 통계 분석의 승리 […]

  7. […] Obama 재선, Big Data와 통계 분석의 승리 […]

    Data | Chris Choi's Blog

    February 21, 2017 at 2:21 pm

  8. […] [Link 2. ‘Obama 재선, Big Data와 통계 분석의 승리’] […]


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: