2015/09-10 : 미디어플래닝, 빅데이터의 매력 추가 장착 HSAD 공식 블로그 HSADzine

HSAD 공식 블로그 HSADzine

미디어플래닝, 빅데이터의 매력 추가 장착


양 인 선

미디어플래닝1팀 부장 / isyang@hsad.co.kr


그는 왜 그녀(Her)에게 반했을까?

그녀가 그에게 묻는다.“ Mind if I look through your hard drive? Let’s start with your emails.” 그들의 사랑은 이렇게 그의 정보가 담긴 하드 드라이브 검색으로 시작됐다.

영화 <그녀(Her)>에서 주인공 테오도르가 반한‘ 그녀’는 현실의 여자가 아닌 인공지능 운영체계(Operating System)이다. 그녀는 테오도르의 하드 드라이브에 저장돼 있는 메일·사진 등의 빅데이터를 바탕으로 그의 맞춤형 여자친구(Individualized Girlfriend)가 된다. 이 영화가 전달하고자 했던 궁극적 메시지는 아니겠지만, 그가 그녀에게 반할 수밖에 없었던 이유는 그녀가 읽은 그에 관한 빅데이터의 힘 혹은‘ 기술(Art)’ 때문이 아니었을까.

최근 TV에서도 빅데이터로 사회현상을 해석하면서 사람들의 공감을 얻어내는 프로그램을 심심찮게 볼 수 있다. 이제 더 이상 빅데이터가 광고나 마케팅에서의 전문용어가 아닌 모두에게 친숙한 하나의 트렌드로 자리 잡아가고 있는 것이다.

하지만 이 트렌디한 용어가 무엇을 의미하는지 자신 있게 말할 수 있는 사람은 흔치 않다. 친숙하기는 하지만 정확하게 알지 못했던 빅데이터의 정의·특징 및 가치를 살펴보고 필자가 몸담고 있는 미디어플래닝팀에서는 어떻게 활용하고 있는지 소개해보겠다.



What is Big data? Big data is big in size?

빅데이터란 ‘디지털화를 통해 목적성을 띠지 않고 자연적으로 만들어지는 실시간, 대규모의 자료’를 뜻하며, 일반적으로 3V, 즉 Volume(양)·Velocity(속도)·Variety(다양함)로 설명된다. 빅데이터는 초대용량의 사이즈(Volume)로, 숫자 이외에 비정형적인 텍스트나 이미지 등의 다양한 형태(Variety)를 띠며, 연속선상에서 빠르게 생성되는 속도(Velocity)의 특징을 지니고 있다. 여기에 빅데이터의 진실성(Veracity) 또는 가치(Value) 창출의 중요성을 강조하며 4V라고 정의하기도 한다. 분명한 것은 사람들이 흔히 오해하는, 빅데이터의 이름에서 연상되는 데이터의 규모자체가 중요한 건 아니라는 점이다.

최근 빅데이터가 주목받게 된 이유는 기업·정부·포털 등이 이를 효과적으로 분석함으로써 미래를 예측해 최적의 대응방안을 찾고, 새로운 가치를 창출하고 있기 때문이다. 그럼 우리 일상 속에서 빅데이터는 어떤 가치(Value)를 찾아내고 있을까?

다양한 업계의 여러 사례가 있을 수 있지만, 업의 특성 상 나이트 라이프(Night Life)를 사랑할 수밖에 없는 HS애드 여러분들을 고려해 서울시의 심야버스 노선이 어떻게 정해졌는지를 예로 들어보겠다.



빅데이터로 효과적인 버스노선을 찾다


심야버스는 서울 대부분 지역을 주기적으로 운행하는 낮 시간대의 버스 운행과는 달리 이용객이 한정돼 있어서 무작정 버스노선을 만들 수 있는 상황은 아니었다. 서울시는 이 문제를 해결하기 위해 서울시 교통 데이터와 KT의 요일별/시간대별 유동인구 빅데이터를 활용해 최적의 노선과 배차간격을 도출해내고, 거기에 KT의 통화량 데이터를 바탕으로 실수요를 예측했다. 그 결과 2015년 7월 누적 기준 500만 명의 이용자를 보여주며 시민들에게 도움을 준 빅데이터 활용 성공사례로 꼽히고 있다.


기존 데이터 + 빅데이터 = 어디까지 가봤니?


그럼 여러분의 동료인 미디어플래너들은 빅데이터를 어떻게 활용하고 있을까? 최근 미디어플래너들은 경쟁 PT나 현 광고주의 스케줄링 제안 시제품의 마케팅 이슈·시청률·비용 효율성 등의 미디어 인덱스를 고려하는 것 외에도 빅데이터를 적극 활용하고 있다.

예를 들어 주차별 평균기온 및‘ 여름, 덥다’ 등 제품 관련 버즈량의 추이를 분석해 냉감소재 티셔츠 광고의 적정 시기를 제안하기도 하고<그림 2>, 피로감을 가장 많이 느끼는 요일이 언제인지, 어느 시간에 가장 불면에 대한 고민을 얘기하는지 등의 버즈량을 분석해 각 품목의 메시지 수용성이 높은 요일 혹은 그 시간대 프로그램을 구매하는 근거 자료로 활용하기도 한다<그림 3>.

미디어플래닝에 있어 기존엔 AGBNMR(시청률)·HRC(미디어 이용행태 및 라이프스타일) 등에서 제공하는 숫자 데이터에 좀 더 집중했다면, 이제는 자연적으로 발생하는 비정형적인 빅데이터를 활용하면서 광고주에게 소구할 매력 한 가지를 더 장착하게 됐다. 이런 제안들은 광고주 보고를 위해 별도로 의뢰한 빅데이터 분석 전문회사의 보고서 혹은 당사에서 사용하고 있는 다음소프트의 소셜 메트릭스 시스템을 통해 확보된 내용을 재구성하는 방식이었다. 최근 이와는 별도로 서강대학교 경영학부 교수의 지도 아래 텍스트 데이터를 직접(!) 수집해 정제하는 방법까지 배우며 빅데이터의 신세계를 접하고 있다.

물론 기존에 작성된 보고서나 시스템을 통해 조금은 편하고 쉽게 빅데이터를 활용할 수도 있지만, 데이터를 직접 수집·정제하는 방법을 알게 되면서 기존보다 훨씬 다양한 분석·활용 방안을 떠올릴 수 있게 됐다. 음식을 직접 만들 줄 몰라도 음식점을 운영할 수는 있지만, 직접 만들 줄 아는 사람의 음식점 운영 노하우는 분명 다른 것과 마찬가지인 셈이다.

빅데이터를 분석하는 과정(Data Mining Process)은 데이터 수집→ 분석 → 해석 활용의 3단계로 간단히 정리되는 듯하나 그 세부 과정을 들여다보면 결코 녹록치 않다.

우리가 흔히 보는 빅데이터의 빈도·랭킹·연관어·TPO 분석을 위해 가장 우선되는 작업은 SNS의 데이터를 수집하는 일이다. 전문용어로‘ 크롤링(Crawling)’이라고 하는데, 방대한 데이터를 매일 접한다는 미디어플래너가 보기에도 이 작업은 놀랍고 힘든 과정이었다. 이런 배움을 통해 현재 미디어플래닝팀에서는 현업에 도움을 줄 수 있는 몇 가지 주제를 잡고 프로젝트를 진행중에 있다. 간단히 소개하면 다음과 같다.

PPL(Product Placement)이 합법화된 지 5년이 지났다. PPL을 통해 브랜드의 이미지뿐 아니라 판매에까지 좋은 영향을 주었다는 평가도 있지만, 최근 프로그램 내에서의 과다한 사용으로 부정적 시각도 늘어나고 있다. 그렇다면 우리는 되묻게 된다.‘ 부정적인 버즈가 발생하더라도 PPL의 돌출도를 높여야 하는 건지, 아니면 시청자가 눈치 채기 힘들게 자연스럽게 노출해야 하는 건지’ 하는 점이다. 그래서 우리는 PPL을 집행한 광고주들의 버즈 데이터와 이를 평가할 수 있는 앱 다운로드 수와의 상관관계를 살펴보았다. 그 결과는 생각보다 흥미로웠다. 익히 아는 브랜드의 경우 PPL과의 상관관계는 낮았지만, 잘 알려지지 않은 신생 브랜드의 경우는 긍/부정(Valence)여부와 상관없이 버즈량(Volume) 자체가 더 중요한 요인이었다. 부정적인 버즈량으로 이슈가 됐던 브랜드는 PPL 집행 다음날 기존 대비 다운로드 수가 20% 증가했을 뿐 아니라 이런 상승세가 며칠간 지속되기까지 했다<그림 4>.

이 외에도 광고주들이 직접 체감하는 프로그램의 인기와 실제 시청률의 차이 때문에 사용하게 되는‘ 체감 시청률’의 실체를 찾기 위해 SNS의 버즈량과 시청률 비교, 버즈의 긍/부정 및 키워드를 분석하면서 기존 시청률을 보완할 수 있는 새로운 지표를 구상중에 있다<그림 5>.


난관을 헤치며 매력 업그레이드중!


빅데이터가 이렇듯 현업에 긍정적 변화를 가져올 것만은 분명하지
만, 빅데이터를 활용하는 데에는 아직 어려움이 많다. 데이터 확보의 한계나 정보 보호 및 보안의 문제뿐 아니라, 분석 역량 및 전문가 부족 등이 그 요인이라 할 수 있다. 하지만 중요한 것은 우리 미디어플래너들은 가용할 수 있는 데이터부터 분석을 시작했고, 역량 강화를 위해 노력하고 있으며, 의미 있는 결과를 조금씩 축적해 나가고 있다는 점이다.

지금 당장은 빅데이터가 미디어플래닝의 큰 매력이 되지 못한다고 할지라도 우리의‘ 매력 업그레이드’는 계속될 것이다!

Posted by HSAD