CEO Cambridge Analytica Александр Никс входит в топ-25 гениев по версии журнала Wired. Он занимается сбором и обработкой огромных массивов данных с целью поддержки избирательных и рекламных кампаний. Компания Никса собирает информацию о гражданах, где только это возможно: от церквей до Facebook.

Технология big data позволяет сделать максимально точный прогноз, проголосует ли человек за или против кандидата. Кампания Дональда Трампа - oдин из самых громких аналитических проектов Никса. И, как потом писали некоторые европейские СМИ, именно за счет его технологий кандидат от республиканцев переиграл политтехнологов демократов.  Хотя сам Никс скромничает, рассказывая о результатах кампании: "Нельзя сделать плохого кандидата хорошим, а проигрывающего кандидата - выигрывающим".

В конце прошлой недели Александр Никс приезжал во Львов, где был гвоздем программы на IT Arena. С организаторами ивента был заключен контракт на жестких условиях: никаких опубликованных видео по итогами выступления.   

В эксклюзивном интервью с журналистом LIGA.net Никс ведет себя очень открыто, но при этом периодически прерывает рассказ и отвечает на сообщения в мессенджере. "Простите, мне приходится делать несколько дел одновременно", - поясняет он. В помещении есть веб-камера. И кажется, что аналитик периодически на нее поглядывает.  

Гуру big data рассказал, почему многие европейские политические, да и коммерческие рекламные кампании (в том числе украинские) являются заметно устаревшими по сравнению с американскими. И что теряют политики, не используя грамотно и своевременно "большие данные".

- Если честно, я не очень сильно понимаю, что вы делаете. Но я знаю, что вы помогли Дональду Трампу победить на выборах в США. Может быть, вы сможете объяснить, как работаете с аудиторией соцсетей, какие данные обрабатываете и где их берете?

- Мы работаем в сфере, которая называется маркетинг, строящийся на основе больших данных. Это меняет подход к традиционной рекламе, который исторически реализуется в направлении "сверху вниз": когда люди придумывают концепт креатива и спускают его вниз на аудиторию в надежде на то, что он сработает.

Мы же используем очень масштабные наборы данных и предиктивную аналитику, чтобы таргетировать аудитории, сегментировать ее и применять к людям индивидуальный подход в рекламе. То есть здесь мы двигаемся в направлении cнизу вверх. Еще задолго до того, как начнется креативный процесс, мы используем данные, чтобы хорошо понять на почти индивидуальном уровне, что каждый отдельно взятый человек хочет получить в коммуникации.

- Но для такой активности вам нужны огромные массивы данных....

- Это правда. В такой стране, как США (230 млн взрослых), у нас используется много баз данных, в некоторых из которых около 4000-5000 элементов данных на каждого человека. И мы сравниваем эти наборы данных с домашним адресом и телефонным номером. То есть рядом с вашем именем будет ваш возраст, пол, работа, какой журнал вы читаете, какие у вас есть хобби, какой гольф-клуб посещаете, к какой церкви принадлежите, какую еду вы едите, в какой соцсети сидите. И это только 20 элементов данных. Представьте себе 4 000!

Читайте также - Сооснователь Apple: Я не хотел много денег, но так оно случается

- Но как вы все это можете собрать? Какие источники используете?

- В Европе законодательная среда обычно сводится к принципу opt in (пользователь указывает, какие данные о нем можно использовать в сторонним лицам - Авт.), а в Америке эта система устроена по принципу opt out (данные становятся доступны для кампаний по дефолту, если пользователь не отметил, что их нельзя использовать - Авт.). Можно купить или получить лицензию на данные из больших агрегаторов данных: банковских данных о кредитных картах, супермаркетов, систем карт лояльности, систем продажи билетов, из социальных сетей, церковных данных... все что мы можем найти.

Nix5.JPG

- Данные хакеров не используете? Ведь они много чего крадут в последнее время.

- Гипотетически можно использовать любые данные. Но легально эта бизнес-модель продержится очень недолго.

- Я шучу, конечно. Но просто на всякий случай хотел спросить, не было ли у вас когда-то переговоров по использованию "серых" данных?

- Нет, нам это не надо. Есть так много легально доступных данных. Мы уже в этом бизнесе 29 лет и мы хотим в нем остаться еще, по крайней мере, 50 лет. Если будут обвинения по хакерам - можно ставить крест.

- Во сколько обходятся вас такие наборы данных? Если вы, например, запросите их у церкви, страховой компании или кого-то еще...

- Ну, вообще-то некоторые данные бесплатны. Это замечательно. Мы обзваниваем некоторых людей и спрашиваем, могут ли они с нами поделиться данными. И они нам их дают. С другими людьми мы заключаем сделки по обмену: они нам предоставляют свои данные. А мы им - другие наборы данных. А у больших дата-агрегаторов мы получаем лицензию на использование данных с определенной ценой за 1000 записей. Это может быть $10, $20, $30 за каждую тысячу. В принципе у нас так много данных, что стоит они сейчас миллионы долларов. Но массив постоянно растет.

Читайте также - Фрэнсис Мод: Помогут ли технологии побороть коррупцию в Украине

- Поговорим о президентской кампании в США. Насколько много данных вы тогда обработали и сколько людей было затронуто этим сбором данных?

- Мы работали три года, собирая данные к президентским выборам 2016. Мы разрабатывали модели. И тестировали их в 2014 году на 42 кампаниях по всей Америке. Мы работали с двумя кандидатами на первичном этапе президентских выборов. А затем уже на президентской кампании. То есть модели хорошо подготовили. Помните, данные - это всего лишь ингредиенты. Вы можете пойти в супермаркет и купить там продукты. Но это не означает, что из них у вас получится хорошая еда. Вам нужны лучшие шеф-повара. Поэтому инвестиции в дата-исследователей, которые мы сделали, - это гарантия хорошего продукта.

- Предположим, что я лидер политической партии. Я пришел к вам говорю: вот вам данные, что я могу получить от вашей компании, что вы мне можете пообещать?

- Предположим, что вы даете мне нужные ингредиенты, нужные данные. Я думаю, что есть несколько вещей, которые мы можем сделать. Мы можем начать помогать вам понять вашу целевую аудиторию. Если мы вам сможем назвать каждого человека в стране, который, наиболее вероятно, проголосует за вас, то вы можете попросить этих людей, стать донором или поддержать вашу кампанию, быть волонтером. Если мы бы могли вам назвать тех людей, которые вообще никогда не проголосовали за вас, вы бы просто не потратили деньги на коммуникацию с ними. Потом мы также могли бы сказать вам, кто те люди посередине, которые еще не определились. И мы бы могли вам помочь, какие сообщения для них были бы самыми действенными, чтобы убедить этих людей проголосовать. Вы можете быть озадачены образованием, а ваша жена - медицинским обслуживанием. И нет никакого смысла слать месседж о медицине вам, а ей - об образовании. Нам нужно дать наиболее точный месседж человеку.

- И насколько точным будет такое предсказание?

- Точный - сложное слово. Под ним подразумевается, успешно ли это на 100%. Мы смотрим на это с другой стороны: без этого подхода, основанного на данных, вы просто угадываете.

- Но на какой процент отличается этот подход от обычного угадывания?

- Разница огромная. Когда мы ведем коммерческие кампании по продаже продуктов, мы видим подъем продаж по сравнению с традиционным маркетингом на 10-25%.

NIX6.JPG

- Говоря о последней президентской кампании, какой был подъем, по вашим оценкам?

- В течение кампании Трамп потратил около $120 млн, чтобы вести кампанию в цифровых медиа в целом. Был нанят Google, чтобы делать независимую оценку нашей работы. У меня нет перед собой статистики. Но мне кажется, мы показали подъем на 11% по сравнению с традиционной рекламой. То есть результат был довольно позитивный.

Читайте также - Остаемся: как Ajax Systems делает в Киеве гаджеты мирового уровня

- То есть, если бы вас не наняли, Трамп бы не победил на выборах?

- Нет. Я не верю в это. Как я всегда говорю, наука о данных и технологии - это не панацея. Нельзя сделать фундаментальных изменений: плохого кандидата хорошим, а проигрывающего кандидата - выигрывающим. Нужно помнить: у Хиллари Клинтон тоже была команда big data спецов. Вероятно, в три раза больше нашей. У нее также был бюджет в $1,3 млрд, а у Трампа было $600 млн. Вообще-то большая часть нашей работы состояла в том, чтобы отвечать на то, что она делает. И подняться при этом на уровень выше. Само собой, мы смогли увидеть, что-то из этого возымело успех, который, как мы установили эмпирическим путем, был достигнут благодаря данным. Например, Висконсин. Но я никогда бы не был столь заносчивым, чтобы предположить, что с или без наших данных Трамп бы выиграл или проиграл выборы.

- Какой процент от денег на кампанию Трампа (около $600 млн) пошел на data-аналитику (в прессе фигурировала сумма в $15 млн)?

- Я не могу этого сказать. Но могу сказать, что в любой кампании, будь-то продажа зубной пасты или выборы, самые большие затраты идут на медиа - ТВ, радио... А такой компонент как data-аналитика - это маленький кусочек от этой суммы. Что мы сейчас пытаемся делать, это уговорить бренды перенаправить очень небольшой кусок их медийных бюджетов на инвестиции в данные, чтобы достичь точного таргетирования. И это позволит значительно сэкономить на медиа-рекламе.

- Я заметил, что вы запустили недавно таргетинг по ТВ-рекламе в США. Как это работает?

- Да, мы запустили новый продукт. В Америке стало возможным развивать, как это называют, адресуемое телевидение. Оно позволяет размещать индивидуальную рекламу в отдельно взятых домохозяйствах. Если у вас есть два дома на одной и той же улице, которые смотрят ту же самую ТВ-программу, мы можем вставить в один и тот же промежуток времени разные рекламные ролики для них. Мы уже делаем это в США, в Великобритании, в некоторых странах Европы. И это придет в Украину со временем.

- Этот сервис доступен только для интернет-ТВ? Или и для других форм вещания: спутникового, эфирного...

- Нет, для линейного ТВ мы другое делаем. Мы можем взять данные о просмотре с сет-топ-боксов кабельных провайдеров. Мы сравниваем данные о видео-предпочтениях, полученные с сет-топ-боксов, с другими данным об аудитории и можем таким образом определять программы с наибольшей концентрацией целевой аудитории, в которой заинтересован наш клиент. И потом мы можем покупать рекламу только в определенных программах. Мы, кстати, делали таргетирование по такому принципу для Трампа.

NIX3.jpg

- Может, вы сможете описать кампании в Европе, для которых вы делали аналитику?

- Мы об этом не говорим о клиентах подобного рода. Да, мы работали во многих странах Европы. В этом году мы в Европе уже сделали три кампании. И мы сейчас над одной-двумя прямо сейчас работаем. Но мы не говорим о таком в течение года или подобного периода, до тех пор пока в прессе не появится.

- Может у вас есть заказы из Украины?

- Нет, у нас нет заказов из Украины. У вас выборы в мае 2019 (президентские). Сейчас, кстати, как раз самое время начать говорить с политическими партиями. Мы думаем, что выборная кампания должна стартовать за 18-24 месяца, чтобы достичь реального успеха, начать сбор данных, делать профили аудитории, применять таргетинг. Это все занимает много времени. Ускорить процесс нельзя. Раньше кампании начинались за 6 месяцев до выборов. Но технологии поменялось. И сейчас нужно начинать думать гораздо раньше.

- Может быть, вы что-то знаете о наших политиках? Они уже начали? Или по-прежнему думают, что можно за 6 месяцев все организовать?

- Я не так много знаю об этом. Я приехал на конференцию.

- А в Германии вы что-то готовили под выборы?

- Нет, мы не работали в Германии.

- Может, они воспользовались услугами других big data аналитиков?

- Нет, они этого не сделали. По крайней мере, насколько я знаю. Мы говорили с несколькими партиями в Германии. Они не понимают технологии, были беспокойства по поводу приватности данных. Они к этому исторически более восприимчивы.

- А как насчет Франции?

- Франция готовила некоторую data-аналитику, но ничего... Вы знаете, что все big data технологии для кампаний, которые мы развиваем, выходят из Америки. И Америка в этом по меньшей мере на 5-8 лет опережает Европу. А Европа в свою очередь опережает другие страны. В Америке в этой сфере замешаны огромные деньги. В такой стране как Великобритания, к примеру, партии тратят 50 млн на выборную кампанию. Эта как маленькая сенаторская гонка в Америке. Один штат. Наличие денег означает то, что можно применять больше технологий и талантов.

- Кстати, что вы думаете по поводу Brexit? Может, могла бы сработать какая-то аналитическая кампания, которая заблаговременно предупредила бы политиков о подобном исходе?

- Brexit - это один пример. Почему никто не видел, что это происходит, да? Но точно также можно сказать: почему никто в Германии не заметил подъем AFD (партия Альтернатива для Германии). Если ХДС бы знал, что AFP так много достигнет, особенно в юго-восточной Германии, я уверен, они бы что-то сделали, чтобы это предотвратить. О чем это мне говорит: британцы не использовали правильно данные, немцы тоже этого не сделали. Выборы становятся предельно прозрачными, благодаря данным. Нет причины получать такие сюрпризы, если данные используются с пользой. Просто просить кого-то провести опрос 800 людей и ожидать, что они правильно поняли настроения, - это нонсенс!