При поддержке Київстар Бізнес

“На небе только и разговоров, что о море и закате”, - говорил герой фильма Достучаться до небес. А в мире технологий, бизнеса и политики только и слышно о Big Data.

Ажиотаж вокруг применения больших данных проходит пиковую точку. Все меньше разговоров о том, что Big Data дает 10-кратное увеличение прибыли, что можно все предсказать и всеми проманипулировать. Все больше рабочих кейсов, которые дают преимущество в конкуренции за клиента. Было бы что анализировать. А мобильные операторы сохраняют по каждому абоненту сотни параметров - осталось лишь правильно их интерпретировать с пользой для других. И конечно, не выдать персональных данных.

LIGA.net узнала у Digital директора Киевстар Виталия Султана, как именно оператор строит модели в работе с бизнесами и почему раздражающие SMS-рассылки - это не Big Data.

- Виталий, насколько знаю, Киевстар не первый год работает по большим данным с банками. Есть ли уже какая-то статистика, дает ли это прирост в эффективности?

- С банками мы действительно работаем с прошлого года. Основные продукты для них - это скоринг по кредиту и скоринг по фроду. В первом случае мы предсказываем возможный дефолт заемщика (выставляем скоринговый балл), и банк может не выдать потенциально невозвратный кредит или выставить более жесткие условия. Во втором помогаем вычислить мошенника.

Это работает не только на сужение “коридора”, но и на расширение. Например, если человек приходит в банк без кредитной истории - а таких людей очень много, - то банк ему, как правило, отказывает. Или предлагает такие условия, где полностью покрывает свои риски. В этом случае информация от мобильного оператора может служить достаточно надежным внешним источником. По нашим оценкам, с таким инструментом банк на 20% чаще говорит “да” хорошим клиентам, чем без него. И в этом заинтересованы и банки и заемщики.

- Есть ли примеры другого сотрудничества?

- Второе основное направление - это так называемые хитмэпы (тепловые карты).

Читайте также: Больше, чем мессенджер? Почему VEON просто не скопирует Viber

- Показываете, где и как ходят люди, чтобы направить предложение?

- Необязательно. Выглядит это так. К нам обращается торговая сеть, которой нужно строить магазины, или логисты, которые думают, где открыть отделение, или топливная компания, которой нужно знать, где лучше строить заправки.

Они не просто просят показать, где на карте плотнее всего расположены абоненты Киевстар - в этом нет машинного обучения и Big Data. Они хотят увидеть конкретный сегмент, в котором заинтересованы.

- Как они говорят вам характеристики этого сегмента? Сами придумывают какой-то “портрет”?

- А им не нужен портрет. В этих компаниях работают внутренние CRM-системы. На их основе они знают, что, например, из 100% пользователей их целевой сегмент - это 10%, которые приносят больше всего денег. И им нужно знать, где они. Они просят нас показать на карте (естественно, анонимизированно, в виде “облаков”), где находятся люди, похожие на эти 10%.

- Как это выглядит на физическом уровне?

- Фактически клиент дает нам список номеров телефонов своих клиентов, которые являются примером его целевой аудитории. Кроме номера, нам не дают больше ничего - ни имени, ни характеристик, никакой персональной информации.

Дальше - бизнес-задача. Клиент может озвучить ее так: “Нам нужно увидеть на карте, где находятся все ваши абоненты, которые похожи по характеристикам на наших клиентов из предоставленного списка. Как они перемещаются в разные дни, в разное время суток в таких-то городах с такой-то точностью местоположения”. Мы создаем интерактивный инструмент, который находится на нашей стороне. Даем защищенный доступ в онлайн-интерфейс.

- Что представляет собой этот инструмент?

- Это обычная карта со слоями и фильтрами. Переключая настройки, клиент может видеть, где фактически находится его целевой сегмент.

Банку, например, мы показываем всю его текущую сеть, чтобы он мог тут же соотнести, где сейчас стоят его отделения и где находятся целевые сегменты. Забавно и грустно: часто они совершенно не пересекаются. Поэтому банки перестраивают отделения, “целясь” в нужных клиентов. То же самое с сетью банкоматов.

- Что, если целевой сегмент очень узкий? Ведь есть риск того, что получится вычислить отдельных абонентов.

- Все клиенты анонимизированны, к тому же есть перестраховка - какими бы фильтрами человек ни “играл” на карте, он не может создать сегмент, в котором возможно определить отдельного клиента. Мы ставим специальные пороги, ниже которых это в принципе невозможно.

- Порог - это конкретная цифра или своя для каждого кейса?

- Для каждого своя, но минимальный порог измеряется трехзначным числом.

По каждому номеру сохраняется множество чисто технических параметров. А если мы хотим эти параметры как-то интерпретировать, это уже создание модели.

- Создаете какие-то маркетинговые или психологические портреты?

- Механизм такой. В нашей базе 90% prepaid-абонентов, все анонимизированны. Мы создаем модель, которая с определенной вероятностью предсказывает, относится ли абонент к тому или иному сегменту. Например, является ли он автомобилистом. Для этого строим модель машинного обучения, которая по определенным характеристикам это предсказывает.

Для модели нам нужна обучающая выборка - например, такие номера телефонов, по которым мы точно знаем, что их владельцы - автомобилисты. Модель подбирает алгоритм, находит определяющие характеристики. Потом распространяет эти характеристики на всю базу. И таким образом мы определяем автомобилистов среди всех абонентов, только с какой-то вероятностью, с правом на ошибку. Так обогащаем свои анонимные данные. И добавляем внешние источники.

Кстати, очень часто в модели определяющими являются внешние к телекому характеристики - например курс валют, погода.

- Касательно психологических портретов. Обращаются ли к вам политики за услугами Big Data?

- Прецедентов таких не было, но для нас это и не кейс. У компании есть определенные правила, с кем работать, а с кем - нет. В частности, абсолютная аполитичность. Если даже придет клиент с таким заказом, мы ему скажем однозначное “нет”. Этот механизм нужно направлять только на коммерческие цели.

- Если я правильно понял, основная ответственность за успех - на заказчике. Ведь все зависит от того, насколько корректную выборку номеров он даст на вход.

- В большой степени. Но успех не гарантирован. Определяющих характеристик вообще может не оказаться.

- В плане Big Data представляются только какие-то масштабные задачи. Насколько большими должны быть бизнес и выборка от клиента, чтобы вы могли обучить модель?

- Это должно решаться индивидуально. Логично, что выборка должна быть минимум трехзначная. Думаю, при выборке ближе к 1000 мы можем нащупать общие черты и предсказать успех. Но лучше смотреть на конкретные кейсы.

- Вы упоминали вероятность “попадания” в нужный сегмент. А с какими вероятностями вы, как правило, готовы работать?

- Это бизнес-кейс. Может оказаться, что даже если вероятность невысокая, предсказание годится. Например, мы показываем запрошенный клиентом целевой сегмент - условно 100 000 абонентов. И добавляем: вероятность того, что в этих 100 000 абонентов присутствует ваш сегмент, - 30%. Клиента это устраивает, потому что даже если он построит сеть, рассчитанную на все 100 000, его база там все равно будет. И от них будет коммерческий доход, так что вся эта инициатива принесет деньги. Это один бизнес-кейс. В других случаях и 80% вероятности может оказаться мало.

- А рекламные SMS-рассылки - тоже кейс Big Data?

- В основном это не машинное обучение, а деревья решений. Алгоритмы не предсказательные. Сейчас есть системы, которые по деревьям решений отправляют SMS, но работают, как правило, в системах очень жестких ограничений по фильтрам. Когда ввели специальные политики и деревья решений, операторы ушли от такого спама. Это должны быть релевантные предложения, которые приходят с частотой, не нарушающей границы комфорта клиента.

Важно: я говорю о мобильном операторе Киевстар. Если человек когда-то подписался на рассылку такси или продуктовой компании и начинает получать от них сообщения, это не SMS от оператора. Это SMS от партнера, которые с согласия человека приходят через сеть оператора. Поэтому называть это спамом и обвинять именно наши алгоритмы неправильно. Клиент всегда может сказать нам, что его добавили в спам-рассылку. А мы посмотрим, можем ли повлиять на это, или нет.

- Какой сейчас порядок цифр по количеству бизнес-клиентов, которым вы уже предоставляете продукты Big Data?

- На данный момент это двузначное число.

Читайте также: Золото оператора. Как мобильщики превращают наши данные в деньги

- Планируете ли развивать инструменты и в какую сторону?

- Да, мы работаем над созданием дата-продуктов, которые могут быть использованы сразу многими клиентами. Есть задачи почти индивидуальные, как я описал с банками или ритейлом. А есть модели, которыми мы можем значительно помочь клиентам в масс-маркете. В них заинтересованы многие, и мы можем их строить не индивидуально.

- Например?

- Например, тот же сегмент автомобилистов. Запрос на их определение может прийти с разных сторон: страховая компания, сеть АЗС, компания - производитель авто. Мы можем создать инструмент, который позволит показывать такие общие модели многим. Это даст эффект масштабирования, и цена на услугу сразу упадет.

- Какие прогнозы по сегменту бизнесов, использующих ваши продукты Big Data?

- Наша цель - получить трехзначное число бизнес-клиентов уже в 2018-м.