ML-система управления маркетинговыми лидами для продаж

Мы в Актионе применяем технологии машинного обучения для того, чтобы понять, насколько тот или иной лид хороший. Для обучения машины нужны данные, много данных.

Продавцы и маркетологи всегда спорят: что есть качественный лид. Каждый понимает по-своему.
Хочется иметь 1 параметр, по которому сравнить. Например: это целевая профессия для этого продукта или нет? Вовлечен человек был или нет? Но жизнь многогранная. И одного фактора бывает недостаточно, важна их комбинация.

Мы в Актионе применяем технологии машинного обучения для того, чтобы понять насколько тот или иной лид хороший. Для обучения машины нужны данные, много данных.

Мы разметили важные точки наших сайтов специальными событиями и собираем историю этих событий по всем авторизованным пользователям. Например, посещал страницу с ценами, брал демодоступ, приходил на вебинар, прочитал X статей, провел Y минут в демо и т. д. Всего таких событий более 100. Из событий получаются и дополнительные данные по каждому пользователю. Сколько раз были те или иные события, как давно, доля каких событий была больше, и итого все комбинации сроков, долей и событий нам дают более 11 тыс. переменных.

Кроме поведения, профиль человека имеет тоже большой вклад. Нам важны: пол, возраст, должность, отрасль компании, где человек работает, размер этой компании, регион. Продуктов в Актионе более 100, и для каждого продукта это свой набор целевых показателей профиля.

Конечно, мы собираем и изучаем данные по взаимодействию продавцов с данным потенциальным Клиентом: какой результат каждого звонка, какой длины был каждый разговор, был ли выставлен счет и как. В случае с событиями важны дополнительные данные, которые являются производными: как часто мы разговаривали с этим клиентом, как давно, доли длинных разговоров, доли счетов и доли отказов. Так как у нас много продуктов, то мы изучаем все параметры как по целевому продукту, так и по этому типу продуктов (справочная система это или это, например, онлайн-школа) и в целом по всем контактам.

История покупок тоже важный параметр. Что покупал этот клиент, на какую сумму и по какой акции, сумма всех покупок, сумма максимальной покупки и, конечно, как давно это было. Столько параметров, и все они влияют. Но наша задача — получить один параметр, чтобы ответить на вопрос: хороший лид в итоге всех этих параметров или нет.

У нас работает команда аналитиков, которые используют технологии машинного обучения для того, чтобы построить скорринговые модели по всем. В своей работе мы используем Pythonи SAS. Изучаем, какие параметры были у тех, кто купил тот или иной продукт, и у тех, кто не купил. Каждая модель обязательно делится на 2 части (обычно 70 на 30): на одной части мы обучаем модель, на другой — проверяем. Если результаты схожие, то модель — устойчивая. По итогам модель может предсказать вероятность покупки этим человеком этого продукта и сумму этой покупки. Эту сумму мы дополняем формулой LTV, которая учитывает всю сумму, которую клиент заплатит с учетом повторных покупок. В итоге получили параметр — потенциальный LTV, по нему мы и оцениваем, хороший лид или плохой.