Прогнозирование Ухода Пользователя для Free to Play Игр

О проекте

Цель проекта - предсказать день когда пользователь уйдет из игры, и используя эту информацию поддерживать вовлеченность игрока присылая персонализированные уведомления, подарки, акции, до того как он перестанет играть.
 

Доход большинства free to play игр зависит от внутриигровых покупок и важно, чтобы игроки постоянно возвращались в игру.


Уход пользователя - когда игрок не запускал игру 15 дней подряд.

Задача

Сделать модель использующую информации про действия и поведение игрока, чтобы предсказать уход пользователя.
 

Требования к модели:

  1. Точно предсказать когда пользователь покинет игру.

  2. Получить предсказание не позже 8 дней до ухода, чтобы было время на возврат.

  3. Работать на данных из игр разных жанров.

  4. Масштабироваться до десятков тысяч игроков.

Решение

Изучив исследования по предсказанию оттока пользователей в играх, поняли что много работ сконцентрировано на бинарных предсказаниях [1], [2], [3], но для нашей задачи подошла методика анализа выживаемости для игры Age of Ishtaria, который мы взяли за основу для модели.


Данные

Тренировочные данные получили из игровых логов, откуда извлекли:

  1. Дневные логины

  2. Дневные покупки

  3. Игровое время

  4. Получение уровень.

  5. Время прошедшее с первой и последней покупки и деньги потраченные в эти дни.

  6. Полное количество покупок, наигранного времени, логинов и текущий уровень.

Для метрик 1-4 посчитали среднее за первые 9 дней игры, последние 9 дней игры и полный жизненный цикл.


Тренировка Модели

Чтобы ускорить обучение нашей модели из 1500 деревьев мы тренировали ее в 12 потоков на 12-ядерном процессоре, где каждое ядро натренировало по 125 деревьев из ансамбля. Наш алгоритм искал лучшее деление группы в узле дерева, сравнивая разницу взвешенных оценок Каплана-Мейера для всех вариантов делений и выбирал вариант с максимальной разницей.
 

Самыми важными, для модели оказались 4 признака:

  1. Уровень.

  2. Количество дней с последней покупки.

  3. Сумма первой покупки.

  4. Индекс лояльности (Количество дней в игре / Дней с установки).

Результат

Модель успешно строит кривые выживаемости для каждого пользователя и верно предсказывает день ухода для 82% игроков. Но точность модели снижается для пользователей с высоким уровнем, потому что до высоких уровней доходит мало пользователей и становится недостаточно данных для тренировки.

Технологии

  • Python

  • Scikit-learn

  • MongoDB

  • Docker

Киев, Украина

ул. Дмитриевская, 80

+380 (98) 514 43 77 
is@arcanefuture.com 

  • linkedin
  • facebook