Предиктивная аналитика: 3 метода и системы

Содержание
Предиктивная аналитика (от английского “predictive analytics”) - это предсказательная или прогнозная аналитика.

Если разбираться глубже, то это совокупность методов анализа данных с их интерпретацией, которая помогает на основе прошлых событий принять с большой точностью верное решение в будущем.

Происходит это за счет нахождения параметров среди данных, которые влияют на другие. Далее определяется степень влияния, и происходит магия: Вы получаете картину того, как изменится Ваш бизнес, если какой-то параметр изменит свое значение.

История данной методики берет свое начало с 40-х годов прошлого столетия, когда команда под руководством Алана Тьюринга пытались взломать шифровальную машину Фашистской Германии “Энигма”.

Сложность данной операции заключалась в том, что алгоритм Энигмы менялся каждые 24 часа, и его не успевали взламывать

Алан Тьюринг, британский математик, изобретатель вычислительной “Машины Тьюринга” предположил, что в любом случае есть какая-либо корреляция между символами, осталось лишь ее вычислить. Но для этого требовалось хоть что-то, что есть в каждом зашифрованном сообщении.

Немцев подвела их идеология - в каждом их сообщении была ритуальная для них фраза “Да здравствует Гитлер”.

Вычислив алгоритм составления этой фразы, а именно, соответствие зашифрованных символов символам из реальной фразы, команде тьюринга удалось разгадать “Код Энигмы”. Кстати, считается, что как раз это и позволило значительно сократить Вторую мировую войну.

P.S. На эту тему снят потрясающий, на мой взгляд, фильм “Игра в имитацию” 2014 года.

Ну и после этот метод предиктивной аналитики начал успешно применяться и в других вычислительных задачах, что позволило родиться тому, на основе чего я написал эту статью.

Зачем нужна бизнесу

Предикативная аналитика дает преимущество перед Вашими конкурентами. Представьте, что Вы всегда владеете прогнозной информацией, знаете, что будет с бизнесом завтра, и какое решение более оптимальное в этой ситуации.

Важно. Сразу хочу извиниться перед математиками: это статья будет написана простыми словами, и для лучшего понимания, термины могут быть заменены на человеческие понятия, а принципы описаны ненаучно.

А теперь ответьте себе на один вопрос, только честно: "На основе чего Вы приняли последнее решение в Вашем бизнесе?" Ответили?

Наверняка что-то из разряда: "у меня большой опыт", "раньше всегда так принимались решения", "мне посоветовал мой маркетолог, жена, брат, сват" и т.д. И вполне вероятно, что это решение было верное, но случайное.

А теперь я Вам расскажу, как бы Вы его принимали, опираясь на предиктивную аналитику. Только учтите, что это лишь малая часть способов её применения.

предиктивный анализ
Предсказательная аналитика в разных сферах бизнеса
Кстати. Для поиска конкурентов рекомендую следующие сервисы: Livedune (по промокоду "INSCALE" скидка 30% +7 дней доступа), Spywords (по промокоду INS_613070 скидка 10%)Keyso. Они точно помогут Вам держать руку на пульсе.

1. Оптимизация в ритейле и FMCG

В них это работает следующим образом: если Вы знаете, какие продукты пользуются спросом у покупателей, можно решить сразу несколько задач: каких товаров и сколько должно быть постоянно в Вашем магазине (интернет-магазине), что предложить покупателю вдобавок к его покупке, какую цену оптимально установить на определенный товар.

Пример:

Вы владелец интернет-магазина одежды. У Вас есть информация, что 80% клиентов мужского пола вместе с пиджаком покупают еще и рубашку.

Так вот, зная это, Вы сможете предлагать всем мужчинам, которые заказали только пиджак, заказать еще и рубашку. Наверняка многие согласятся, т.к. статистика не врет. Тем самым Вы повысите средний чек заказа.

предиктивная модель
Анализ ассортимента и его прогноз

2. Оптимизация производства

Если Вы собираете информацию о параметрах, влияющих на работу оборудования, а не надеетесь только на инструкцию по эксплуатации, то намного проще предотвратить его поломки и провести необходимое обслуживание.

Пример:

У Вас своя конвейерная линия, и уже не раз случалось, что при повышенных температурах воздуха оборудование выходит из строя. Зная это и прогноз погоды на ближайшее время, Вы сможете предотвратить повышение температуры в цеху, тем самым избежите простоя.

предиктивная диагностика что это
Статистика работы оборудования

3. Обнаружение мошенничества

Если у Вас есть статистика по недобросовестным клиентам, например, по их полу, возрасту, профессии и другим признакам, то Вы сможете их отсеивать еще на стадии анкетирования.

Пример:

Вы занимаетесь банковскими услугами, и у Вас есть собранная информация о том, что клиенты от 18 до 21 года, а также судимые чаще всего не производят выплаты по кредитам. Зная это, Вы можете не сотрудничать с клиентами из этих сегментов.

прогнозная аналитика
Статистика мошенничества

4. Управление рисками

Если в Вашем бизнесе есть риск, то с помощью прогнозного анализа прошлых негативных событий можно влиять на их предотвращение в будущем или же лучше страховаться от них.

Пример:

Вы занимаетесь страхованием здоровья, и у Вас есть статистика, что у людей из промышленных профессий риск травм выше, чем у менеджеров.

Соответственно, чтобы компенсировать риски от страхования людей с пром.предприятий, Вы запросите у них бОльшую страховую сумму и будете стараться диверсифицироваться путем страхования менеджеров.

прогнозная аналитика
Минимизация рисков

5. Маркетинговый и клиентский анализ

Если Вы собираете информацию о Ваших клиентах, их поведении, величине и частоте покупок, Вы сможете смоделировать будущее поведение клиентов.

Зачем это нужно? Как минимум, для понимания людей, а в идеале для улучшения клиентского сервиса на каждом этапе взаимодействия клиента с Вашим бизнесом.

Пример:

Вы владелец кинотеатра. Благодаря системам видеонаблюдения получили среднестатистический путь зрителя: он открывает дверь, отряхивает ноги, проходит к кассе, покупает билет, проходит в гардероб, посещает туалет и ждет открытия дверей в кинозал.

Уже только в этих местах Вы можете организовать дополнительные рекламные размещения.

Также можно сделать посещение кинотеатра удобнее: поставить самооткрывающиеся двери, положить дополнительный коврик при входе, организовать автоматическую систему покупки билетов, увеличить количество работников гардероба и т.д.

предиктивная система
Путь клиента

6. Продажи

Благодаря аналитике в продажах, Вы сможете точно знать, какие показатели непосредственно влияют на выручку и прибыльность бизнеса, а какие косвенно.

Пример:

Вы сможете посмотреть на статистику прошлого года по конверсии из заявок в продажи и оценить, что влияло на неё положительно, а что отрицательно. После чего составите план действий на текущий год, чтобы достигнуть поставленных целей.

предиктивная аналитика продажи
Анализ конверсии

7. Работа с персоналом

Ведение учета причин добровольных увольнений и фиксация их зависимости от срока работы поможет снизить текучку кадров, повысить лояльность Ваших сотрудников или хотя бы будете готовы к их уходу.

Пример:

Вы заметили, что персонал, который проработал в компании 2 года на одной должности, увольняется по причине того, что им становится неинтересно. С этой информацией Вы сможете периодически устраивать ротацию в коллективе или хотя бы заблаговременно подготовить замену этому сотруднику.

предиктивное управление
Причины увольнений

3 кита предиктивной аналитики

Аналитика в целом (и прогнозная в частности) предполагает работу с данными. Там где их нет - нечего анализировать, и нет почвы для выводов. Поэтому, когда Вы принимаете решение, не опираясь на информацию, Вы превращаетесь из предпринимателя в гадалку. Не надо так! А теперь к китам.

предиктивная аналитика составляющие
Основные компоненты

Кит 1. Сбор данных

Чтобы работать с информацией, её нужно собрать - все логично. Но какие собирать и как? На эти вопросы нет правильных ответов. Для каждого бизнеса необходимы данные и методы. Поэтому здесь работает правило: чем больше, тем лучше. Но все же перечислю основные:

  1. Количественные показатели. Сколько клиентов привлекли, сколько сообщений написали, сколько продукта продали и т.д.;
  2. Экономические показатели. Сколько денег заработали и потратили, какая маржинальность, прибыльность и т.д.;
  3. Внешние факторы. Уровень конкуренции, стратегии конкурентов, экономическая и политическая ситуация и т.д.;
  4. Внутренние факторы. Загруженность персонала, уровень квалификации кадров, факторы влияющие на производство;
  5. Временные показатели. Какое время затрачивается на одну сделку, как часто они повторяются;
  6. Конверсионные показатели. Какой процент клиентов перешли из одного этапа воронки продаж в другой;
  7. Клиентский путь. Откуда к Вам пришел клиент, как о Вас узнал, какой путь преодолел, как себя вел и тд.;
  8. Клиентские показатели. Пол, возраст, профессия, семейное положение, уровень достатка, где живет, его потребности и т.д.

И далее, далее, далее...Продолжать можно бесконечно. В оффлайне это датчики движения и сбора информации, wi-fi мониторы, системы умного видеонаблюдения, кассовые аппараты и товароучетные системы.

Тем, кто в танке и все ведет в книгах учета, на листочках и тетрадях - не позавидуешь. В этом случае сбор данных ограничивается наблюдением, проведением опросов и подобными инструментами. И если Вы сейчас подумали "о, у меня так", то просыпайтесь скорей и вступайте в эру информационных технологий.

На правах рекламы

Кит 2. Исследовательский анализ

Здесь начинается работа с данными. На этом этапе нужно из их совокупности найти ранее неизвестные, непонятные сведения. А также и полезные практические интерпретации собранных знаний, которые необходимы для принятия обоснованных решений.

Это понятие называют "data mining" - обнаружение знаний в данных. Основу их составляют различные методы классификации, моделирования, а также статистические методы. Об основных я расскажу чуть ниже.

Скажу сразу, для проведения эффективного анализа необходима достаточно крупная база сведений. Так в этом случае работает закон больших чисел - чем больше, тем более объективными будут выводы. Исследовательский анализ информации решает задачи:

  1. Классификация. Присвоение одного элемента к группе других по определенным параметрам;
  2. Регрессия. Выявление зависимости результатов от исходных данных;
  3. Кластеризация. Объединение объектов в группы по различным параметрам;
  4. Ассоциация. Определение закономерностей между событиями;
  5. Последовательная ассоциация. Определение, через какое время после одного события случится другое;
  6. Анализ отклонений. Определение некоторого количества исключений из правил.

Кит 3. Предиктивное моделирование

То, ради чего и нужна система предсказательной аналитики - создание высокоточных прогнозов. После предыдущих этапов у Вас есть массив данных, нам нужны их интерпретации. То есть различные классы, кластеры, зависимости, ассоциации и отклонения от нормы. На этом этапе Вам необходимо:

  1. Поставить задачу перед аналитикой. Прогноз того, что Вы хотите получить и на какой промежуток времени, или время до определенного события. Это может быть прогноз прибыли на год, спроса на рынке в августе, или сколько еще проработает Ваш станок;
  2. Выбрать математическую или статистическую модель. Она и сделает этот прогноз. Если проще, то принять во внимание множество факторов, которые влияют на заданный прогноз, распределить их удельный вес в конечном результате и ввести исходные сведения.

Основные типы и их методы

В основе предиктивной аналитики лежат статистические методы. Также важно понимать, что её система тесно связана с big data и искусственным интеллектом, поэтому основана на машинном обучении. Теперь к делу.

Типов ПА всего существует не 2, но я расскажу именно об этих, потому что они точно помогут Вам в бизнесе.

прогностическая аналитика
Основные типы и методы

Тип 1. Контролируемое обучение

Или обучение с учителем, подразумевает под собой построение (обучение) модели по исходным данным и выходящим результатам. То есть в построении модели известны и параметры события, и результат, на который они влияют.

Например, если мы знаем, что на выручку влияет число покупок и средний чек, а нам необходимо узнать, каким образом влияет тот или иной параметр на её размер, то мы прибегнем к контролируемому обучению. Оно включает два ключевых метода предиктивной аналитики:

1.1. Регрессия

Это самый популярный метод. Применяется для получения количественных ответов или числовой ценности. Например, для расчета выручки по конкретным параметрам. При регрессии используется:

  • Числовая переменная ответа. То, что пытаются предсказать;
  • Предикторы. Параметры, которые влияют на ответ.

Взаимосвязь между параметрами и результатом и есть предиктивная модель. Кстати, помимо взаимозависимости рассчитывается и вес каждого параметра - то, в какой степени каждый из параметров влияет на конечный результат.

Пример

Чтобы было понятнее, вернемся к той же выручке. У нас есть показатели выручки, среднего чека и количества клиентов за три месяца:

Месяц Количество клиентов Средний чек Выручка
1 10 3 000 30 000
2 11 3 000 33 000
3 10 3 300 33 000

Из этих данных видно, что зависимость выручки от количества клиентов и среднего чека прямая пропорциональная.

Выручка = Количество клиентов * Средний чек.

Зная эту формулу, Вы сможете прогнозировать выручку и влиять на нее, сосредотачивая усилия на росте предикторов. Ну или же понять, сколько Вам необходимо привлечь клиентов и при каком среднем чеке, чтобы получить желаемую выручку.

Это выглядит просто, когда Вы знаете зависимость. Но даже если в этом уравнении разложить, из чего складывается количество клиентов, и какой параметр в какой степени влияет на этот показатель, то получится большая и достаточно сложная цепочка.

1.2. Классификация

Этот метод связан с причислением объекта к какому-либо классу по определенным параметрам. Его задача определить, к какому именно.

Работает это так: в базу данных загружаются все известные переменные объектов, например, по каждому человеку загружают пол, возраст, профессию и уровень дохода. Далее алгоритм вычисляет зависимость одного от другого и предсказывает неизвестный параметр объекта по известным. Обычно в бизнесе этот метод применяется для различных сегментаций.

Пример

Вы занимаетесь оптовой торговлей одежды, и размер скидок зависит от объема закупок товара. Первый способ определить уровень скидки новому клиенту - поработать с ним определенное время.

Если же Вы используете классификационный метод, то имея инфу о прошлых клиентах, например, о местоположении, об ассортименте, Вы можете рассчитать влияние параметров на объем закупок Вашей продукции.

Вывод: зная это, Вы сможете предугадать, какой объем закупок следует ожидать от нового клиента. Ну и не стоит забывать, что чем больше у Вас данных, тем более точными будут прогнозы.

2. Неконтролируемое обучение

В этом типе предиктивное моделирование происходит только по входящим данным без привязки к ответу. Ответ подбирается автоматически в процессе обучения. Это требуется для поиска и анализа скрытых закономерностей внутри сведений о которых ранее было неизвестно. Основной метод - кластеризация.

2.1. Кластеризация

К этому методу прогностической аналитики относятся задачи:

  1. Проектирование типологии и классификации;
  2. Анализ эффективных схем группировки данных;
  3. Рождение гипотез на основе исследований;
  4. Проверка гипотез принадлежности одного объекта к проверяемой группе.

Для бизнеса она полезна тем, что на основе кластерного анализа можно более четко представлять взаимосвязи и зависимости. Помимо этого, он помогает выявлять отклонения и новые тенденции.

Пример

Возьмем тот же пример, что и в классификационном методе. Только если там нам и нашей модели уже известна зависимость объема закупок от параметров (местоположение, рекламные вложения и ассортимент), то в этом случае мы их не знаем.

Так вот, мы загружаем данные о наших клиентах и алгоритм определяет, есть ли взаимозависимость между ними, и если есть, то какая.

Инструменты предиктивной аналитики

Есть много инструментов и программных продуктов. Они отличаются между собой функциональностью и удобством пользования. Некоторые из них нужны для создания предиктивных моделей, некоторые для их интерпретации, а самые продвинутые - для того и другого. При выборе инструмента обратите внимание на:

  1. Поддержка полного цикла аналитики. От исследования данных до создания моделей и оценки их эффективности;
  2. Интеграция знаний. Знания, полученные в процессе аналитики, должны интегрироваться в другие сферы бизнеса;
  3. Поддержка интеграции. Она необходима с различными источниками получения и обработки данных;
  4. Удобство пользования. Программа должна быть понятна для разных типов пользователей: от статистиков до менеджеров;
  5. Адаптивность к работе. Работоспособность с минимальным вмешательством программистов и технических специалистов.

Так вот, в результате функционирования таких систем, управляющие специалисты могут своевременно формировать гипотезы и проверять их, принимать точные и обоснованные решения.

Язык программирования R. Фаворит рынка, это связано с тем, что в процессе обучения специалистов подобного профиля задействован именно этот язык программирования.

Преимущества: 

  1. Открытый исходный код;
  2. Расширяемая аналитическая среда;
  3. Возможность визуализации представления данных;
  4. Большое сообщество пользователей;
  5. Разрабатывался статистиками для статистиков.

Цена: Бесплатно.

Язык программирования Python. Набирает популярность. Основная идея: хороший язык программирования - простой и доступный.

Преимущества:

  1. Простой и интуитивно-понятный;
  2. Встроен инструмент для тестирования;
  3. Многоцелевой язык.

Цена: Бесплатно.

RapidMiner. Среда для прогнозной аналитики, которая поддерживает все этапа анализа, проверки, визуализацию и оптимизацию данных.

Преимущества:

  1. Не нужно знать программирование, метод визуального программирования;
  2. Расширяемая система, поддержка языка R;
  3. Возможность оценки тональности текста;
  4. Сообщество пользователей и поддержка новичков.

Цена: Бесплатно.

Knime. Система для анализа данных, которая даже в базовом функционале имеет мощные инструменты.

Преимущества:

  1. Широкие возможности анализа текста;
  2. Возможность веб-анализа, анализа изображений и социальных сетей;
  3. Интуитивно-понятный интерфейс без необходимости программирования.

Цена: Бесплатно.

IBM SPSS Modeler. Низкая требовательность к новичкам, благодаря автоматическому подбору необходимой статистической модели.

Преимущества:

  1. Автоматическое моделирование и выбор наиболее эффективное модели;
  2. Геопространственная аналитика;
  3. Поддержка технологий с открытым исходным кодом (R, Python);
  4. Аналитика текста.

Цена: От 80$.

IBM Watson Analytics. Один из наиболее мощных инструментов для предиктивной аналитики и анализа больших данных.

Преимущества:

  1. Возможность работы в облаке;
  2. Расширенные возможности визуализации;
  3. Интуитивно-понятный интерфейс без необходимости программирования;
  4. Быстрота обработки данных.

Цена: От 250$.

SAS Enterprise Miner. Система разработанная для проектирования точных предсказательных и описательных моделей на основе big-data.

Преимущества:

  1. Клиент-серверное решение - позволяет оптимизировать процессы аналитики;
  2. Нет необходимости в программировании;
  3. Продвинутый скоринг - применение модели к новым данным;
  4. Самодокументируемая проектная среда.

Цена: От 160$.

SAP BusinessObjects Predictive Analytics. SAP в 2015 году был награжден статусом лидера рынка в предсказательной аналитики.

Преимущества:

  1. Большая автоматизированность, легкость в переобучении модели;
  2. Расширенные возможности визуализации;
  3. Возможность расширения языком R.

Цена: От 200$.

Oracle Big Data Preparation.  Благодаря интуитивному и интерактивному интерфейсу привлекает пользователей без навыков программирования.

Преимущества:

  1. Работа в облаке;
  2. Простота использования;
  3. Широкие возможности интеграции с другими облачными сервисами.

Цена: От 150$.

Коротко о главном

Итак, предиктивная аналитика — это область знаний, позволяющая принимать взвешенные решения, готовиться к непредвиденным ситуациям и предусматривать всевозможные чрезвычайные происшествия.

Благодаря ПА Вы подготовитесь к непредвиденным ситуациям и повысите эффективность Вашего бизнеса в целом.

Но это не фундамент для бизнеса, а инструмент, повышающий эффективность предприятия. Поэтому бОльшую пользу он принесет уже устоявшейся компании, у которой налажены основные бизнес-процессы и сбор данных.

ПА сложный и ресурсоемкий процесс, требующий высокой квалификации как в статистике, так и в работе с информацией.

Нашли ошибку в тексте? Выделите фрагмент и нажмите ctrl+enter

Автор Михаил Черемохин
0 Комментариев
Заберите подарок
Picture: Like
68 ФИШЕК МАРКЕТИНГА:
от привлечения до удержания

Скачайте методичку и внедрите самые актуальные фишки для увеличения продаж вдвое

Получить
Подпишитесь на рассылку
Picture: Subscribe
Дайджест новых статей
+ неопубликованное от in-scale

Получайте каждую неделю полезные и рабочие материалы для улучшения Вашего бизнеса

Подписаться