Если разбираться глубже, то это совокупность методов анализа данных с их интерпретацией, которая помогает на основе прошлых событий принять с большой точностью верное решение в будущем.
Происходит это за счет нахождения параметров среди данных, которые влияют на другие. Далее определяется степень влияния, и происходит магия: Вы получаете картину того, как изменится Ваш бизнес, если какой-то параметр изменит свое значение.
История данной методики берет свое начало с 40-х годов прошлого столетия, когда команда под руководством Алана Тьюринга пытались взломать шифровальную машину Фашистской Германии “Энигма”.
Сложность данной операции заключалась в том, что алгоритм Энигмы менялся каждые 24 часа, и его не успевали взламывать
Алан Тьюринг, британский математик, изобретатель вычислительной “Машины Тьюринга” предположил, что в любом случае есть какая-либо корреляция между символами, осталось лишь ее вычислить. Но для этого требовалось хоть что-то, что есть в каждом зашифрованном сообщении.
Немцев подвела их идеология - в каждом их сообщении была ритуальная для них фраза “Да здравствует Гитлер”.
Вычислив алгоритм составления этой фразы, а именно, соответствие зашифрованных символов символам из реальной фразы, команде тьюринга удалось разгадать “Код Энигмы”. Кстати, считается, что как раз это и позволило значительно сократить Вторую мировую войну.
P.S. На эту тему снят потрясающий, на мой взгляд, фильм “Игра в имитацию” 2014 года.
Ну и после этот метод предиктивной аналитики начал успешно применяться и в других вычислительных задачах, что позволило родиться тому, на основе чего я написал эту статью.
Зачем нужна бизнесу
Предикативная аналитика дает преимущество перед Вашими конкурентами. Представьте, что Вы всегда владеете прогнозной информацией, знаете, что будет с бизнесом завтра, и какое решение более оптимальное в этой ситуации.
А теперь ответьте себе на один вопрос, только честно: "На основе чего Вы приняли последнее решение в Вашем бизнесе?" Ответили?
Наверняка что-то из разряда: "у меня большой опыт", "раньше всегда так принимались решения", "мне посоветовал мой маркетолог, жена, брат, сват" и т.д. И вполне вероятно, что это решение было верное, но случайное.
А теперь я Вам расскажу, как бы Вы его принимали, опираясь на предиктивную аналитику. Только учтите, что это лишь малая часть способов её применения.
1. Оптимизация в ритейле и FMCG
В них это работает следующим образом: если Вы знаете, какие продукты пользуются спросом у покупателей, можно решить сразу несколько задач: каких товаров и сколько должно быть постоянно в Вашем магазине (интернет-магазине), что предложить покупателю вдобавок к его покупке, какую цену оптимально установить на определенный товар.
Пример:
Вы владелец интернет-магазина одежды. У Вас есть информация, что 80% клиентов мужского пола вместе с пиджаком покупают еще и рубашку.
Так вот, зная это, Вы сможете предлагать всем мужчинам, которые заказали только пиджак, заказать еще и рубашку. Наверняка многие согласятся, т.к. статистика не врет. Тем самым Вы повысите средний чек заказа.
2. Оптимизация производства
Если Вы собираете информацию о параметрах, влияющих на работу оборудования, а не надеетесь только на инструкцию по эксплуатации, то намного проще предотвратить его поломки и провести необходимое обслуживание.
Пример:
У Вас своя конвейерная линия, и уже не раз случалось, что при повышенных температурах воздуха оборудование выходит из строя. Зная это и прогноз погоды на ближайшее время, Вы сможете предотвратить повышение температуры в цеху, тем самым избежите простоя.
3. Обнаружение мошенничества
Если у Вас есть статистика по недобросовестным клиентам, например, по их полу, возрасту, профессии и другим признакам, то Вы сможете их отсеивать еще на стадии анкетирования.
Пример:
Вы занимаетесь банковскими услугами, и у Вас есть собранная информация о том, что клиенты от 18 до 21 года, а также судимые чаще всего не производят выплаты по кредитам. Зная это, Вы можете не сотрудничать с клиентами из этих сегментов.
4. Управление рисками
Если в Вашем бизнесе есть риск, то с помощью прогнозного анализа прошлых негативных событий можно влиять на их предотвращение в будущем или же лучше страховаться от них.
Пример:
Вы занимаетесь страхованием здоровья, и у Вас есть статистика, что у людей из промышленных профессий риск травм выше, чем у менеджеров.
Соответственно, чтобы компенсировать риски от страхования людей с пром.предприятий, Вы запросите у них бОльшую страховую сумму и будете стараться диверсифицироваться путем страхования менеджеров.
5. Маркетинговый и клиентский анализ
Если Вы собираете информацию о Ваших клиентах, их поведении, величине и частоте покупок, Вы сможете смоделировать будущее поведение клиентов.
Зачем это нужно? Как минимум, для понимания людей, а в идеале для улучшения клиентского сервиса на каждом этапе взаимодействия клиента с Вашим бизнесом.
Пример:
Вы владелец кинотеатра. Благодаря системам видеонаблюдения получили среднестатистический путь зрителя: он открывает дверь, отряхивает ноги, проходит к кассе, покупает билет, проходит в гардероб, посещает туалет и ждет открытия дверей в кинозал.
Уже только в этих местах Вы можете организовать дополнительные рекламные размещения.
Также можно сделать посещение кинотеатра удобнее: поставить самооткрывающиеся двери, положить дополнительный коврик при входе, организовать автоматическую систему покупки билетов, увеличить количество работников гардероба и т.д.
6. Продажи
Благодаря аналитике в продажах, Вы сможете точно знать, какие показатели непосредственно влияют на выручку и прибыльность бизнеса, а какие косвенно.
Пример:
Вы сможете посмотреть на статистику прошлого года по конверсии из заявок в продажи и оценить, что влияло на неё положительно, а что отрицательно. После чего составите план действий на текущий год, чтобы достигнуть поставленных целей.
7. Работа с персоналом
Ведение учета причин добровольных увольнений и фиксация их зависимости от срока работы поможет снизить текучку кадров, повысить лояльность Ваших сотрудников или хотя бы будете готовы к их уходу.
Пример:
Вы заметили, что персонал, который проработал в компании 2 года на одной должности, увольняется по причине того, что им становится неинтересно. С этой информацией Вы сможете периодически устраивать ротацию в коллективе или хотя бы заблаговременно подготовить замену этому сотруднику.
3 кита предиктивной аналитики
Аналитика в целом (и прогнозная в частности) предполагает работу с данными. Там где их нет - нечего анализировать, и нет почвы для выводов. Поэтому, когда Вы принимаете решение, не опираясь на информацию, Вы превращаетесь из предпринимателя в гадалку. Не надо так! А теперь к китам.
Кит 1. Сбор данных
Чтобы работать с информацией, её нужно собрать - все логично. Но какие собирать и как? На эти вопросы нет правильных ответов. Для каждого бизнеса необходимы данные и методы. Поэтому здесь работает правило: чем больше, тем лучше. Но все же перечислю основные:
- Количественные показатели. Сколько клиентов привлекли, сколько сообщений написали, сколько продукта продали и т.д.;
- Экономические показатели. Сколько денег заработали и потратили, какая маржинальность, прибыльность и т.д.;
- Внешние факторы. Уровень конкуренции, стратегии конкурентов, экономическая и политическая ситуация и т.д.;
- Внутренние факторы. Загруженность персонала, уровень квалификации кадров, факторы влияющие на производство;
- Временные показатели. Какое время затрачивается на одну сделку, как часто они повторяются;
- Конверсионные показатели. Какой процент клиентов перешли из одного этапа воронки продаж в другой;
- Клиентский путь. Откуда к Вам пришел клиент, как о Вас узнал, какой путь преодолел, как себя вел и тд.;
- Клиентские показатели. Пол, возраст, профессия, семейное положение, уровень достатка, где живет, его потребности и т.д.
И далее, далее, далее...Продолжать можно бесконечно. В оффлайне это датчики движения и сбора информации, wi-fi мониторы, системы умного видеонаблюдения, кассовые аппараты и товароучетные системы.
Тем, кто в танке и все ведет в книгах учета, на листочках и тетрадях - не позавидуешь. В этом случае сбор данных ограничивается наблюдением, проведением опросов и подобными инструментами. И если Вы сейчас подумали "о, у меня так", то просыпайтесь скорей и вступайте в эру информационных технологий.
Кит 2. Исследовательский анализ
Здесь начинается работа с данными. На этом этапе нужно из их совокупности найти ранее неизвестные, непонятные сведения. А также и полезные практические интерпретации собранных знаний, которые необходимы для принятия обоснованных решений.
Это понятие называют "data mining" - обнаружение знаний в данных. Основу их составляют различные методы классификации, моделирования, а также статистические методы. Об основных я расскажу чуть ниже.
Скажу сразу, для проведения эффективного анализа необходима достаточно крупная база сведений. Так в этом случае работает закон больших чисел - чем больше, тем более объективными будут выводы. Исследовательский анализ информации решает задачи:
- Классификация. Присвоение одного элемента к группе других по определенным параметрам;
- Регрессия. Выявление зависимости результатов от исходных данных;
- Кластеризация. Объединение объектов в группы по различным параметрам;
- Ассоциация. Определение закономерностей между событиями;
- Последовательная ассоциация. Определение, через какое время после одного события случится другое;
- Анализ отклонений. Определение некоторого количества исключений из правил.
Кит 3. Предиктивное моделирование
То, ради чего и нужна система предсказательной аналитики - создание высокоточных прогнозов. После предыдущих этапов у Вас есть массив данных, нам нужны их интерпретации. То есть различные классы, кластеры, зависимости, ассоциации и отклонения от нормы. На этом этапе Вам необходимо:
- Поставить задачу перед аналитикой. Прогноз того, что Вы хотите получить и на какой промежуток времени, или время до определенного события. Это может быть прогноз прибыли на год, спроса на рынке в августе, или сколько еще проработает Ваш станок;
- Выбрать математическую или статистическую модель. Она и сделает этот прогноз. Если проще, то принять во внимание множество факторов, которые влияют на заданный прогноз, распределить их удельный вес в конечном результате и ввести исходные сведения.
Основные типы и их методы
В основе предиктивной аналитики лежат статистические методы. Также важно понимать, что её система тесно связана с big data и искусственным интеллектом, поэтому основана на машинном обучении. Теперь к делу.
Типов ПА всего существует не 2, но я расскажу именно об этих, потому что они точно помогут Вам в бизнесе.
Тип 1. Контролируемое обучение
Или обучение с учителем, подразумевает под собой построение (обучение) модели по исходным данным и выходящим результатам. То есть в построении модели известны и параметры события, и результат, на который они влияют.
Например, если мы знаем, что на выручку влияет число покупок и средний чек, а нам необходимо узнать, каким образом влияет тот или иной параметр на её размер, то мы прибегнем к контролируемому обучению. Оно включает два ключевых метода предиктивной аналитики:
1.1. Регрессия
Это самый популярный метод. Применяется для получения количественных ответов или числовой ценности. Например, для расчета выручки по конкретным параметрам. При регрессии используется:
- Числовая переменная ответа. То, что пытаются предсказать;
- Предикторы. Параметры, которые влияют на ответ.
Взаимосвязь между параметрами и результатом и есть предиктивная модель. Кстати, помимо взаимозависимости рассчитывается и вес каждого параметра - то, в какой степени каждый из параметров влияет на конечный результат.
Пример
Чтобы было понятнее, вернемся к той же выручке. У нас есть показатели выручки, среднего чека и количества клиентов за три месяца:
Месяц | Количество клиентов | Средний чек | Выручка |
1 | 10 | 3 000 | 30 000 |
2 | 11 | 3 000 | 33 000 |
3 | 10 | 3 300 | 33 000 |
Из этих данных видно, что зависимость выручки от количества клиентов и среднего чека прямая пропорциональная.
Выручка = Количество клиентов * Средний чек.
Зная эту формулу, Вы сможете прогнозировать выручку и влиять на нее, сосредотачивая усилия на росте предикторов. Ну или же понять, сколько Вам необходимо привлечь клиентов и при каком среднем чеке, чтобы получить желаемую выручку.
Это выглядит просто, когда Вы знаете зависимость. Но даже если в этом уравнении разложить, из чего складывается количество клиентов, и какой параметр в какой степени влияет на этот показатель, то получится большая и достаточно сложная цепочка.
1.2. Классификация
Этот метод связан с причислением объекта к какому-либо классу по определенным параметрам. Его задача определить, к какому именно.
Работает это так: в базу данных загружаются все известные переменные объектов, например, по каждому человеку загружают пол, возраст, профессию и уровень дохода. Далее алгоритм вычисляет зависимость одного от другого и предсказывает неизвестный параметр объекта по известным. Обычно в бизнесе этот метод применяется для различных сегментаций.
Пример
Вы занимаетесь оптовой торговлей одежды, и размер скидок зависит от объема закупок товара. Первый способ определить уровень скидки новому клиенту - поработать с ним определенное время.
Если же Вы используете классификационный метод, то имея инфу о прошлых клиентах, например, о местоположении, об ассортименте, Вы можете рассчитать влияние параметров на объем закупок Вашей продукции.
Вывод: зная это, Вы сможете предугадать, какой объем закупок следует ожидать от нового клиента. Ну и не стоит забывать, что чем больше у Вас данных, тем более точными будут прогнозы.
2. Неконтролируемое обучение
В этом типе предиктивное моделирование происходит только по входящим данным без привязки к ответу. Ответ подбирается автоматически в процессе обучения. Это требуется для поиска и анализа скрытых закономерностей внутри сведений о которых ранее было неизвестно. Основной метод - кластеризация.
2.1. Кластеризация
К этому методу прогностической аналитики относятся задачи:
- Проектирование типологии и классификации;
- Анализ эффективных схем группировки данных;
- Рождение гипотез на основе исследований;
- Проверка гипотез принадлежности одного объекта к проверяемой группе.
Для бизнеса она полезна тем, что на основе кластерного анализа можно более четко представлять взаимосвязи и зависимости. Помимо этого, он помогает выявлять отклонения и новые тенденции.
Пример
Возьмем тот же пример, что и в классификационном методе. Только если там нам и нашей модели уже известна зависимость объема закупок от параметров (местоположение, рекламные вложения и ассортимент), то в этом случае мы их не знаем.
Так вот, мы загружаем данные о наших клиентах и алгоритм определяет, есть ли взаимозависимость между ними, и если есть, то какая.
Инструменты предиктивной аналитики
Есть много инструментов и программных продуктов. Они отличаются между собой функциональностью и удобством пользования. Некоторые из них нужны для создания предиктивных моделей, некоторые для их интерпретации, а самые продвинутые - для того и другого. При выборе инструмента обратите внимание на:
- Поддержка полного цикла аналитики. От исследования данных до создания моделей и оценки их эффективности;
- Интеграция знаний. Знания, полученные в процессе аналитики, должны интегрироваться в другие сферы бизнеса;
- Поддержка интеграции. Она необходима с различными источниками получения и обработки данных;
- Удобство пользования. Программа должна быть понятна для разных типов пользователей: от статистиков до менеджеров;
- Адаптивность к работе. Работоспособность с минимальным вмешательством программистов и технических специалистов.
Так вот, в результате функционирования таких систем, управляющие специалисты могут своевременно формировать гипотезы и проверять их, принимать точные и обоснованные решения.
Язык программирования R. Фаворит рынка, это связано с тем, что в процессе обучения специалистов подобного профиля задействован именно этот язык программирования.
Преимущества:
- Открытый исходный код;
- Расширяемая аналитическая среда;
- Возможность визуализации представления данных;
- Большое сообщество пользователей;
- Разрабатывался статистиками для статистиков.
Цена: Бесплатно.
Язык программирования Python. Набирает популярность. Основная идея: хороший язык программирования - простой и доступный.
Преимущества:
- Простой и интуитивно-понятный;
- Встроен инструмент для тестирования;
- Многоцелевой язык.
Цена: Бесплатно.
RapidMiner. Среда для прогнозной аналитики, которая поддерживает все этапа анализа, проверки, визуализацию и оптимизацию данных.
Преимущества:
- Не нужно знать программирование, метод визуального программирования;
- Расширяемая система, поддержка языка R;
- Возможность оценки тональности текста;
- Сообщество пользователей и поддержка новичков.
Цена: Бесплатно.
Knime. Система для анализа данных, которая даже в базовом функционале имеет мощные инструменты.
Преимущества:
- Широкие возможности анализа текста;
- Возможность веб-анализа, анализа изображений и социальных сетей;
- Интуитивно-понятный интерфейс без необходимости программирования.
Цена: Бесплатно.
IBM SPSS Modeler. Низкая требовательность к новичкам, благодаря автоматическому подбору необходимой статистической модели.
Преимущества:
- Автоматическое моделирование и выбор наиболее эффективное модели;
- Геопространственная аналитика;
- Поддержка технологий с открытым исходным кодом (R, Python);
- Аналитика текста.
Цена: От 80$.
IBM Watson Analytics. Один из наиболее мощных инструментов для предиктивной аналитики и анализа больших данных.
Преимущества:
- Возможность работы в облаке;
- Расширенные возможности визуализации;
- Интуитивно-понятный интерфейс без необходимости программирования;
- Быстрота обработки данных.
Цена: От 250$.
SAS Enterprise Miner. Система разработанная для проектирования точных предсказательных и описательных моделей на основе big-data.
Преимущества:
- Клиент-серверное решение - позволяет оптимизировать процессы аналитики;
- Нет необходимости в программировании;
- Продвинутый скоринг - применение модели к новым данным;
- Самодокументируемая проектная среда.
Цена: От 160$.
SAP BusinessObjects Predictive Analytics. SAP в 2015 году был награжден статусом лидера рынка в предсказательной аналитики.
Преимущества:
- Большая автоматизированность, легкость в переобучении модели;
- Расширенные возможности визуализации;
- Возможность расширения языком R.
Цена: От 200$.
Oracle Big Data Preparation. Благодаря интуитивному и интерактивному интерфейсу привлекает пользователей без навыков программирования.
Преимущества:
- Работа в облаке;
- Простота использования;
- Широкие возможности интеграции с другими облачными сервисами.
Цена: От 150$.
Коротко о главном
Итак, предиктивная аналитика — это область знаний, позволяющая принимать взвешенные решения, готовиться к непредвиденным ситуациям и предусматривать всевозможные чрезвычайные происшествия.
Благодаря ПА Вы подготовитесь к непредвиденным ситуациям и повысите эффективность Вашего бизнеса в целом.
Но это не фундамент для бизнеса, а инструмент, повышающий эффективность предприятия. Поэтому бОльшую пользу он принесет уже устоявшейся компании, у которой налажены основные бизнес-процессы и сбор данных.
ПА сложный и ресурсоемкий процесс, требующий высокой квалификации как в статистике, так и в работе с информацией.