13 Сен

Big Data для всех: у вас есть данные для анализа

“Big Data – это для больших, у нас нечего анализировать». Это устоявшийся стереотип. Большинство компаний сейчас имеют бесценные неразведанные залежи данных. Небольшой кейс в качестве иллюстрации.

Магазин выбивался из общей массы сети структурой своих продаж. Алкоголь, сигареты, фрукты, сладости формировали основной объем выручки. Расположение магазина в центре города наводило на мысль, что основные покупатели, на которых надо ориентироваться, это работающие в этом районе и туристы. Можно ли проверить гипотезу на основании данных магазина? Да. Выгружаем Z-отчет за полгода. Простая структура, каждая строчка – это наименование товара и артикул, количество и стоимость купленной продукции, дата и время. Смотрим структуру продаж по отдельным товарам и категориям по часам внутри суток.

prodazhi-po-chasam

На графике приведен небольшой фрагмент.

Изучая данные, выделили отдельные сегменты с разной структурой потребительской корзины и определенным временем покупок.

  1. Идущие на работу
  2. Обедающие
  3. Домохозяйки (делают покупки с 11 до 13 часов и с 15 до 17 часов)
  4. Туристы и другие.

Всего 9 сегментов. Понимание сегментов позволяет оценивать удовлетворенность потребностей не среднего покупателя, а более узких групп, адаптируя ассортимент под них. Неожиданным было, что самый ценный сегмент — это домохозяйки. И большинство дорогих продуктов и деликатесов покупалось для потребления в семье, в общей потребительской корзине. А на них данный магазин последнее время не ориентировался. Задали признаки каждого из сегментов и можем отслеживать, как меняется их покупательская активность вслед за нашими действиями: изменением ассортимента, выкладки и тд.

Из любопытного. Коньяк стабильно продается в течении дня, без серьезных пиков. Есть падение продаж с 15 до 16 часов, но именно в это время растут продажи виски. Это устойчивая закономерность, но с чем она связана для меня пока загадка. Удивил факт, что средства для бритья продаются строго после 21 часа. Связываю с тем, что вокруг есть несколько больших гостиниц и покупатели туристы/ командировочные. Когда был на месте, сам пошел примерно в это время за лосьоном после бритья.

Если основную массу обработок проводили на локальных компьютерах, то для построения семантических правил вынуждены были арендовать мощности в облаке Azure от Майкрософт. Что такое семантические правила проще всего объяснить на примере. Если покупатель приобретает жевательную резинку и зажигалку, то с вероятностью 0,85 он приобретет пачку сигарет. Узнаете потребительский сегмент? А вот наоборот не работает. Те клиент, который покупает пачку сигарет редко приобретает жевательную резинку и зажигалку. Это и есть семантическое правило. Или другой пример, клиент, который бросил в корзину две упаковки сметаны, с вероятностью 0,7 приобретет и творог. Это знание позволяет разрабатывать эффективные системы стимулирования и оптимизировать выкладку, чтобы повысить вероятность совместных покупок.

При анализе данных на себя обратил факт регулярного отсутствия продаж некоторых товаров. Написали небольшой скрипт, который показал, что потери продаж от отсутствия товара на полке по некоторым категориям составляет от 10 до 15%. И до этого собственники знали о проблемах с наличием товара. Но когда эта проблема обрела вполне понятные финансовые очертания, ее решение не стали откладывать.

Три решения, которые были приняты с опорой на элементарных данных, которые есть у любой компании. Копание в данных не зря называется добычей. Надо перелопатить порой огромные кучи мусора разными методами, чтобы найти бесценный бриллиант знания. И даже после находки не стоит останавливаться. К этим данным подключили уже производственный календарь, а чуть позже факт погоды. Это позволит прогнозировать продажи и избегать ситуаций дефицита. Работаем над попыткой все-таки кластеризовать этот разреженный массив и много чего еще интересного проверить в поисках новых драгоценных камней.

Превращайте и вы свои данные в бесценное знание борьбы за клиента. А значит, прибыль. Но не увлекайтесь, чтобы окончательно проверить существующие или найти новые гипотезы надо не забывать регулярно общаться с живыми клиентами. И тогда знание будет гармоничным.

Поддержи!Tweet about this on TwitterShare on VKShare on Facebook0Share on LinkedIn95Share on Google+0Email this to someonePrint this page

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.

Андрей Кулинич. Copyright © 2001-2016