Дата драйвен подход в чем заключается
Data Driven-подход
Data Driven-подход — это способ принимать управленческие решения, основываясь на больших данных. Его используют для построения бизнес-модели или маркетинговой стратегии, при составлении плана продаж, в программировании и даже в дизайне.
Для каждой сферы выбирают конкретный тип информации, например данные о покупках, геолокации мобильных устройств, количестве поисковых запросов по теме. При поиске помещения под новую кофейню владелец может проанализировать трафик людей на улицах и выбрать место с наибольшей проходимостью.
Полное название этого подхода — Data Driven Decision Making (DDDM), то есть информационно обоснованные решения (или data driven decisions). Он стал альтернативой устаревшему подходу HiPPO (Highest Paid Person’s Opinion) — принятию решений на основе мнения руководства. Проблема этого подхода в том, что руководитель или менеджер не могут быть объективными и компетентными во всех вопросах и знать все особенности аудитории.
Melbourne Business School проводила исследование того, как компании в 46 странах используют аналитику, и выяснилось, что только 6% из них могут считаться лидерами в этом направлении. Это тот бизнес, в котором проработана аналитическая стратегия и в нее включены все подразделения, высший менеджмент принимает решения исключительно на основе данных, а также в реальном времени мониторится ситуация на рынке.
Еще 49% компаний отнесли к категории «Исследователи», так как они частично используют данные для принятия решений, но не до конца развили инфраструктуру для полноценного Data Driven. Остальные компании отнесли к «Подражателям» и «Отстающим», так как они используют данные только в одной конкретной области или не развивают аналитику вообще.
Data Driven-подход полезен на разных этапах развития:
Например, агентство RUSFAIR GROUP проводит исследования для запуска новых продуктов на рынке электронной коммерции в Китае. Они делают анализ инфополя бренда и конкурентов, затем — анализ потенциальных площадок, исследование аудитории в WeChat — самом популярном социальном приложении в Китае, Douyin — китайском аналоге TikTok и других социальных сетях. Такие исследования позволяют определить объем необходимых инвестиций и грамотно выбрать площадки для продвижения.
Фитнес-клуб в Перми через 7 месяцев после открытия поставил перед собой задачу выйти в лидеры рынка. Для доработки продающей концепции маркетологи изучили опыт конкурентов в городе, собрали данные о том, почему люди не ходят в фитнес-клубы, что их удерживает и почему бросают занятия. В результате изменений, основанных на данных, клуб увеличил выручку в два раза.
Альфа Банк в прошлом году проанализировал всю воронку продаж и поведение клиентов, которые в итоге подали заявку на карту и получили ее на руки. На основе этих данных рекламу стали таргетировать на пользователей, которые с наибольшей вероятностью заинтересуются продуктом, благодаря чему число заявок выросло в 1,6 раза.
Решения на основе данных
Для использования Data Driven-подхода требуются навыки работы с аналитикой. Во-первых, нужно уметь считывать данные из таблиц, графиков и диаграмм, потому что иначе даже на основе самых верных данных можно сделать неверные выводы. Во-вторых, нужно критически относиться к самим данным и задавать аналитику правильные вопросы:
Управление на основе данных включает в себя три подготовительных шага:
Недостатки Data Driven-подхода
Как стать Data Driven-компанией
Data Driven-организация корректно собирает, проверяет и обрабатывает данные и использует их на пользу бизнеса. Такие компании имеют отлаженный механизм работы с данными, в котором все сотрудники четко понимают задачи: data-аналитик собирает данные, отдел маркетинга умеет ставить четкое ТЗ на сбор конкретной информации, а руководство соотносит это с бизнес-целью.
Мария Михеева, продуктовый аналитик AliExpress, считает, что организация Data Driven-подхода затрагивает такие аспекты работы компании, как миссия, идеология и обучение сотрудников. Но в основе подхода все-таки лежат качественные данные — достоверные и очищенные от лишней информации, ненужной компании. На этих данных как раз выстраивается data-менеджмент. Кроме них, есть другие важные аспекты:
Главный критерий успеха в Data Driven-подходе — понимание сотрудниками компании того, зачем нужны данные. Поэтому работу над этой управленческой стратегией стоит начинать с внутреннего PR, презентации и обучения.
В каких профессиях используется Data Driven-подход
Менеджмент
Управление на основе данных — одна из причин роста компаний. Оно помогает оптимизировать расходы, повысить клиентоориентированность, отслеживать изменения на рынке и, как результат, увеличить прибыль. Пока полноценно такой подход реализуют только крупные игроки уровня Google, так как внедрение культуры Data Driven в компании — это ресурсозатратный процесс, который не всем по карману.
Маркетинг
Data Driven-маркетинг позволяет продвигать продукт на ту аудиторию, которой он интересен, что значительно сокращает рекламные расходы. Этим инструментом пользуются, например, маркетплейсы, которые собирают информацию об истории поиска своих клиентов, их покупках и интересах, чтобы предлагать им нужные категории товаров.
Веб-разработка
Разработчики опираются на данные взаимодействия пользователей и сервиса, чтобы зацепить и удержать пользователя. Например, в одной из компаний исследовали, как внутри приложения влияет на вовлечение пользователей лента, предлагающая контент на основе машинного обучения.
Кейсы компаний, которые реализуют Data Driven-подход
Управление
Управление на основе данных позволило компании «Сибур» перестроить работу отделов и избавиться от принципа «глубокого колодца», когда специалисты имеют доступ только к информации, необходимой для выполнения их обязанностей. Автоматизация отделов происходила разрозненно, большой пласт информации скрывали, мотивируя это коммерческой тайной, поэтому у менеджмента разных сегментов было недостаточно данных для анализа работы предприятия.
Внедрение Data Driven-подхода позволило открыть доступ к 80% ранее скрытой информации, сотрудники начали самостоятельно проверять гипотезы на данных, составлять интерактивные дашборды. С помощью бизнес-симуляторов компания начала моделировать различные ситуации на рынке и рассчитывать целесообразность инвестиций или запуска новых продуктов.
Разработка маркетинговых продуктов
На туристическом рынке технологию Data Driven используют, чтобы продвигать путешествия на ту аудиторию, у которой есть интерес к направлению, а также отслеживать реальную эффективность рекламы. Например, если человек интересовался турами в Испанию, смотрел билеты или отели, то он обязательно увидит таргетированную рекламу.
Анализ аудитории
Сбербанк уже несколько лет использует Data Driven для анализа поведения заемщиков. Интерактивная анкета, которую использует банк для сбора информации, позволяет выявить один из важных психологических параметров — уравновешенность или импульсивность клиента. Для банка это важно, так как рассудительные люди являются более добросовестными заемщиками, чем импульсивные. Вопросы в анкете для заемщиков помогают определить уровень финансовой грамотности, их стабильность, опыт работы и трезвое восприятие своего финансового положения.
Получите реальные знание и навыки, необходимые для работы. Обучение на основе практики и помощь в трудоустройстве. Скидка 45% по промокоду BLOG.
Доказательная разработка или как data-driven подход добавил смысла работе
На собеседованиях стороны чаще всего хотят понять, подходят ли они друг другу и будет ли им комфортно работать вместе. Я руковожу командой разработки бэкенда, которая за последние два года выросла вдвое, поэтому собеседований было достаточно. Кандидаты чаще всего задают вопросы о процессах и правилах в компании, а я всегда хочу узнать, что им нравится или не нравится в текущей работе, а также — какой они видят идеальную команду для себя.
С этих собеседований вынес интересное наблюдение: в первую тройку «пожеланий» попадает такая трудно формулируемая вещь, как «хочется, чтобы в работе был смысл». Если начать раскручивать этот клубок, то часто приходим к более негативной формулировке «прошлый заказчик/бизнес не знает, чего хочет и постоянно меняет требования».
В такие моменты всегда вспоминаю, как познакомился с data-driven подходом. Для себя больше люблю называть это доказательной разработкой (по аналогии с доказательной медициной) и расскажу на примере. Сейчас этот подход кажется обычным и естественным, но когда-то стал для меня настоящим откровением. И, судя по вопросам кандидатов на собеседованиях, все еще может быть полезен, хотя обсуждается уже давно.
За свою карьеру также довелось работать в компании, где взаимоотношения между коммерческим и IT-департаментом не складывались, требования и задачи постоянно менялись без видимого смысла. Вспоминать этот опыт я не люблю, но зато есть с чем сравнить, когда говорю о применении data-driven подхода.
Суть метода очень простая: бизнес не оперирует понятиями «задача», «спринт» или им подобным — вместо этого у нас есть гипотезы, а бизнес проверяет влияние гипотез на понятные метрики.
Гипотеза всегда формулируется так, чтобы проверка её была чисто статистической операцией. То есть ответ на вопрос, сбылась ли гипотеза, можно получить математическими действиями, а не личным мнением менеджера «кажется, этот синий цвет недостаточно благороден».
Как мы проверяли ML-гипотезу
Рассмотрим методологию на примере свежего эксперимента с главной лентой (Featured), которая открывается при старте приложения iFunny — там пользователи видят лучший User Generated Content, который уже прошел фильтрацию сообществом в другой ленте.
До недавнего времени пользовательский контент попадал в главную ленту на основании алгоритма по типу «многорукий бандит» (подробнее про задачи этого класса). Но с тех пор, как стали персонализировано для каждого пользователя сортировать главную ленту при помощи алгоритмов машинного обучения (про это, кстати, была отдельная статья), стали думать о том, как использовать эту мощную рекомендательную систему шире.
Гипотеза для нового эксперимента звучала так: «Если выбирать контент для главной ленты с помощью ML-рекомендательной системы, то Engagement и Retention вырастут».
Здесь надо сделать отступление. Чтобы фиксировать изменение метрик, эти метрики надо сначала иметь в своём распоряжении. Именно поэтому так скрупулезно собирается обширная аналитика обо всех действиях пользователей в приложении — об этом можно почитать в статьях о переходе с Redshift на Clickhouse и оптимизации трафика аналитических событий.
Но чтобы делать выводы о том, как гипотеза повлияла на метрики, надо поставить чистый эксперимент. Чистый — значит с контрольной группой. Делим всю аудиторию на две части и показываем одной выдачу нового алгоритма, а во второй оставляем, как было.
Код пишется так, чтобы он, получив на вход группу, для которой выполняется, прошёл по одному или другому пути (звучит несложно, но это пока нет необходимости обрабатывать сочетания экспериментов, затрагивающих одни и те же модули и пути исполнения). Когда код готов, протестирован и выкачен в прод — запускаем эксперимент, записываем метрики для каждой группы и смотрим на то, как они различаются. Групп, кстати, может быть больше двух (если тестируем немного разные варианты или коэффициенты), но контрольная — всегда одна.
Вот, например, график Smile Rate по часам сразу после включения нового алгоритма отбора контента для главной ленты:
Как видно по списку наверху, мы собираем намного больше данных: там и Unsmile Rate (да, у нас, в отличие от трендов социальных сетей, есть дизлайки), и Share Rate, и Comment, и View Time. Разумеется, чтобы принять решение об удачном результате эксперимента, нужно проанализировать их все.
На этом графике победа тестовой группы кажется очевидной. Но есть ещё одно правило: разница в значениях метрик должна быть статистически значима, иначе мы можем принять желаемое за действительное и сделать поспешные ошибочные выводы.
То есть в идеале исходная гипотеза «Если выбирать контент для главной ленты с помощью ML-рекомендательной системы, то Engagement и Retention вырастут» должна звучать так: «Если выбирать контент для главной ленты с помощью ML-рекомендательной системы, то Engagement и Retention вырастут статистически значимо». Но мы эту формулировку часто опускаем, потому что она подразумевается по умолчанию.
Именно поэтому (отвечая на вопрос в комментариях к прошлому моему рассказу про сжатие входящего в дата-центр трафика на 70%) мы собираем 100% аналитики со всех пользователей приложения. Иначе для накопления нужной для принятия решения статистики ушло бы пропорционально больше времени, а мы и так проводим эксперименты по нескольку недель и иногда даже месяцев.
Как только эксперимент завершён, он или раскатывается на 100% аудитории, или выключается, а в бэклог ложится задача по выпиливанию из кода лишних (т.е. проигравших) путей.
Тем временем в очереди ждут новые готовые к А/Б-тестированию эксперименты, и цикл повторяется.
С точки зрения инженера, самое главное в этом подходе — это то, что мы начинаем постановку задач и написание кода только после формулирования гипотезы, которая не может быть истолкована двояко. Поэтому, когда работаем над задачей, все участники процесса знают, в чём состоит смысл их действий.
Да, тот самый «смысл в работе», которого так часто не хватает. Когда я это осознал сам в первый раз, то испытал шок: неужели вопрос «а зачем нам это надо?» теперь не просто имеет ответ, но и никакая деятельность не начинается без этого ответа? Сейчас это кажется очевидным и естественным, но в первый раз это произвело эффект просветления.
Но чтобы data-driven подход работал, нужны качественные и надежные метрики. А для этого нужно собирать много аналитики, что уже сложно и дорого. Хорошо, что многие компании уже идут по этому пути.
При этом сами метрики — это не просто отвлеченные цифры, от них напрямую зависит эффективность бизнеса. От Engagement, например, зависит субъективное ощущение пользователями качества контента, насколько он им нравится.
Как я вижу на примере коллег, это дополнительно воодушевляет и вдохновляет на поиск способов выполнять задачи оптимальнее и эффективнее, а со временем — и на генерацию собственных идей об улучшении продукта, которые очень приветствуется. Между прочим, вопрос «принимают ли все участие в развитии того, над чем работают» — еще один частый на собеседовании.
Data Driven: как принимать решения на основе данных
20 минут на чтение
Принципы подхода
Принятие решений на основе данных
Понятие Data Driven появилось еще в 90-х годах прошлого века и получило широкое распространение в бизнесе. В менеджменте чаще всего всего упоминается термин Data Driven Decision, в переводе — «решения, принятые на основе данных».
Подход подразумевает, что нужно понимать данные и уметь строить прогнозы на их основе. То есть на этапе принятия решения должно быть понимание, на что оно повлияет, что нужно изменить, какого результата можно добиться. Так появился термин Data Driven Decision, который подразумевает использование фактических данных для принятия управленческих решений.
Как подход работает на практике
В первую очередь нужно определить бизнес-цель на текущем этапе, например, это может быть рост прибыли или доли на рынке. Второй шаг — обозначить стадии и промежуточные цели, достижение которых определяется метриками. Достижение метрики говорит о том, что компания движется в правильном направлении.
К примеру, рост прибыли можно оценить по количеству новых клиентов, среднему показателю оттока клиентов, размеру среднего чека, количеству повторных продаж, проценту конверсии и показателю маржинальности.
Важно, чтобы цели были достижимы, а метрики грамотно подобраны:
Популярные метрики для оценки бизнеса: уровень удовлетворенности клиента, вовлеченности сотрудников, объем прибыли до вычета расходов и т.д.
Еще один важный момент, который необходимо учитывать, — поведенческая психология руководителей, те моменты, когда интерпретация данных подстраивается под личные приоритеты менеджера.
Визуализация Big Data
Если в традиционном «ручном» подсчете используется небольшое количество данных, то может возникнуть дискуссия относительно репрезентативности построенных на основе этих данных графиков и диаграмм. Зато одной из удобных особенностей методики Big Data является возможность построить объективную и наглядную визуализацию. Такая опция обеспечивает понятность полученных данных даже специалистам, которые далеки от понимания технологии.
Сгенерированные на основе Big Data графики и тепловые карты можно использовать в качестве неопровержимого аргумента. Это особенно важно, когда необходимо принять решение о распределении бюджета. Если на длительном временном промежутке влияние определенного явления не очевидно, визуализация поможет увидеть взаимосвязь между явлениями. Аналогично, визуализация данных помогает оценить масштаб эффекта после введения определенных мер.
Американское издание Wall Street Journal продемонстрировало эффект на население после внедрения различных вакцин. Наиболее показательным является тепловая карта по распространению полиомиелита. Данные собраны за 70 лет со всех 50 штатов США. Каждый прямоугольник обозначает количество заболеваний на 100 000 жителей.
Из приведенного распределения можно сделать много выводов. Например, что мнение кинокритиков не влияет на коммерческий успех фильма. Или тот факт, что у крупнобюджетных кинокартин выше вероятность собрать кассу, которая вдвое превышает бюджет. Или тот факт, что некоторые малобюджетные хорроры становятся суперхитами.
Издание New York Times в 2014 году подготовило впечатляющую визуализацию из 255 графиков, каждый из которых отображает изменение в количестве рабочей силы в определенной индустрии за период с 2004 по 2013. Данные были подготовлены в связи со знаковым событием: к 2014 году в американской экономике были восстановлены 9 млн рабочих мест, утраченных в ходе экономического кризиса 2008−2009 годов. Интерактивный график показывает, в каких индустриях происходил рост, а в каких — падение числа рабочих мест.
Возможности использования метода
Data Driven в web-разработке
В современном цифровом мире данные генерируются и обновляются регулярно. Разработчики опираются на них при создании практически любого программного обеспечения. Но этим не ограничивается сфера применения Big Data.
Бизнес-аналитики используют данные о поведении пользователей, отчёты об ошибках, отзывы пользователей и другую обратную связь, чтобы принимать верные решения при разработке и продвижении продукта. Информация о трафике, загрузках, количестве зарегистрированных пользователей, сообщения и внутренних проблемах сервисов используют для мониторинга качества услуг. А оценка качества кода и согласованности его блоков подскажет оптимальные способы улучшить программное обеспечение. Когда компания следует этим трем направлениям, она разрабатывает и поддерживает услуги на основе данных. А значит исповедует принципы Data Driven бизнеса.
Сбор, интерпретация и обработка данных играют все бо́лее важную роль в любой промышленности. Они обеспечивают точную и действенную обратную связь, которая помогает инженерам понять, где и как вносить улучшения в продукт или процесс. С их помощью ИТ-руководители визуализируют, рабочие процессы, анализируют качество и количество результатов и прогнозируют возможные улучшения.
Искусственный интеллект и большие данные позволяют принимать более обоснованные конструктивные решения и быстрее реализовывать оптимальные бизнес-модели. Машинное обучение помогает разрабатывать новые передовые производственные процессы, повышающие комфорт рабочих и производительность компании.
Data Driven в менеджменте
Data Driven Management — управление бизнесом на основе объективных, фактических данных.
Подход открывает перед управленцами широкие возможности:
Результат — рост прибыли.
Data Driven используют крупнейшие компании мира: Intel, Google, Chevron. В России, например, «Сбербанк». В банке с каждым годом растет количество решений, принятых на основе анализа данных. В качестве ключевого подхода к моделированию «Сбербанк» использует CRISP — Cross Industries Standard Process по Data Mining — межотраслевой стандарт извлечения данных.
Data Driven в дизайне
Data Driven Design — проектирование продуктов на основе данных, полученных с помощью тестов, исследований, проверки гипотез.
Раньше предполагалось, что дизайнер принимает решения на основе собственного вкуса и опыта, однако сейчас этого недостаточно. Работа в digital оценивается по KPI (Key Performance Indicators) и, чтобы их достичь, необходимо уметь прогнозировать, а значит анализировать.
При таком подходе подрядчик и заказчик концентрируют свои усилия, чтобы сделать сервис удобным пользователям, а не удовлетворять чьи-либо амбиции.
Новый уровень требований привел к тому, что профессия дизайнера распалась на несколько самостоятельных единиц — теперь над проектами работают целые дизайн-команды: UI-дизайнер, UX-проектировщик, дизайнер анимации, аналитики и арт-директор. Также подключаются специалисты по Big Data (data scientist).
Data Driven Design — это постоянные циклы улучшений, но здесь есть риск погрязнуть в данных и уделить излишнее внимание мелочам.
Такое явление получило название датацентризм. Например, в 2009 году из-за подобного подхода из Google уволился ведущий дизайнер.
В маркетинге
Новая концепция Data-driven маркетинга опирается на старую поговорку: «Невозможно управлять тем, что нельзя измерить». В Data driven бизнесе измерить можно и нужно все. В первую очередь это касается маркетинговой аналитики: релевантная информация о клиентах необходима для выстраивания персонализированных и действенных таргет-кампаний.
Еще в 2013 году 74% онлайн-потребителей заявляли, что разочаровываются в сайтах, на которых появляется контент, не соответствующий их интересам. 50% посетителей сайта просто покинут платформу, увидев такой контент. Чтобы оставаться конкурентоспособными при таких условиях рынка, предприятиям необходимо сосредоточиться на анализе и применении данных в своих маркетинговых кампаниях.
Data Driven маркетинг позволяет персонализировать взаимодействие с клиентом, что необходимо в условиях постоянно растущей конкуренции. Сегодня персонализированный маркетинг выходит далеко за рамки именных приветствий по электронной почте. Он определяет что, как и когда видит клиент онлайн. Все всплывающие окна, акции и реклама появляются перед глазами пользователя в наиболее удачный для компании момент.
Такие целевые сообщения достигают бо́льших результатов, чем общие рассылки, а сегментация рекламных кампаний позволяет получить более высокий ROI. Например, если магазин продает и мужскую, и женскую одежду, ему понадобятся как минимум два набора маркетинговых рассылок. Такая же ситуация с разными точками дистрибьюции − маркетинговая тактика для московской аудитории должна отличаться от кампаний, ориентированных на казанских покупателей. На основе данных и создается оптимальная рабочая схема, удобная для управления и масштабирования.
Успех Data Driven маркетинга зависит от точности данных о клиентах. Даже самые простые алгоритмы сбора информации бесполезны, если, если она не будет правильно отражать интересы клиентов и целевой рынок. Следует обращаться к существующей клиентской базе, чтобы сформировать представление о целевой аудитории.
Маркетинг на основе данных − это итеративный процесс, который постоянно развивается и расширяется. В грамотно выстроенном маркетинге процесс анализа и интерпретации данных ведется постоянно. Нельзя оперировать данными пятилетней давности для работы с современной аудиторией сайта. Поэтому важным фактором успеха является управление данными. Оно помогает выстроить процесс регулярного анализа данных о клиентах, оценивать новые возможности маркетинга, а также экономить время и ресурсы команды.