Аналитическая культура. От сбора данных до бизнес-результатов Андерсон Карл
Оптимальный вариант — иметь единый централизованный, автоматический, документально подтвержденный «источник истины», из которого бы черпали информацию разные подразделения. Тогда вы сможете использовать результаты анализа и выводы коллег в полной уверенности, что вы сравниваете подобное с подобным. В этом случае становится проще создать единое хранилище результатов аналитической работы и корпоративных знаний о причинных факторах в бизнесе (или о рынке), которому можно доверять и использовать.
Вывод: применяйте общепринятые показатели, если только у вас нет веских причин от них отклониться. При использовании нестандартных показателей зафиксируйте документально, как и почему они нестандартные.
Показатели должны быть достоверными. Это означает, что их среднее числовое значение должно быть приближено к истинному теоретическому среднему значению (см. рис. 6.1). Если использовать метафору стрельбы из лука, то стрела должна попасть точно в мишень.
Рис. 6.1. Точность (в стрельбе есть такой термин, как «кучность» — группировка точек падения снарядов на ограниченной площади) и достоверность (по аналогии со стрельбой это меткость попадания в мишень) на примере двухмерных данных. Недостоверный показатель необъективен, так как его среднее значение системно отличается от истинного среднего значения. Точность показателя отражает его вариативность: насколько будет отличаться среднее значение, если вы повторите эксперимент несколько раз и соберете новые выборки такого же размера
Возьмем, например, объем выручки от продаж на Amazon. Показатель среднего объема выручки за исключением суммы от продажи книг — неточное среднее значение совокупного объема выручки от всех продаж. Этот показатель необъективен. В главе 2 мы уже обсуждали примеры, когда отсутствующие данные приводили к искажению общей картины. Например, средний уровень удовлетворенности клиентов не отражает действительность, если недовольные клиенты из-за задержки доставки товара пропустили дедлайн по опросу и не предоставили свои ответы. В этом примере показатель степени удовлетворенности клиентов завышен по сравнению с его истинным более низким значением.
При разработке показателей постарайтесь учесть все потенциальные источники искажения, как в данных, так и в самом показателе. В главе 2 мы обсуждали некоторые источники необъективности при сборе данных. С точки зрения показателя подумайте обо всех возможных фильтрах при сборе данных, а также о любых скрытых или устаревших «поправочных коэффициентах».
Представьте себе стрелка, который готовится стрелять по дальней мишени и пользуется оптическим прицелом. При стрельбе следует учесть силу и направление ветра, влияющие на траекторию движения пули. Поэтому стрелок регулирует прицел — «поправочный коэффициент» — с поправкой на ветер. При этом если сила или направление ветра изменятся, то эта поправка окажется устаревшей, пули больше не попадут в цель. Внешние обстоятельства часто меняются, а потому необходимо внимательно следить за актуальностью действующих моделей и поправочных коэффициентов.
То же самое верно и в бизнесе. В Warby Parker мы используем электронные устройства для подсчета количества посетителей, вошедших и вышедших из наших розничных магазинов. Одно из возможных применений этих данных — для вычисления показателя конверсии торговой точки, то есть количества посетителей, зашедших в магазин и совершивших какую-нибудь покупку. В одном из таких магазинов персонал может попасть на склад с товаром и вернуться в торговый зал только через главный вход: эти передвижения точно так же считались электронными приборами, из-за чего показатель конверсии получался заниженным. Мы постарались исправить ситуацию, разработав статистическую модель, которая для конкретного дня недели и конкретного уровня занятости оценивала соотношение трафика персонала и посетителей магазина в качестве корректирующего фактора. В результате показатель конверсии стал гораздо более реалистичным. Следует учесть, что подобные модели могут терять свою актуальность при изменении внешних условий, например покупатели могут быть более мотивированы совершать покупки по выходным. Нужно либо периодически перенастраивать модель, либо, как мы пробуем делать сейчас, использовать более совершенные технологии, способные отличить персонал от посетителей и не включать сотрудников при подсчете трафика.
Показатели должны отличаться точностью. Это означает, что при повторении эксперимента в тех же самых условиях значения должны получаться такими же. По аналогии со стрельбой это можно назвать кучностью: все попадания в мишень должны быть рядом на ограниченной площади. Один из инструментов, или рычагов, для контроля точности — размер выборки. Чем больше выборка, тем меньше стандартная ошибка. Однако эта взаимосвязь не линейная. Так как стандартная ошибка среднего значения равна стандартному отклонению, деленному на квадратный корень размера выборки, чтобы уменьшить стандартную ошибку в два раза, нужно в четыре раза увеличить размер выборки.
Сочетание достоверности (меткости попадания в мишень) и точности (кучности стрельбы) показано на рис. 6.1. Если у вас нет подтвержденной справочной информации, вы можете не понять, что ваши показатели недостоверны. Однако вы, скорее всего, рано или поздно поймете, если ваши показатели не отличаются точностью (нестабильны).
Вывод: стремитесь к достоверности и точности показателей и учитывайте издержки и преимущества крупных выборок.
Очень важное решение — относительные или абсолютные показатели следует применять. Этот выбор определяет разработку показателей, которые при одном сценарии показывают очень разные картины.
Представьте, что в какой-то компании ведется классификация клиентов и 25 % от общего количества относятся к категории VIP (например, они приобрели продукцию компании на сумму больше 1 тыс. долл.). Через полгода у этой компании только 17 % VIP-клиентов. Черт, что случилось? Они что, ушли? Как все исправить?
Предположим, что в этот период усилия компании были сосредоточены на привлечении новых клиентов. Тогда, вероятно, общее количество клиентов увеличилось (показано оранжевым на рис. 6.2), а количество VIP-клиентов могло остаться тем же, при этом их пропорция уменьшилась. Фактически вполне возможно даже, что количество VIP-клиентов тоже увеличилось, но при этом пропорция стала ниже.
Рис. 6.2. У компании 25 % VIP-клиентов. В верхнем сценарии компания сосредоточила усилия на привлечении новых клиентов (показано оранжевым). Это привело к увеличению общего количества клиентов, количество VIP-клиентов осталось прежним, но пропорция уменьшилась. В нижнем сценарии компания сосредоточила усилия на работе с текущими клиентами. Пропорция и количество VIP-клиентов стали выше, но общего увеличения клиентской базы не произошло
И наоборот, предположим, что через полгода мы наблюдаем значительное увеличение количества VIP-клиентов и их пропорции. Это может отражать здоровый рост клиентской базы, но, с другой стороны, роста клиентской базы может и не быть, если усилия компании были сосредоточены исключительно на возвращении покупателей и увеличении количества повторных покупок (рис. 6.2, внизу). (Для многих компаний второй сценарий с увеличением количества повторных покупок более предпочтителен по сравнению с увеличением клиентской базы, так как стоимость привлечения новых клиентов, как правило, слишком высока.)
Как видите, выбор между применением абсолютных (количество VIP-клиентов) или относительных (их пропорция) показателей может привести к очень разным интерпретациям.
Вывод: тщательно взвесьте, что вы хотите узнать, и выберите абсолютный или относительный показатель, который будет адекватно отображать нужные вам изменения.
Определяйте статистически робастные[93] показатели, то есть те, что относительно нечувствительны к отдельным резко отличающимся значениям.
Рассмотрим следующий пример из San Francisco Chronicle:
Средняя заработная плата специалистов технического профиля в центральной части полуострова Сан-Франциско (округ Сан-Матео) в прошлом году составила 291 497 долл. Возможное объяснение отклонения: глава компании Facebook Марк Цукерберг получил всего один доллар в качестве зарплаты, но заработал 3,3 млрд долл. на опционах на покупку акций в 2013 году. Если вычесть 3,3 млрд долл. из общей суммы, то среднее значение получится примерно 210 тыс. долл.[94]
Использовать среднее значение в данном случае не следует, учитывая высокую степень позитивной асимметрии в данных по заработной плате. Среднее значение получается существенно завышенным (более чем на 35 %) из-за одной резко отличающейся переменной. В данном случае гораздо рациональнее выбрать показатель медианы, так как он более устойчив к резко отличающимся значениям и лучше отражает средние данные.
Стоит отметить, что в некоторых случаях могут понадобиться показатели, которые особенно чувствительны к пограничным значениям. Пиковая нагрузка на веб-сайт должна охватывать редкие максимальные значения, которые должны быть включены в диапазон. Оценить или визуализировать робастность можно с помощью повторной выборки. Возьмите набор данных и вычислите показатель. Повторите расчеты несколько раз, заменяя набор данных; получив ряд значений показателя, составьте их распределение. Насколько это распределение отличается от того, что вы ожидали или хотели бы увидеть?
Вывод: примените разведочный анализ (например, постройте гистограмму или диаграмму рассеяния), чтобы лучше понять данные, и на его основании выберите робастные показатели.
Постарайтесь выбирать показатели, которые непосредственно измеряют интересующий вас процесс. К сожалению, не все можно измерить и оценить количественно, поэтому иногда приходится довольствоваться косвенными или приближенными показателями.
Кэти О’Нейл привела наглядный пример, как результаты тестов учеников приблизительно отражают качество обучения[95]. Чем больше расстояние между самим процессом и приближенным показателем, тем менее достоверным и полезным будет его значение. В результате вы можете начать оптимизировать приближенный показатель, что может оказаться совсем не тем, что вы действительно хотите оптимизировать.
Сьюзан Веббер рассказала о тестировании вкусов кока-колы и о выпуске на рынок нью-кок в 1980 году[96]. Компания провела маркетинговые исследования, которые показали в высшей степени положительные результаты, даже по сравнению с традиционной кока-колой. Однако когда новый продукт вывели на рынок, его продажи провалились. Почему?
Покупатели сочли напиток слишком сладким. Дело в том, что при тестировании вкуса в ходе маркетинговых исследований участники фокус-группы пробовали напиток маленькими глотками, в результате чего степень его сладости не так раздражала. Если бы они пробовали напиток «как в жизни» (сделали бы большой глоток жарким днем), то оптимизировали бы свое восприятие в соответствии с действительностью.
Вывод: везде, где возможно, оснащайте свои процессы и системы контрольно-измерительными средствами и старайтесь максимально избегать приближенных показателей. Не всегда стоит идти по пути наименьшего сопротивления и использовать данные, оказавшиеся под рукой. Сконцентрируйтесь на данных, которые вам следовало бы собрать и использовать, если они в большей степени отвечают вашим потребностям.
Ключевые показатели эффективности
Ключевые показатели эффективности (KPI) представляют собой набор значений самого высокого уровня, связанных со стратегическими целями компании. Они помогают определить и отследить направление, в котором развивается бизнес, и позволяют достигать намеченных целей. Как уже было сказано, эти показатели обеспечивают кораблю движение верным курсом.
Авинаш Кошик, ведущий мировой эксперт в области веб-аналитики, называет KPI «показателями, которые помогают понять, насколько эффективно вы действуете относительно своих целей»[97].
Он подчеркивает два краеугольных камня этого определения — показатели и цели, — так как KPI связывают их воедино. Примеры KPI: «Повысить узнаваемость бренда на 10 %», «Удвоить количество активных пользователей к концу года», «Увеличить онлайн-конверсию на 5 % во втором квартале».
Для KPI критически важны перечисленные ниже аспекты.
KPI должны быть четко определены
Не должно быть никакой двусмысленности в понимании основных показателей, к которым стремится компания. Показатель следует четко определить, у него должно быть конкретное целевое значение и обозначенный или стандартный срок (обычно конец года).
KPI должны быть измеряемыми
Ключевые показатели эффективности должны иметь числовое значение. Вам необходима возможность измерить прогресс в количественном выражении за определенный период времени. Иными словами, это должна быть иголка, которую можно передвигать с места на место, а не двоичное значение. Главный специалист США по анализу данных (US Chief Data Scientist) Ди Джей Патиль в своей книге Building Data Science Teams[98] отметил: «Как оказалось, все компании, в которых на высшем уровне развито управление на основе данных, придерживаются одного правила: если что-то нельзя измерить, это невозможно исправить».
KPI должны содержать цели
«Повысить выручку» — это плохо сформулированный ключевой показатель эффективности, так как в нем нет цели в числовом выражении. Если выручка компании повысится на 5 долл., сотрудники заявят, что задача выполнена, и прекратят прилагать усилия. И наоборот, если цель очевидно завышена и нереалистична, например «повысить выручку на 5000 %», ее никто не воспримет всерьез или сотрудники вскоре сдадутся, и будь что будет. Показатели должны быть достижимыми, но при определенных усилиях.
KPI должны быть прозрачными
По крайней мере для тех, кто отвечает за их выполнение, а лучше и для всех остальных. Сотрудники должны получать обратную связь и четко понимать, приносят ли их усилия результаты или им лучше что-то изменить в своей деятельности. Стратегические показатели и ключевые показатели эффективности в компании Warby Parker доводятся до сведения всех сотрудников и регулярно (хотя бы раз в квартал) обсуждаются со всем персоналом во время общих собраний рабочего коллектива.
KPI должны отражать цели, которых хочет добиться компания
Легко попасться в ловушку и начать отслеживать то, что легко измерить, например время ответа на телефонные звонки в центре обслуживания клиентов, когда истинная цель может заключаться в том, чтобы повысить степень удовлетворенности клиентов. Как гласит афоризм, «мы придаем важность тому, что способны измерить»[99]. Для этого могут потребоваться новые процессы сбора данных и оценки эффективности. Проводите дополнительную работу и меняйте то, что вы действительно стремитесь изменить.
Как и цели, KPI должны соответствовать критериям SMART[100] и быть:
• конкретными (Specific);
• измеримыми (Measurable);
• достижимыми (Achievable);
• ориентированными на результат (Result-oriented);
• ограниченными во времени (Time-bound).
Возможно, они должны быть даже SMARTER за счет добавления еще двух критериев: «подвергаться оценке» (Evaluated) и «подвергаться обзору/вознаграждаться» (Reviewed/Rewarded).
Бернард Марр[101] выделил 75 общих ключевых показателей эффективности[102]. Они включают такие области, как финансовая деятельность и понимание клиентов (табл. 6.1).
Таблица 6.1. Набор стандартных KPI для бизнеса по версии Бернарда Марра
Тем не менее каждая компания должна выбрать и скорректировать под себя собственный набор KPI, учитывающий область деятельности, конкретную бизнес-модель, этап жизненного цикла компании и ее особые цели и задачи. Например, стратегические показатели и KPI компании Warby Parker практически не пересекаются с перечисленными в списке Марра. Со списком все в порядке, он охватывает большинство стандартных бизнесов и их потребностей, просто он не учитывает, что каждая компания уникальна.
У компании Warby Parker серьезная социальная миссия: на каждую проданную пару очков мы отдаем пару очков тем, кто в них нуждается. Поэтому неудивительно, что наши стратегические цели и KPI связаны с благотворительной программой Do Good, потому что именно на ее дальнейшем продвижении мы хотим сконцентрироваться. Мы разрабатываем и производим собственные модели очков, так что у нас есть KPI, ориентированные на улучшение этого направления бизнеса.
Основная мысль, которую я хочу до вас донести, в том, что нет и не может быть единого готового набора KPI для всех без исключения. Для их разработки топ-менеджмент компании должен тщательно обдумать, в каком направлении она должна развиваться, а для их выполнения всему персоналу компании следует прилагать серьезные усилия на протяжении следующего года.
Система сбалансированных показателей, предложенная Р. Капланом и Д. Нортоном[103], пытается обеспечить, чтобы набор KPI давал целостную картину деятельности компании в четырех областях: финансовой, в работе с клиентами, во внутренних бизнес-процессах, а также в обучении и развитии. Они сравнили управление компанией с управлением самолетом[104]. Чтобы поднять самолет в воздух и долететь до пункта назначения, пилоту нужно одновременно контролировать запас топлива, скорость полета, координаты маршрута, внешние условия и так далее. Невозможно в одном полете сосредоточиться исключительно на уровне топлива, а в следующем полете думать только о координатах маршрута. Все эти компоненты нужно рассматривать как единую стратегию.
Если вы зайдете в кабину пилота, то увидите десятки, если не сотни, датчиков, измерительных приборов и рычагов. Однако на самом деле пилот и второй пилот в штатных ситуациях, как правило, отслеживают лишь небольшой набор самых главных показателей. (Если бы вам, как мне, довелось управлять безмоторным самолетом, вы бы довольно быстро уловили, какой минимум приборов действительно необходим: альтиметр, компас, указатель скорости полета и указатель скорости набора высоты (вариометр). Все!) Компас важен. Свет на бортовой кухне важен не настолько. Вы увидите множество сигнальных ламп на панелях управления. Конечно, пилот отреагирует, если какая-то из них загорится, но в штатном режиме он может просто о них забыть. Иными словами, в компании действительно должны быть инструменты для отслеживания сотен или тысяч операционных и диагностических показателей, но сам процесс отслеживания может быть делегирован на уровень операционной деятельности. Эти панели и показатели могут быть локализованы под отдельные бизнес-подразделения или команды, но с ключевыми показателями эффективности все по-другому: этот небольшой набор показателей должен быть понятен для всех.
Итак, сколько ключевых показателей эффективности у вас должно быть?
KPI должны охватывать все основные области бизнеса и те аспекты, которым уделяется особое стратегическое внимание в этом временном периоде, обычно в течение года. В компании может быть четыре-пять основных направлений или заинтересованных групп, которые могут, но не должны, совпадать с топ-менеджментом компании. Например, это может быть финансовое направление, за которое отвечает коммерческий директор, или стратегические технологические цели под управлением технического директора и команды его специалистов и так далее.
Роберт Шампейн[105] полагает, что по каждому из этих направлений могут быть две-пять стратегических целей, каждая из которых может быть связана с одним-тремя KPI. При этом лучше, если общее число KPI будет в более низких значениях, рассчитанных по формуле: 5 (2–5) (1–3) продуктов. Он называет максимальное их количество от 20 до 30. Один из читателей ответил ему в комментариях, что «20 — это уже много». Каплан и Нортон предлагают 16–25 показателей.
Если у вас слишком много ключевых показателей эффективности, у сотрудников компании будет рассеян фокус внимания, они будут сараться выполнять несколько задач одновременно, в результате чего их эффективность может только снизиться. Например, небольшая компания не в состоянии одновременно расширить продуктовую линейку, повысить степень удовлетворенности покупателей, увеличить выручку и выйти на международный рынок. Это слишком, сотрудники выбьются из сил и будут обречены на провал. Вместо этого стоит сконцентрироваться на менее масштабном, но более целостном наборе целей, задач и KPI, которые будут понятны всем и достижимы.
Если ключевые показатели эффективности должны соответствовать критериям SMART, то они должны быть конкретными и измеряемыми. Это означает, что в их формулировках не должно быть общих, двусмысленных или непонятных глаголов, таких как «улучшить», «повысить», а также таких существительных и прилагательных, как «лучший», «ведущий», «качество». Стейси Барр, специалист по оценке эффективности, называет такие слова «словами-хамелеонами»[106]. Вместо этого она рекомендует взять какую-нибудь неясную цель, например «трансформировать результативность наших клиентов», побеседовать с нужными людьми, понять смысл «слов-хамелеонов» и заменить их на более конкретную формулировку, например «когда наши клиенты работают вместе с нами, они способны быстрее достигнуть своих целевых показателей». После этого становится проще определить конкретные, измеримые показатели для достижения этой цели, например «сократить среднее время выполнения плана» или «повысить процент выполненных задач к указанной дате».
Ранее в качестве примера KPI я упоминал «удвоить число активных пользователей к концу года». Это тот случай, когда точные определения чрезвычайно важны.
Понятие «активный пользователь» можно трактовать довольно широко. В онлайновом игровом сообществе это определение может относиться к пользователям, которые просто зарегистрировались за последние 30 дней, или сыграли определенное количество игр, или потратили на игры определенное количество часов. Это определение нужно недвусмысленно уточнить в момент, когда устанавливаются показатели.
Итак, какие KPI можно отнести к хорошим, а какие — к плохим? Мария Микаллеф[107] приводит отличные примеры.
Вот хорошие цели для KPI.
• «Мы сократим количество недостающих контейнеров для бытовых отходов на 5 % в следующем году».
• «Мы увеличим число наших клиентов из Италии на 20 % к концу 2011 года».
В каждой из этих целей содержатся конкретные числовые показатели (при условии, что концепции «недостающих» и «клиентов» недвусмысленны или четко определены), они измеряемы и ограниченны во времени. Как насчет плохих целей?
Приведем плохие цели для KPI.
• «Мы стремимся стать лучшей транспортной компанией в регионе».
• «Мы улучшим нашу работу с жалобами клиентов».
• «Мы ответим на 75 % всех жалоб в течение пяти дней».
Давайте проанализируем эти цели.
В первом случае вопрос очевиден: что значит «лучшей»?
Во втором случае вопрос тоже напрашивается сам собой: как «улучшим»?
А вот третья цель особенно интересна. «Ответим на 75 % жалоб» — это весьма конкретно. «В течение пяти дней» — тоже ясно и с ограничением по времени. Фактически, если предположить, что эта цель достижима, то она соответствует всем пяти критериям SMART. Что же тогда не так?
Проблема в оставшихся 25 % жалоб. Как быть с ними? Как говорит Мария Микаллеф, «это плохая цель, если на обработку оставшихся 25 % жалоб уйдет три месяца». Одна из задач, которую вы должны держать в голове при разработке показателей, — то, что ваши сотрудники не должны осознанно или бессознательно пользоваться подобными «лазейками» в формулировках, чтобы формально выполнять поставленные перед ними задачи, но фактически не способствовать достижению стратегических целей компании[108]. В данном случае негативных отзывов от тех 25 % клиентов, на чьи жалобы не отреагируют в течение пяти дней, будет достаточно, чтобы уничтожить репутацию вашей компании.
В этих двух главах мы обсудили ключевые показатели эффективности, которые определяют, чего стремится достигнуть компания и на что обращать внимание для разработки качественных диагностических и операционных показателей (какие аспекты компания собирается отслеживать и оптимизировать). Кроме того, мы поговорили о видах анализа, которые можно применять при работе с этими данными. Следующий шаг в аналитической цепочке ценности заключается в «упаковке» сделанных выводов и рекомендаций, чтобы представить их коллегам, руководству и тем людям, от которых зависит принятие решений. То есть вам необходимо рассказать историю на основе этих данных. Это тема следующей главы.
Глава 7. Сторителлинг на основе данных
Когда вам удается удачно визуализировать свою мысль, собеседник моментально ее ухватывает, и диалог продолжается. Вы получаете ответную реакцию. Это повышает продуктивность. Это гораздо эффективнее, чем разговор по телефону или письмо по электронной почте. Вы сразу же доносите свою идею до многих людей.
Офер Менделевитч[109]
* * *
В предыдущих двух главах мы обсудили виды анализа, от описательного до каузального, а также вопросы разработки показателей, включая особенно важные — KPI. В этой главе мы продвинемся дальше по аналитической цепочке ценности — перейдем к обсуждению того, как «упаковывать» сделанные выводы и рекомендации и презентовать их руководству и другим заинтересованным лицам, чтобы это способствовало повышению качества дискуссии и процесса принятия решений на всех уровнях.
В этой главе приводится общий обзор процесса и целей передачи и распространения аналитических выводов в компании с управлением на основе данных: мы рассмотрим, почему и что может составлять аналитическую коммуникацию, но не будем останавливаться на том, как ее осуществлять. Я расскажу о подготовительном этапе, о чем вам стоит задуматься перед тем, как приступить к подготовке презентации или визуализации. Чтобы внести конкретику, я остановлюсь на инструменте, позволяющем подбирать графики и диаграммы, и на контрольном списке относительно визуализации данных. Надеюсь, они, а также ссылки на источники, скажут сами за себя. После этого нам останется кратко коснуться некоторых вопросов подготовки презентации, таких как общая структура и основное сообщение.
Сторителлинг
«Каждый набор, каждая база данных, каждая таблица способны рассказать целую историю», — уверен Стюарт Франкел, CEO компании Narrative Science. Работа специалиста по анализу данных заключается в том, чтобы увидеть эту историю или хотя бы историю, интересную для компании, сформулировать ее и донести до аудитории. Более того, аналитикам следует позаботиться о точности истории, которая должна быть подтверждена практикой. В противном случае люди придумают свою историю, опираясь на сомнительные данные. В книге Дэвенпорта и др. Analytics at Work (с. 138–139) приводится в качестве примера случай, когда один из руководителей больницы был уверен, что главный фактор, влияющий на удовлетворенность пациентов качеством обслуживания, — качество еды. Когда аналитики взялись проверить это утверждение, оказалось, что это был один из наименее значимых факторов в наборе из еще 30. Убеждение руководителя было очень далеко от реальности. Чем объяснялось это несоответствие? Руководитель поговорил с двумя пациентами, которые пожаловались на качество еды. Он сделал вывод на основе случайных эпизодов, в то время как выводы аналитиков строились на основе репрезентативной выборки данных и объективного статистического анализа.
Учитывая сказанное, на бытовом уровне под историей может подразумеваться эпизод из жизни, однако что я вкладываю в этот термин в нашем контексте, то есть в рамках презентации в компании с управлением на основе данных?
Взгляните на рис. 7.1. Вам ничего не кажется необычным или интересным?
Рис. 7.1. Регистрация новых пользователей из Австралии в Twitter на протяжении времени
Источник: http://socialmedia.qut.edu.au/2014/08/04/first-steps-in-exploring-the-australian-twittersphere/
Очевидно, 2009 год для Twitter напоминал аттракцион «американские горки»: беспрецедентный рост числа подписчиков и не менее грандиозное падение (при этом все-таки наблюдалась положительная динамика и рост количества пользователей). За этой одной кривой стоит насыщенная событиями история. Первый подъем (примерно в марте 2007 года) объяснялся шумихой вокруг Twitter на ежегодной конференции South by Southwest Interactive Conference, когда на сервис впервые обратили внимание и количество его пользователей сразу утроилось. Замедление роста после второго подъема (примерно в марте 2008-го) объясняется тем, что тогда Twitter начал активно вносить в черный список спамеров. В 2009 году сервис получил уже широкую известность, в апреле на пике популярности, как раз перед падением, Эштон Кутчер поспорил с телеканалом CNN, у кого из них первым будет один миллион подписчиков (Эштон выиграл буквально через полчаса), а Опра Уинфри первый раз отправила сообщение в Twitter и сделала это в прямом эфире. Аналогичная кривая, построенная на данных пользователей из Австралии, в чем-то похожая на кривую по США, но имеет свои отличия. Так, например, последний рост количества пользователей Twitter в Австралии в 2013 году совпал с проведением выборов на федеральном уровне.
Таким образом, история должна содержать основные выводы, особенности данных или присущие им закономерности, чтобы по возможности раскрывать причины происходящего, а также смотреть в будущее, делать прогнозы и формулировать рекомендации для компании. По Стивену Фью, «визуализация данных — это применение средств визуального представления для изучения, анализа и презентации количественных данных». В данной книге я рассматриваю сторителлинг как дополнительный интерпретативный слой, повествовательную структуру на вершине визуализации данных. Рис. 7.1, дополненный описательной частью, более полезен, чем просто рис. 7.1. График и описание дополняют друг друга. Требуется качественная визуализация, чтобы обнаружить закономерности в данных в ходе проведения анализа, а затем продемонстрировать их аудитории. И помимо этого требуется знание точной и достоверной истории для интерпретации данных и построения возможных прогнозов.
В идеале в данном случае можно включить информацию о переломных моментах в график и таким образом усилить историю и сделать более самодостаточной (рис. 7.2).
Рис. 7.2. Аннотированная версия рис. 7.1
Поиск истории и ее интерпретация включают использование ряда аналитических техник, в которые обычно входит разведочный анализ, то есть, условно говоря, визуализация данных с помощью таблиц и диаграмм (глава 5). Эта глава посвящена визуализации данных, но это не введение в тему: я бы не смог сделать это на должном уровне, кроме того, есть немало отличных книг специально по теме. Начинать я рекомендую с золотого стандарта: книг Эдварда Тафти Envisioning Information («Представление информации»), Visual Explanations («Визуальные объяснения») и The Visual Display of Quantitative Information (Graphics Press) («Визуальное отображение количественной информации»). Третья книга особенно хорошо поможет вам понять, как мыслит дизайнер и критик. В этой книге Тафти представил важные концепции «графического мусора» и соотношение данных и чернил (Data-to-ink ratio), то есть элементов, несущих информационную нагрузку. Обе эти концепции я объясню далее.
Если вы хотите почитать что-то более практически направленное, рекомендую книги Стивена Фью Now You See It (Analytics Press), которая в большей степени сосредоточена на визуализации данных для изучения и анализа количественных данных, а также Show Me The Numbers (Analytics Press), посвященную процессу презентации. Для ознакомления с вопросами визуализации данных в виртуальном пространстве начните с книги Скотта Мюррея Interactive Data Visualization (O’Reilly). Кроме того, эту главу не стоит рассматривать как руководство по стилю. Для этих целей настоятельно рекомендую книгу Доны Вонг The Wall Street Journal Guide to Information Graphics (W. W. Norton & Company).
Первые шаги
Прежде чем размышлять над тем, как лучше всего представить данные, информацию, результаты анализа, следует ответить на три вопроса:
• Чего вы хотите добиться?
• Кто ваша аудитория?
• Каким средством вы воспользуетесь?
Это основные факторы, которые сузят выбор типа презентации, стиля, уровня технических средств, способных донести ваше сообщение максимально эффективно. Только после того, как вы определитесь с этими тремя вопросами, можно будет перейти к более практическим аспектам — как вы собираетесь структурировать содержание и оформлять его визуально.
Какова ваша цель? Зачем вы делаете эту презентацию или отчет? Какого результата вы надеетесь достигнуть? Предположительно, эту цель следует определить еще до начала самого анализа, но у вас должно сложиться четкое понимание, зачем вы представляете эти данные или результаты анализа, к каким выводам вы пришли и что, по вашему мнению, произойдет дальше.
Например, если вы проводите только описательный анализ, его цель может состоять в том, чтобы читатели получили более ясное понимание системы, уловили взаимосвязи, величину и возможность изменений основных компонентов, то есть цель — поделиться знаниями. Если вы проводите анализ результатов А/В-тестирования, то его цель может заключаться в том, чтобы оценить, насколько эффективны разные варианты решения задачи по сравнению с контрольными показателями, а также уверенность в результатах и потенциальное увеличение выручки, подтверждающее реальность решения. В этом случае цель может быть в том, чтобы принять решение и обеспечить, чтобы новая характеристика или функция стала доступна всем пользователям. Эти два вида анализа отличаются методами проведения, преследуют разные цели и требуют разных стилей презентации.
Рассмотрим подробнее пример с результатами анализа А/В-тестирования. В этом случае специалист по анализу данных должен провести собственно анализ, прийти к выводу относительно значения и достоверности результатов и предложить свои рекомендации: надо ли внедрять эту характеристику в массовое производство. В своей презентации он должен отразить рекомендации и привести подтверждения: так мы проводили тестирование, это показатели, вызывающие интерес, вот что мы обнаружили, это небольшая неясность, с которой мы столкнулись, а вот почему мы пришли к финальному заключению.
Следующий вопрос, на который нужно ответить, касается аудитории, для которой готовится презентация. Насколько хорошо эти люди подкованы технически, умеют ли они оперировать данными? Каковы их ожидания? Каковы их уровни заинтересованности и мотивации? Насколько они заняты? В некотором смысле аналитик должен уметь добиваться своих целей вопреки аудитории. Тема презентации — это, возможно, главная задача, на которой он сосредоточен в последние дни или недели. Но для слушателей презентации это может быть лишь одним из десяти решений, которые они приняли сегодня, особенно когда речь идет о топ-менеджменте компании. У аналитика должно быть четкое понимание статистических техник, которые он применял в работе, в то время как аудитория, скорее всего, не имеет об этом представления. Аналитик поглощен цифрами, кодами, статистикой, тогда как слушателей волнует только необходимость принятия бизнес-решений и последующий эффект. При подготовке презентации аналитик должен принять во внимание все перечисленные факторы и структурировать материал так, чтобы добиться максимальной результативности.
Например, если вы понимаете, что на разговор с большим боссом вам отведут всего несколько минут, будьте лаконичны и конкретны: «Я рекомендую предпринять следующие меры, так как они позволят нам получить миллион дополнительного дохода в течение следующего года». В других случаях, например в часовой презентации для других специалистов по статистике, можно максимально углубиться в технические детали. Возможно, их заинтересуют степени свободы, доверительные интервалы, графики плотности распределения и другие аспекты.
Финансовые директора обычно чувствуют себя комфортно при работе с большими таблицами финансовых показателей (можно ли утверждать, что эта форма получения информации для них предпочтительна — уже другой вопрос). Для более широкой аудитории, например во время общего собрания, лучше облегчить информацию и представить общие выводы без технических подробностей. Решите, какой способ представления данных подходит вам больше всего, и структурируйте материал соответственно.
Наконец, определитесь со средством: будет ли это доклад в письменной форме, графическая презентация, например в PowerPoint, дашборд или инфографика.
Частично этот вопрос связан с предыдущим. Например, если вы выступаете на общем собрании, у вас есть выбор между графической презентацией или устным докладом. Для финансового директора лучше подготовить письменный отчет и включить в него необходимые таблицы и графики по тем направлениям, которые ему нужны и которые он ожидает увидеть. Для выступления перед руководителями нескольких направлений, возможно, вам понадобится подготовить презентацию в PowerPoint.
Решение относительно средства презентации в совокупности с пониманием общего уровня заинтересованности аудитории и объема времени, которое будет отводиться на презентацию, поможет определить, насколько глубокой она должна быть. Если у вас только три минуты, чтобы выступить перед топ-менеджером, то презентация в PowerPoint на 37 слайдов с кучей технических деталей точно не понадобится. Конечно, можно остановить свой выбор на презентации в PowerPoint, но тогда это будут два-три слайда. Еще один важный момент: не стоит копировать визуальную информацию из одного средства и использовать ее для другого. Например, копирование большой таблицы из письменного отчета и размещение ее на слайде в PowerPoint, который вы собрались демонстрировать на общем собрании, будет малоэффективным. Нужно подогнать каждый слайд, график или таблицу под то средство, которым вы хотите воспользоваться.
Качественно спланированный эксперимент, тщательно отобранные показатели и, самое важное, четко заданный вопрос обеспечивают наибольшую вероятность обнаружить доминирующие закономерности в данных и найти ответы на поставленные вопросы. Работа аналитика состоит в том, чтобы найти и проиллюстрировать самые очевидные и наиболее подходящие закономерности, интерпретировать их и транслировать с точки зрения влияния на бизнес. Однако это все-таки будет лишь одной интерпретацией данных из возможных. На основе этих же данных другие сотрудники могут прийти к другим заключениям. Именно поэтому эксперт в области визуализации данных Себастьян Гутьеррес сравнивает аналитика, презентующего данные с помощью визуализации, с продавцом: «Вы пытаетесь продать какую-то идею: мы должны увеличить бюджет, мы должны изменить базу данных, мы должны привлечь больше пользователей… У вас есть сообщение, которое вы стремитесь донести. Когда я представляю данные неспециалистам в этой области, то отношусь к этому как к упражнению по маркетингу».
Что вы продаете? По крайней мере, две вещи. Во-первых, если есть несколько интерпретаций, задача аналитика— выбрать и продвинуть наиболее объективную, логичную и экономичную (простую) из них, а также суметь обосновать свою позицию. Во-вторых, если аналитик затратил столько усилий на сбор данных, их обработку, анализ, возможно, построение модели и в итоге обнаружил нечто действительно важное, что способно оказать влияние на развитие бизнеса, он изо всех сил будет стремиться к тому, чтобы результаты его работы были применены на практике. Аналитик старается продать действие (что следует сделать) и результат (что получится в итоге этого действия). Мы еще вернемся к этому моменту в главе 9. Иными словами, специалист по анализу данных не пассивный транслятор данных, информации, выводов — он должен активно продавать эти идеи.
Более того, Себастьян отмечает, что, когда аналитик подходит к этому процессу с позиции маркетинга и у него есть идея, которую он должен продвинуть, это стимулирует его искать больше данных, чтобы получить более убедительную и подтвержденную фактами историю. Важно, что корпоративная культура организации должна стимулировать аналитика, чтобы он стремился оказать максимальное влияние на деятельность компании. Кен Рудин, руководитель аналитического направления в Facebook, а до этого в компании Zynga, подтверждает это примером:
Смысл аналитики в оказании влияния… В нашей компании [Zynga], если вы провели блестящее исследование и сделали потрясающие выводы, но ничего не изменилось, результативность вашей работы равна нулю.
Визуализация данных
Теперь, когда мы имеем более ясное представление о том, что такое сторителлинг, а также о роли аналитика и его мотивации, давайте обсудим некоторые технические аспекты визуализации данных. Как уже упоминалось в начале этой главы, наше обсуждение не будет полноценным руководством по этой теме. Я остановлюсь на нескольких ключевых моментах и свяжу их с общими комментариями, типичными ошибками и да, с тем, что больше всего раздражает лично меня.
Итак, предположим, что аналитик выбрал правильные метрики, правильные измерения (например, систематизировал данные по месяцам или по каналам продаж), обнаружил интересные и значимые закономерности в этих данных, Следующий шаг, который он должен предпринять, — выбрать форму презентации этих данных. В некоторых случаях это может быть таблица, но чаще всего останавливаются на диаграмме.
У аналитика большой выбор разных типов диаграмм. Подходящий тип диаграммы или визуализации зависит от типа переменных (непрерывные, дискретные, категориальные или порядковые), от того, сколько переменных или факторов требуется включить в диаграмму, и даже от значений переменных. Например, составная столбиковая диаграмма способна справиться с двумя категориями данных, но не с большим числом (рис. 7.3).
Рис. 7.3. Пример составной столбиковой диаграммы (показывающей, как пользователи инструментов бизнес-аналитики используют эти продукты) с относительно большим числом категорий (восемь). Легче всего между платформами сравнить крайнюю левую категорию, так как она выровнена по оси y. Однако интерпретировать результаты по другим категориям не так просто, поскольку они отличаются по ширине и расположению. Например, как сравнить между платформами крайнюю правую категорию?
Источник: Джон Пелтир (http://peltiertech.com/stacked-bar-chart-alternatives/)
Для сравнения: рис. 7.4 содержит те же самые данные, но их легче сравнить между платформами, хотя и за счет потери понимания суммарной доли респондентов в процентах (то есть полной ширины столбца на рис. 7.3).
Рис. 7.4. Те же самые данные, что и на рис. 7.3, представлены в виде панельной диаграммы. В этом случае гораздо проще интерпретировать сравнение между категориями.
Источник: Джон Пелтир (http://peltiertech.com/stacked-bar-chart-alternatives)
Выбор типа диаграммы — основной фактор с точки зрения способности сделать презентацию данных понятной для пользователей. Так на чем же остановить свой выбор в условиях такого разнообразия? Один из способов — сосредоточиться на одной из четырех причин, по которым мы вообще строим диаграмму.
Сравнение
Например, сравнение групп или сравнение изменений во времени.
Распределение
Необходимость показать изменчивость набора данных.
Взаимосвязи
Необходимость отразить корреляцию или взаимосвязь между переменными.
Сравнение
Необходимость показать, как распределяются данные между двумя или более категориями.
На рис. 7.5 приведены примеры разных типов диаграмм и то, как они соотносятся с выделенными нами четырьмя целями. Мы выбрали наиболее распространенные типы диаграмм, хотя существует еще множество других. Например, здесь никак не охвачены данные из социальных сетей или геопространственные данные.
Рис. 7.5. Существует много разных типов диаграмм, каждый из которых отвечает определенной задаче. Выберите тот тип, который оптимально подходит для решения вашей задачи
Источник: Эндрю Абела (http://extremepresentation.typepad.com/blog/2006/09/choosing_a_good.html) Воспроизводится с разрешения
Более полное представление типов диаграмм можно найти в виде инфографического постера Graphic Continuum[110], но, к сожалению, он слишком масштабный и детальный, и его невозможно без потери качества разместить на одной книжной странице. Кроме того, я рекомендовал бы изучить галерею визуализации D3[111]. D3 — это популярная библиотека JavaScript, которой можно воспользоваться для выполнения более интересной, интерактивной или специализированной визуализации данных.
Как вы сами видите, для работы с конкретным набором данных можно использовать разные типы диаграмм, в каждой из которых будет делаться акцент на разных характеристиках данных. Главное — пробовать разные варианты. Исследуйте «дизайнерское пространство» в поисках средств, которые помогут лучше всего рассказать вашу историю, но при этом не лишат ее достоверности и объективности (например, не усекайте ось y, чтобы исказить угол наклона в линейном графике[112]).
Выбор типа диаграммы — относительно простая задача, так как он ограничен (хотя даже это не мешает некоторым выбирать неподходящие варианты). Но это только начало. Далее приводится контрольный список тех элементов, на которые стоит обратить внимание при построении диаграммы. Мы не будем подробно разбирать каждый из указанных пунктов, так как это не входит в задачи этой книги. Скорее, это подсказка для вас, с чего можно начать. Если вы хотите получить более глубокие знания, я вновь рекомендую обратиться к тем книгам, которые я перечислял в начале главы. Многие из элементов этого контрольного списка могут показаться очевидными; тем удивительнее, сколько встречается диаграмм, построенных с нарушением одного или нескольких из этих критериев, что не может не сказаться на их эффективности.
КОНТРОЛЬНЫЙ СПИСОК ДЛЯ ВИЗУАЛИЗАЦИИ ДАННЫХ
Визуализация данных включает множество элементов, каждый из которых требует пристального внимания. Один неверный выбор, например цвета с малым контрастом, мелкий шрифт, неподходящий тип диаграммы — и все визуальное представление испорчено. Далее приводятся элементы полезного контрольного списка Стефани Эвергрин. В полной версии списка можно найти подробное описание каждого пункта.
Фокусировка сообщения
Цель создания презентации — четко донести свое сообщение до аудитории. Для этого в вашем арсенале имеется целый ряд средств: шрифты, линии сетки, ориентация страницы. Еще одно средство — выделение цветом. Один из способов сделать сообщение сфокусированным — показывать только данные, представляющие интерес. К сожалению, иногда это может привести к отрыву от контекста. Например, предположим, что, согласно графику, Япония производила 260 тераватт-час энергии в 2009 году. Этого много или мало? Я понятия не имею. Зато все сразу становится ясно, если оставить эти данные в контексте, но выделить цветом (рис. 7.6). Мы сразу же увидим показатели, касающиеся Японии, благодаря выделению названия жирным шрифтом и более светлому цвету столбца диаграммы. А благодаря дополнительным данным относительно других стран можно интерпретировать данные о Японии: ее уровень производства электроэнергии был высоким, но составил 1/3 от уровня производства США.
Рис. 7.6. Пример эффективного использования выделения цветом. При представлении данных о Японии название страны выделено жирным шрифтом, а столбец диаграммы обозначен более светлым цветом. Это позволяет сфокусироваться на данных относительно Японии, которые, тем не менее, остаются в контексте
Источник: http://theeconomist.tumblr.com/post/3880075172/daily-chart-the-worlds-largest-nuclear-energy
Это удачный пример, как при помощи цветового выделения можно усилить сообщение. Рассмотрим противоположный случай. Следует избегать того, что Стефани Эвергрин назвала «синдром Марты Стюарт»[113], то есть чрезмерного украшательства диаграммы. Все должно быть просто. Исключите «графический мусор» и излишества и сконцентрируйтесь на данных и сообщении.
Термин «графический мусор» ввел в употребление Эдвард Тафти для обозначения элементов, отвлекающих внимание. «Графический мусор» — все визуальные элементы диаграмм и графиков, в которых нет необходимости для понимания представленной информации или которые отвлекают от нее. Минималистский подход Тафти отличается категоричностью. Я предпочитаю более умеренное и прагматичное определение Роберта Косары — «любой элемент диаграммы, который не способствует прояснению сообщения»[114]. Косара признает, что в некоторых случаях может быть необходимо внести дополнительные элементы в диаграмму для выделения специфических компонентов, чтобы усилить основное сообщение или историю.
На этом этапе во многих книгах по визуализации данных (в том числе и Эдварда Тафти) для иллюстрации «графического мусора»[115] приведены диаграммы и графики, взятые из USA Today. Я не буду этого делать, а остановлюсь на новом золотом стандарте — слайды программы PRISM Агентства национальной безопасности США (рис. 7.7).
Рис. 7.7. Слайд программы PRISM АНБ США, переполненный «графическим мусором»
Источник: https://www.theguardian.com/world/interactive/2013/nov/01/prism-slides-nsa-document
На рис. 7.7 представлена хронологическая шкала, когда разные технологические компании присоединились к программе АНБ по массовому негласному сбору информации. Это основное сообщение, но из-за множества дополнительных графических элементов внимание от него отвлечено. В верхней части слайда беспорядочно размещены 11 логотипов. Они соотносятся с желтыми овалами, но не в пропорции 1: 1 (желтых овалов всего девять). Они только отвлекают внимание пользователя. Кроме того, на слайде размещены логотип самой программы и подразделения АНБ. Более того, на нем есть еще и зеленая стрелка. Какова ее роль? Почему данные расположены по возрастающей? Это все «графический мусор».
Подобные украшательства отвлекают внимание от основного сообщения по двум причинам:
• пользователь тратит время на рассматривание и обдумывание других элементов;
• пользователю сложно определиться, на чем сосредоточить внимание.
На рис. 7.8 приведен один из возможных вариантов исправления этого слайда. Автор слайда — Эмилэнд де Куббер. На слайде условно выделены два важных блока данных: компании и время их присоединения к программе. Девять компаний — девять логотипов.
Рис. 7.8. Вариант слайда, предложенный Эмилэндом де Куббером
Источник: https://www.slideshare.net/EmilandDC/dear-nsa-let-me-take-care-ou
Можно почти моментально уловить общую картину и посчитать количество компаний за каждый из указанных периодов времени (1, 1, 3, 1, 2, 1). А бросив второй взгляд на слайд, можно сосредоточиться на логотипах и понять, о каких именно компаниях идет речь. Этот вариант не идеален, но визуально информация представлена на нем более эффективно, чем на оригинальном слайде.
Организация данных
То, как будет организовано представление информации на диаграмме, зависит от выбора диаграммы, и наоборот. В рамках ограничений, которые накладывает выбор диаграммы, по-прежнему остается важным структурный выбор, например, как расположить столбцы диаграммы — горизонтально или вертикально. Самое удивительное, что даже на этом уровне есть небольшие вариации в том, как можно представить данные, так что это существенно повлияет на сообщение.
На рис. 7.9 показан среднегодовой размер оплаты труда госслужащих в Великобритании по тарифным разрядам и с делением по гендерному признаку.
Рис. 7.9. Среднегодовая заработная плата (в тыс. фунтов стерлингов) госслужащих в Великобритании по тарифным разрядам (более низкая цифра разряда означает более высокую должность) и с делением по гендерному признаку
Источник: http://news.bbc.co.uk/2/hi/business/8044720.stm
С диаграммой все в порядке. У нее понятное название и обозначения осей. По оси х представлены тарифные разряды по возрастающей слева направо, как и следовало ожидать, учитывая, что в западной традиции принято направление чтения слева направо (хотя несколько вводит в заблуждение, что номера тарифных разрядов, наоборот, уменьшаются в порядке значимости). Ось y тоже нареканий не вызывает. Нет усечения по вертикальной оси. Интервал в 25 тыс. фунтов стерлингов кажется оправданным. При составлении диаграммы был богатый выбор цветовой палитры.
В итоге выбрали основной голубой цвет (который обычно ассоциируется с мужским полом) и дополнительный оранжевый для обозначения женского пола. Выбор вполне обоснован. В этой диаграмме нет грубых ошибок.
А теперь посмотрите, что получится, если во всех тарифных разрядах поменять местами столбцы, обозначающие пол (рис. 7.10).
Рис. 7.10. Та же самая диаграмма, что и на рис. 7.9, за исключением того, что во всех тарифных разрядах поменяли местами столбцы, обозначающие пол. Вам не кажется, что неравенство в заработной плате по гендерному признаку бросается в глаза сильнее?
Удивительная разница. Те же самые данные, те же самые оси, те же самые интервалы и цветовая схема. Всего одно небольшое изменение кардинальным образом меняет восприятие неравенства в оплате труда у мужчин и женщин[116]. Основное сообщение, о неравенстве оплаты труда, становится гораздо более наглядным. Первая диаграмма построена правильно, просто вторая — более наглядная.
Думаю, из этого примера очевидно, что каждая диаграмма, которую вы строите, требует индивидуального подхода. К тому же необходимо развивать в себе критическое восприятие. Этот навык приходит с практикой, в процессе работы со случаями, подобными этому. Поэтому всем специалистам по работе с данными я настоятельно рекомендую ознакомиться с книгами, которые я упоминал в начале этой главы, изучить метод trifecta checkup Кайзера Фанга — метод проверки диаграмм на наличие «графического мусора»[117], а также посещать семинары по визуализации данных и, самое главное, практиковаться. Изучайте диаграммы из Wall Street Journal, New York Times и The Economist — все они задают очень высокую планку качества. Что делает их такими эффективными и где у них бывают проколы? (Да, такое тоже случается.) Сравните диаграммы в /r/dataisbeautiful/[118] и r/dataisugly[119]. Почему первые такие ясные, а вторые такие бестолковые? Спросите себя, что бы вы сделали иначе.
Подача данных
В этом разделе мы поговорим о способах подачи сделанных выводов. Во-первых, кратко остановимся на инфографике, которая в последнее время пользуется особенной популярностью у специалистов по маркетингу. Во-вторых, изучим гораздо более важную тему дашбордов. Как уже говорилось в начале книги, многие компании считают, что у них развито управление на основе данных, просто потому что их сотрудники пользуются множеством дашбордов. Дашборды и отчеты о состоянии работ, несомненно, стали полезным и одним из наиболее распространенных инструментов. Мы рассмотрим несколько типов дашбордов и обсудим их пользу (или отсутствие таковой) для процесса принятия решений.
В контексте управления на основе данных я не большой поклонник инфографики: сегодня инфографика превратилась в «веселые картинки», приправленные парой фактов, которые обычно создают дизайнеры, а не аналитики. По моему мнению, у подобной инфографики слишком низкое соотношение данных и чернил (data-to-ink ratio), как его определил Эдвард Тафти. Фактически в большинстве случаев инфографика страдает от «графического мусора» и от недостатка данных. Например, на рис. 7.11 в забавной и визуально привлекательной форме представлен размер мозга у животных с разной массой тела.
Рис. 7.11. Инфографика Big Thinkers из книги Роджерса и Блечмана (2014) Information Graphics: Animal Kingdom. Big Picture Press
При этом более лаконичной и эффективной формой для представления этих данных могла бы стать столбиковая диаграмма или таблица:
На самом деле интересно здесь другое — отношение массы мозга к общей массе тела. Диаграмма, отражающая это соотношение, содержит одно из удивительнейших открытий сравнительной биологии — закон масштаба. На рис. 7.12 показано, что масса мозга относительно общей массы тела уменьшается с увеличением массы тела[120].
Рис. 7.12. Соотношение массы мозга и общей массы тела. (Обратите внимание: обе оси логарифмические, но интервал по оси х составляет 100х, а интервал по оси y — только 10х).
Источник: Dongen P. A. M. 1998. Brain Size in Vertebrates. Из книги The Central Nervous System of Vertebrates, Vol 3. Ed. by R. Nieuwenhuys et al., Springer
Я намеренно выбрал такой пример для иллюстрации своей мысли. Это инфографика из книги для детей, поэтому ее задача — быть увлекательной, информативной и запоминающейся. Она отлично с этим справилась. Однако когда речь заходит о компании с управлением на основе данных, такая инфографика будет бесполезна для внутреннего использования и для процесса принятия решений. Я не отрицаю, что в некоторых случаях выбор инфографики может оказаться оправданным. Недавно моя команда представила в виде инфографики наши результаты за год. Мы показывали ее на общем собрании сотрудников. Аудитория была разнообразной и преимущественно не технической, а наша цель состояла в том, чтобы быстро пройтись по наиболее важным событиям года. Так что в этой ситуации формат инфографики был уместен. Также уместен он может быть для внешней коммуникации с широкой публикой.
Интересно, что, согласно результатам последних исследований, «графический мусор», пиктограммы, цвет и контраст делают диаграммы запоминающимися[121]. И всеми этими элементами изобилует инфографика. Тем не менее еще раз повторю свою основную мысль: цель визуализации данных — стимулировать коммуникацию, ведущую к конкретным действиям. Руководителям требуется информация высокого качества, чтобы они могли не только запомнить основную мысль, но и оценить ее и убедиться, что решение, которое они собираются принять, правильное.
Пользователь должен быстро и без усилий увидеть те центральные пункты, которые отражают представленные данные, а «графический мусор» этому препятствует.
Многие компании ошибочно измеряют степень управления на основе данных количеством производимых ими отчетов и числом дашбордов, которыми они пользуются. Дашборды очень полезны и могут поддержать ряд видов деятельности, например обеспечить интерфейс для сбора данных, составления специализированных отчетов, оповещений, а также отобразить в удобном виде прогнозы и прогнозные модели. Дашборды можно условно разбить на три категории:
• управленческие или стратегические;
• аналитические;
• операционные.
Стратегические дашборды (рис. 7.13) обеспечивают общий обзор деятельности компании и, как правило, концентрируются на системе показателей (например, KPI и их цели). Дашборд должен просто и быстро помочь увидеть, достигает ли компания поставленных целей и есть ли у руководства поводы для беспокойства. Иными словами, она должна держать руку на пульсе компании и показывать обзорную картинку с высоты 15 км. В основном стратегическими дашбордами пользуется высшее руководство компании, но в компании с управлением на основе данных доступ к этим инструментам есть у более широкой аудитории.
Рис. 7.13. Дашборд для топ-менеджмента компании на платформе QlikView (http://www.qlik.com/us/) показывает KPI по продажам в региональном разрезе
Аналитические дашборды (рис. 7.14) отражают основные тенденции развития и показатели в рамках одного подразделения компании или направления деятельности, например цепочку продаж, маркетинг или цепочку поставок. Обычно они имеют интерактивный характер и дают пользователю возможность тщательного изучения необычного тренда или резко отличающихся показателей, а также позволяют находить данные.
Рис. 7.14. Пример аналитического дашборда о посетителях сайта от Google Analytics
В основном аналитические дашборды используют в своей работе аналитики и руководители подразделений.
Наконец, операционные дашборды (рис. 7.15) дают подробное представление об отдельных аспектах ведения бизнеса, таких как, например, объем продаж в режиме реального времени, интернет-трафик, практические случаи при работе с клиентами или время ожидания, когда вы пытаетесь дозвониться клиенту. Обычно они используются для оповещения, а также в работе сотрудников, которые могут предпринять немедленные действия, например подключить дополнительные серверы, переключить коллег с выполнения одной задачи на другую, чтобы сократить количество необработанных заказов.
Рис. 7.15. Пример операционного дашборда. Он также сформирован при помощи Google Analytics, но представляет информацию более детально, чем на рис. 7.14. Здесь отражается активность посетителей сайта почти в режиме реального времени: откуда они пришли, на какие страницы направляются, общее число пользователей
Источник: http://www.blog.narensportal.com/2011/12/google-analytics-real-time.html
С учетом перечисленных типов дашборды должны использоваться целевым образом. Необходимо четкое понимание, кто ими пользуется и какая информация требуется. Как и в предыдущем разделе, здесь применяется принцип KISS (Keep it simple, Stupid! — Чем проще, тем лучше!)[122]: каждая диаграмма и каждый показатель, которые появляются в дашборде, должны быть обоснованы. Иными словами, не поддавайтесь соблазну добавить туда как можно больше всего. Если дашборд будет перенасыщен данными, интерпретировать эти данные станет сложнее, и он будет менее эффективным. Лучше меньше, да лучше.
Ди Джей Патиль и Хилари Мейсон полагают, что имеет смысл использовать несколько дашбордов, отражающих данные в одной области, но для разных категорий пользователей и разных временных шкал[123]. Например, в компании One Kings Lane сотрудники службы по работе с клиентами, отвечая на телефонные звонки, могут наблюдать за данными на операционном дашборде, который расположен на настенном мониторе и отражает основные показатели, например число вызовов в режиме реального времени, время ответа и количество решенных проблем клиента. Их руководитель имеет доступ к более детальному аналитическому дашборду, в котором он может систематизировать данные по группе, отдельному заказчику и типу заказа. В дополнение к этому показатели более высокого уровня включены в дашборд для топ-менеджмента, и руководители могут наблюдать за ними в течение дня. В каждом из этих случаев дашборд отвечает целям и задачам тех людей, которые им пользуются.
В контексте этой книги полезно проанализировать, действительно ли дашборды используются для процесса принятия решений. Как уже упоминалось, операционные дашборды отражают изменения (почти) в режиме реального времени и часто настроены таким образом, чтобы оповещать конечных пользователей о ситуациях, в которых они могут предпринять немедленные действия. Например, если интенсивность телефонных звонков, поступающих в кол-центр компании, увеличивается, руководитель может перенаправить ресурсы из других подразделений, чтобы справиться с наплывом. При этом аналитические и стратегические дашборды практически никогда не бывают единственным источником информации при принятии важных бизнес-решений. Ниже приведены выводы одного из недавних отчетов[124].
Довольно редко один отчет или дашборд, содержащие аналитическую информацию, служат основой для принятия важного решения. Гораздо чаще пользователи задаются вопросом: почему? Почему в северо-восточном регионе продажи упали на 30 %? Почему розничные продажи продукта взлетели в IV квартале? С помощью интерактивных возможностей проведения анализа, которыми располагают опытные пользователи инструментов бизнес-аналитики, можно вовремя задавать эти важные вопросы и так же своевременно получать на них ответы.
Подробнее о процессе принятия решений мы поговорим в главе 9.
Возможно, дашборд бесполезен сам по себе, но он точно будет таковым, если его никто не использует (хотя он может быть бесполезен, и если его используют, но при этом не происходит никаких изменений). В интервью с Кевином Роузом в 2001 году Джек Дорси, сооснователь Twitter и CEO компании Square, высказал интересную мысль:
У нас в Square есть дашборд и есть показатель «сколько раз сотрудники взглянули на эту панель, чтобы узнать, как обстоят дела в компании». Это говорит о том, насколько сотрудников волнует, как дела у компании[125].
Конечно, компания с управлением на основе данных может пользоваться не только дашбордами. Если отчеты отправляются заинтересованным лицам с сервера, можно настроить показатель, отражающий «уровень открытия» сообщений получателями. Авинаш Кошик идет еще дальше и предлагает «отключать ежеквартально все автоматические отчеты в случайный день/неделю/месяц, чтобы оценить их использование/ценность»[126].