Управление на основе данных. Как интерпретировать цифры и принимать качественные решения в бизнесе Филлипс Тим
Введение
В 2000 году прибыль компании Google за первый полный год ее деятельности составила $19,1 млн. В 2001 году, за второй полный год деятельности компании, эта цифра допрыгнула до $86,4 млн. Если компании Google, работающей в области данных, удалось добиться роста прибыли на 352 %, получится и у вас при условии, что вы знаете, как использовать данные, которыми обладаете и которые можете сгенерировать.
Вероятно, 352 % – это несколько амбициозная цель, по крайней мере для начала. Однако смысл в том, что сегодня неспециалисты имеют практическую возможность, используя основные данные и статистику, узнать гораздо больше о собственном бизнесе, рынках и потребителях, чем было возможно всего несколько лет назад. Компания Google построила на этом бизнес. Она непрерывно анализирует, что делает, вносит изменения, экспериментирует, тестирует продукты и, что самое важное, учится на том, что говорят ей данные.
У Google есть преимущество. Компания в основном занимается данными. В ней работают многие лучшие умы планеты. А если ты сотрудник Google, попал в тупик и тебе понадобилась техническая поддержка, долго ждать ее не придется.
Тем не менее каждый из нас способен на большее. Мы можем осознать ограничения, связанные с тем, что говорит нам интуиция. Сегодня мы способны узнать больше о своем бизнесе, лучше анализировать потенциальные риски и выигрыш от наших решений. Мы в состоянии отвечать на навязчивые вопросы, на которые ни у кого нет ответа. Мы можем научиться скептически относиться к данным, которыми оперируют другие, и таким образом избежать глупых ошибок. Мы можем стать более эффективными руководителями и при этом приходить домой вовремя, а не когда дети уже давно спят.
Это зависит от ваших целей. Вот несколько идей.
Возможно, вы открыли эту книгу с грустью в душе. Всю свою сознательную жизнь вы стараетесь избегать цифр и говорите всем, что вы – один из тех людей, у которых нет «математического гена». Хорошая новость в том, что ваш генетический набор никоим образом не помешает вам понять то, что написано в этой книге. Ученые-экономисты Майлс Кимбалл и Ной Смит в статье, опубликованной в журнале Quartz в 2013 году, указывают на то, что одни лишь разговоры о «математическом гене» способны разделить изучающих математику на две группы. Дети, у которых с самого начала возникают трудности с пониманием математики, начинают считать, что им это «не дано», и вскоре перестают прилагать усилия совсем. А ученики с хорошей успеваемостью верят в то, что это у них «от природы», и начинают стараться еще больше. Но знаете что: нет ни одного научного исследования, в ходе которого ученые нашли бы ген, отвечающий за математические способности. Это исключительно социальный эффект, основанный на раннем опыте обучения и соответствии учебной программе. Вы способны понять все, что изложено в этой книге. Не торопитесь. Дышите глубже.
Да. Именно так и будет. Вы неожиданно попали в команду людей, которые умеют с этим работать, а вы просто смотрите на этот объем информации и пытаетесь понять, что они имеют в виду. Сосредоточьтесь на разделе книги, посвященном основам обращения с данными: это 90 % (примерная догадка) того, что от вас потребуется. Пусть в случае необходимости книга будет у вас под рукой.
Тем лучше для вас: одна из причин, почему мы принимаем неправильные решения или не принимаем правильные, в недостатке достоверной информации. Самое важное – знать, в какой точке вы сейчас находитесь (часть 3), при этом не меньшее значение имеет способность использовать информацию для построения прогнозов (часть 4). И, разумеется, эффективные навыки принятия решений должны быть составляющей ваших методов управления, этому посвящена часть 5.
Вы не одиноки. Понимание данных обеспечивает ясность и четкость изложения мыслей. Часть 2, часть 5 и часть 6 вам в помощь.
Комик Стюарт Ли[1] рассказал однажды о водителе такси, который на все его доводы по этому поводу саркастически бросил: «Ой, да ладно, все что угодно можно доказать фактами». В 2013 году компания Edelman, работающая в сфере PR, провела опрос 31 000 человек в 26 странах на тему, доверяют ли они тому, что говорят их руководители. Оказалось, что своим боссам верят только 18 % респондентов (могло быть и хуже, политикам доверяют только 13 % опрошенных). Это грустная ситуация, и совсем не обязательно, чтобы так было. Давайте попробуем ее исправить, действуя сразу по двум фронтам. Во-первых, научимся быть более убедительными, используя цифры, чтобы информировать людей и принимать решения (часть 5 и часть 6). Во-вторых, научимся распознавать, когда другие прикрываются цифрами, чтобы ввести вас в заблуждение, – об этом читайте в части 7.
В последние годы невероятную популярность обрела тема «больших данных» (big data). Нам обещали, что эта концепция произведет революцию в жизни и работе. Но многие люди не способны справиться даже с малым объемом данных. Мы продолжаем принимать решения на уровне интуиции, даже когда она нас подводит (в части 6 и части 7 вы узнаете, почему не всегда следует доверять шестому чувству). Если вы хотите добиться роста на 352 %, или 35,2 %, или 3,52 % и при этом ваши конкуренты в ведении бизнеса опираются на данные, а вы продолжаете играть в «угадайку», ваши шансы на успех ничтожно малы (помните, догадки ваших конкурентов, скорее всего, ничуть не хуже ваших). Если вы не в состоянии принимать информированные решения и считаете, что анализ данных – это не для вас, вы полагаетесь на удачу, а ваш бизнес зависит от каприза фортуны. Так что это еще одна личная причина прочесть эту книгу для повышения грамотности в обращении с данными. В будущем этот навык станет ключевым для человека, таким как чтение и письмо. Умение обращаться с данными будет означать, что вы останетесь востребованным специалистом.
Часть 1
Начинаем работать с данными
1. Что такое датафикация?
Это уродливое слово, но прекрасная идея: когда столь многое из того, чем мы занимаемся, способно обеспечить нас информацией, можно узнать даже гораздо больше, чем требуется.
Само это словечко вошло в употребление относительно недавно, а вот понятию, которое оно обозначает, фактически уже несколько десятилетий. Эта концепция начала формироваться, когда гики[2] поколения наших родителей осознали, что можно систематизировать огромное количество информации о мире в формате данных, если только найти способ, как это сделать. Задача по датафикации осложнялась проблемой измерения: в нецифровых системах информацию требуется перевести в числовой формат. В цифровых данные уже присутствуют.
Это полезно, потому что, как уже было сказано, невозможно управлять тем, что не поддается измерению. Датафикация – это способ внедрить принцип измерения в вашу работу. Это основа того, чем мы будем заниматься в дальнейшем по мере чтения этой книги.
Позвольте привести пример: если бы 30 лет назад вы вдруг захотели узнать, сколько писем приходит в вашу компанию, вам пришлось бы поручить одному из сотрудников скучную и долгую работу по подсчету всей входящей корреспонденции. Если бы вы захотели выяснить, какой объем этой корреспонденции адресован вам лично, сотруднику пришлось бы отсортировывать все адресованные вам письма и ежедневно подсчитывать их количество. А если бы при этом вас заинтересовало, получаете ли вы больше писем, чем ваши коллеги, то сотруднику пришлось бы на протяжении нескольких недель заниматься сортировкой и подсчетом корреспонденции, после этого составить отчет, сделать фотокопию и принести ее вам.
Затем, если у вас произошли какие-то изменения (например, вы делегировали работу коллеге), этому несчастному, сортирующему корреспонденцию, пришлось бы на протяжении еще нескольких недель повторять эту скучную работу, подготовить еще один отчет, найти первый отчет в каталоге, скрепить их вместе и, возможно, даже постараться сформировать небольшую статистику… Почему это должно вас волновать?
Потому что вы нанимаете кого-то для выполнения этой работы, а время этого сотрудника имеет стоимость (хотя бы потому, что когда он считает письма, то не делает что-то другое). Множество полезных данных никогда не были собраны. Хуже того, сбор некоторых занимал столько времени, что к моменту его завершения эта информация уже устаревала или оказывалась ненужной. Это было все равно что пытаться управлять лодкой, ориентируясь по волнам, которые она оставляет за собой.
Мир изменился, но многие (фактически большинство из нас) не пытаются идти в ногу со временем. Например, в Великобритании в органах местного самоуправления по-прежнему перепечатывают множество документов, в результате чего, согласно результатам исследования, проведенного компанией – поставщиком программного обеспечения NDL, впустую тратятся почти два миллиона рабочих часов в год. Это происходит, потому что большой объем информации по-прежнему остается на бумажных носителях, которые пылятся в шкафах для хранения документов или пересылаются из компании в компанию и постоянно нуждаются в перепечатке.
При таком способе копирования информации возникают ошибки. А для экономии времени перепечатывается только часть документа, так что многие данные просто теряются. Шкафы – это братские могилы писем. Никто и никогда не читает то, что в них находится.
В Великобритании на самом деле все еще не так плохо, но, если оценить эту ситуацию в масштабах всего мира, когда речь идет и о бизнесе и госуправлении, можно понять, сколько информации больше никто и никогда не узнает. Она потеряна навсегда. У вас наверняка какая-то информация хранится в таком виде, и, вероятно, что-то из нее вам могло бы пригодиться. Вот только как вы решите, что вам нужно знать, и как получите информацию, которая вам требуется?
• Шаг 1. Проведите аудит данных. Составьте список всех своих бизнес-функций и решений, которые вы принимаете. Процесс может оказаться длительным и скучным, но вам не придется заниматься этим часто. Один из вариантов, как можно справиться с этой работой, – это облечь свои бизнес-функции в список проблем или задач, требующих решения. Затем перечислите данные, которыми вы в идеале должны располагать для качественного решения этих задач.
• Шаг 2. Классифицируйте данные. Некоторые из них у вас уже есть, и вы знаете, где они. Другие тоже имеются, но вы не знаете, где они. Некоторыми данными вы не располагаете, но можете их собрать. И наконец, информация из той категории, которую вы не знаете и не можете получить (например, подробный отчет по продажам вашего конкурента).
• Шаг 3. Расставьте приоритеты и выделите данные, которые вам нужны. Не все из них одинаково полезны. Некоторой информацией просто приятно обладать, а некоторая составляет основу роста вашего бизнеса. Очевидно, приоритетом станет сбор важной информации, которой у вас нет, но которую можно найти. Проработайте весь список. Скорее всего, вам так и не удастся дойти до конца, так как по мере работы над списком ваши приоритеты, вероятно, будут меняться.
• Шаг 4. Выстройте способы получения данных. Цель датафикации бизнеса не в том, чтобы прекратить делать реальную работу, потому что вы слишком заняты сбором информации, как делать работу. Некоторые процессы можно организовать довольно просто: например, установить бесплатную программу по веб-аналитике для отслеживания статистики по вашим веб-страницам или настроить журналы безопасности. Некоторые процессы осуществляются в полуавтоматическом режиме, например, иногда может быть эффективным, если кто-то из сотрудников готовит небольшой еженедельный отчет. Простой способ датафикации бизнеса – перестать работать с банком на бумажных носителях. Синхронизируйте бухгалтерское ПО с онлайн-системой своего банка, и по крайней мере с декларациями по НДС дело у вас пойдет быстрее и с меньшим числом ошибок.
• Шаг 5. Определитесь с местом хранения данных. Часто этому не уделяют должного внимания. Безопасный обмен данными не менее важен, чем возможность найти информацию. Некоторые компании спотыкаются на этом заключительном шаге. Согласно данным компании Harris Interactive[3], 92 % людей по старинке продолжают отсылать информацию в формате вложения в письмах электронной почты. Это значительно повышает вероятность отправить не тот документ, потерять письмо в большом количестве входящей корреспонденции или допустить утечку информации, если случайно забыть телефон в такси. Более надежный вариант – пользоваться безопасными способами обмена данными, например DropBox или Google Drive, или использовать облачное приложение для хранения данных, чтобы у вас был один источник информации.
Далее в этой части мы рассмотрим некоторые данные, которые относительно просто получить. У вас могут быть разные потребности. Тем не менее, если вам требуется вдохновение, подойдите к шкафу для хранения документов или набору лотков для входящей корреспонденции, которые находятся к вам ближе всего, найдите какие-нибудь данные и подумайте, как получить то же самое в цифровом виде.
2. Учимся считать
Можно многое узнать, просто анализируя статистику по вашей компании.
Хорошая новость: практически все, чем мы сегодня занимаемся, можно посчитать, будь то деятельность или ее результаты.
Умение считать – первый шаг к экономии средств. Простой пример: сколько вы тратите на программное обеспечение? Компания Cap Gemini[4] провела опрос среди ИТ-директоров, сколько денег в их организациях тратится на закупку и установку ПО. Только 37 % респондентов были уверены, что практически все установленное в компании ПО необходимо для ведения бизнеса. Три четверти респондентов считали, что 20 % приложений дублируют функции друг друга, а 57 % признались, что пятую часть всего установленного в компании ПО пора снести с компьютеров.
Есть программы, которые могут составить список всего ПО, используемого в вашем бизнесе. Проанализируйте, сколько вы тратите на приобретение лицензий, и вам будет не так уж сложно сэкономить, избавившись от лишнего.
На основании этого упражнения можно сделать два вывода. Первый: для этого не обязательно быть экспертом в области статистики. Нужно просто проанализировать, что вы имеете, и посчитать, во сколько вам это обходится. Процесс анализа может занять до нескольких часов, но это время с лихвой окупится, если впоследствии вы будете тратить меньше денег на поддержку меньшего количества программного обеспечения. Второй: цифры не принимают решения за вас, хотя и становятся основой для принятия решений. Вам по-прежнему нужно тщательно взвешивать все плюсы и минусы, просто теперь вы точно знаете, в чем они заключаются.
Представьте, что у вас три программы для чтения электронной почты. На первый взгляд покупка всех трех будет пустой тратой денег. Однако если ваши сотрудники с трудом адаптируются к изменениям и у них есть собственный арсенал эффективных методов работы, так как они хорошо изучили свое ПО (или, например, используют мобильные приложения), тогда ваша экономия может оказаться неоправданной. Измерить это сложнее, но можно потенциально попытаться оценить плюсы и минусы в денежном эквиваленте. Все зависит от конкретных обстоятельств, так что нет одного правильного решения, как поступить.
Многие никогда не задавались вопросом, какие страницы на вашем сайте наиболее посещаемые, хотя Google Analytics (или другие инструменты, которые, возможно, имеются в вашем распоряжении) можно использовать бесплатно. При помощи этого инструмента можно узнать, какие разделы вашего сайта никогда не просматривают, какие продукты ищут посетители странички или с каких других ресурсов к вам переходят пользователи. Такой сбор информации может оказаться весьма полезным, притом что он редко занимает больше часа времени. Возможно, проблема в том, что мы называем это «аналитика», а это звучит гораздо серьезнее и сложнее, чем «умение считать». На самом деле это не сложнее.
После того как вы сами проделали это один раз, делегируйте задачу регулярного сбора статистической информации кому-нибудь из сотрудников, а принятие решений синхронизируйте с получением данных этих отчетов. Например, вы должны ежеквартально получать отчет по количеству посетителей разных страниц сайта за день до встречи с разработчиком сайта. Или раз в год получать отчет по лицензиям на ПО за месяц до даты их продления.
Еще одним богатым источником информации становится управленческий учет. К сожалению, согласно данным Сертифицированного института специалистов по управленческому учету (CIMA) и Университета Лафборо, 45 % компаний малого и среднего бизнеса не ведут регулярной управленческой отчетности, то есть не фиксируют, сколько они тратят, зарабатывают и как меняется эта динамика по сравнению с прошлым годом. Компания SKS, заказавшая проведение этого опроса, указывает на то, что «без этого организации остается полагаться лишь на интуицию и банковский баланс при принятии важных решений».
У SKS своя заинтересованность, так как она работает в сфере управленческого учета. Можно назвать как минимум две очевидные причины, почему компании малого бизнеса не готовят управленческую отчетность. У них нет на это времени, и/или им сложно найти информацию. При этом даже базовое облачное ПО для бухгалтерского учета, такое как Freshbooks или Xero, сделает это за вас благодаря синхронизации с банковскими счетами и автоматически подготовит нужные отчеты. В этом дар датафикации: если вы хотите узнать, попадаете ли в свою целевую аудиторию, продали ли вы онлайн больше, чем в прошлом году, или действительно ли львиную долю прибыли вам приносят лишь несколько продуктов, все уже давно посчитано для вас.
Как внедрить этот принцип в активное использование? Самый простой способ – проводить регулярные совещания, посвященные тем аспектам, которые вы анализируете, и назначить ответственного сотрудника, чтобы на каждое совещание он готовил короткую презентацию с актуальными данными. Если темами совещания будут простые конкретные вопросы (например, «На что мы тратим больше всего денег?» или «На что чаще всего жалуются покупатели?») и они будут короткими – несколько цифр, быстрое обсуждение и пара задач, которые нужно выполнить, – тогда эти рабочие встречи не станут тяжким бременем для всех.
3. Время – деньги
В ведении бизнеса чрезвычайно полезным может оказаться анализ того, сколько времени занимает какая-то деятельность и сколько оно стоит (если, конечно, сам анализ не требует значительных временных затрат).
Есть вполне конкретные раздражители на работе, с которыми мы сталкиваемся ежедневно, но никогда не пытаемся от них избавиться – частично по той причине, что мы не считаем, сколько времени они у нас отнимают. Компания Atlassian[5] подготовила инфографику на тему того, как мы проводим время на работе, с оптимистичным названием: «Вы теряете кучу времени на работе». (Ссылка на эту инфографику приведена в разделе дополнительных ресурсов. Обратите внимание, там нет отдельного пункта для «времени, потраченного на просмотр инфографики».) Основной вывод авторов: в течение дня на продуктивную работу тратится 60 % или меньше всего рабочего времени. 80 % причин, по которым прерывалась деятельность, были абсолютно незначительными, 47 % респондентов считают работу самой напрасной тратой времени, 39 % опрошенных сообщили, что засыпали на рабочих встречах.
Если вы когда-нибудь дремали на совещаниях, кажется, эта инфографика объяснит вам кое-что о вашей жизни. (Один из моих коллег действительно задремал на совещании, которое проходило в офисе другой компании. Он проснулся, когда услышал обращенные к нему слова собеседника, к которому он приехал на встречу: «Очевидно, вы очень устали…») Вы даже можете переслать эту инфографику коллегам со словами «С этим надо что-то делать» или с твердым намерением изменить что-то в том, как вы работаете. Но все мы знаем, что это вряд ли к чему-то приведет. Вам нужно датафицировать то, как вы распределяете свое время.
Кому бы не хотелось работать меньше, получая такой же результат или даже лучше? А почему бы не оценить вашу собственную продуктивность и продуктивность окружающих вас людей? Вот если бы был для этого какой-то специальный инструмент! Разумеется, такой инструмент есть. Это ваш телефон. И еще два предмета, которые вам пригодятся: бумага и ручка.
Для начала запишите и подсчитайте, сколько времени вы проводите на рабочих встречах, в дороге, разговаривая по телефону, готовя презентации. Подсчитать время можно при помощи простого приложения, например Toggl – оно напоминает чуть более сложный секундомер.
Это лучше делать на протяжении месяца, так как, надеюсь, не все дни и недели на работе у вас одинаковые. Если вам неудобно использовать приложение, воспользуйтесь ручкой и листом бумаги. Юристы и бухгалтеры именно так фиксируют свое рабочее время на протяжении уже нескольких столетий, потому что на основании этого выставляют счет клиенту. В итоге у вас должен получиться отчет о том, на что вы и ваши коллеги тратите рабочее время. Использовать его можно тремя способами.
1. Повысить личную эффективность. Какой процент рабочего времени вы проводите в Facebook? Может, совещание закончилось бы на полчаса раньше, если бы вы уделили 15 минут подготовке перед встречей? Точно зная, сколько времени занимает выполнение определенной задачи (например, подготовка плана по маркетингу), вы можете более точно прогнозировать завершение своей работы.
2. Если вы наемный сотрудник, то при оценке пользы, которую вы приносите компании, или в ответ на обвинения, что вам следует тратить меньше времени на непродуктивную работу, демонстрация четких цифр, сколько времени вы тратите на какие рабочие задачи, будет вам на руку гораздо больше, чем голословные заявления. Многие (согласно данным исследования, о котором уже говорилось в начале главы) жалуются, что у них отнимает слишком много времени обработка электронной почты или дорога до офиса, потому что хотят, чтобы их адрес не ставили в копию в списках рассылок, или потому что хотят работать из дома. Благодаря собранным данным их желание может осуществиться.
3. Если вы руководитель, эта информация поможет вам организовать работу более эффективно. Внимание, это может оказаться весьма проблематично. Если просто попросить сотрудников фиксировать время выполнения рабочих задач, потому что вы хотите сэкономить деньги, очевидно, что, скорее всего, сотрудники начнут переживать, не собираетесь ли вы проводить сокращения или вводить систему штрафов и наказаний, даже если ни о чем подобном вы и не думали. В итоге они либо откажутся сотрудничать, либо будут врать. Так что, может быть, стоит сосредоточиться на одной проблемной области или позволить сотрудникам самим выделить проблемы, подумать о способах их решения и отчитаться вам о результате. Кроме того, учтите, что во многих странах скрытое наблюдение за сотрудниками считается незаконным и в любом случае это плохое управленческое решение.
Я проанализировал, на что трачу время, и понял, что этот метод работает. То же самое было и у многих моих друзей, повернутых на технологиях. Более того, я обнаружил, что этот метод действует еще более эффективно, если сначала поставить цель. Например, решить не работать по выходным или определить, в какой день лучше всего работать из дома. Имея четкую цель, человек быстро начинает видеть, какие улучшения он может внести и какие потенциальные плюсы и минусы есть у его решения. Например, у одного моего друга стоит автоматическое извещение, что он проверяет электронную почту два раза в день: во время обеда и между пятью и шестью часами вечера, так как, когда он оценил, сколько времени тратит на непродуктивное общение по электронной почте, то понял, что его бизнес теряет на этом деньги. Четкое управление временем сделало его счастливее и продуктивнее.
4. Что сделал бы Twitter?
Бесплатный опрос общественного мнения, что может быть полезнее?
Если у вас свой бизнес, вероятно, у вас также есть аккаунты в социальных сетях: Facebook, Twitter, возможно, Google+. Может быть, кто-то выкладывает фотографии производимой продукции в Instagram.
Вероятно, вы делаете электронные рассылки, отправляете информационные письма, ведете блог, который обновляете (или не обновляете) еженедельно. Вы потратили не один час, чтобы настроить опции по дублированию информации из блога в твиттер и наоборот.
И теперь вы считаете «лайки», которые вам поставили. Социальные медиа – это цифровые технологии, впервые в истории отношение людей датафицируется в тот момент, когда его выражают. В социальных сетях сосредоточен настолько огромный объем информации, что такие компании, как Facebook и Twitter, фактически обезличивают персональные данные и предлагают эту информацию специалистам по работе с данными, а те, проанализировав ее, продают результаты анализа дальше. Такой огромный поток социальных данных называется firehose («пожарный шланг»).
Но вам нет необходимости хвататься за этот «пожарный шланг». Вы и сами можете вести счет своим «лайкам», «ретвитам» и «+1». Twitter предоставляет статистическую информацию по вашему аккаунту, а помочь работать с этой аналитикой могут такие приложения, как Tweetdeck, Sprout Social или SocialOomph. Каждый раз при публикации поста вы можете наблюдать, кто публикует ваш пост у себя.
Это все весьма полезно. Давайте посмотрим, что происходит и как это влияет на развитие бизнеса, если люди всем этим занимаются (и вы только попробуйте их остановить: согласно данным компании Lightspeed GMI, 34,9 % жителей Великобритании в возрасте 18–24 лет проверяют свои аккаунты в социальных сетях еще до того, как встают с постели). Никто не спорит, что иметь 100 «лайков» для компании лучше, чем один, и что замечательно наблюдать, как то, что вы создали, расходится по интернету и вызывает положительную реакцию у пользователей. Однако по мере того, как число читателей вашего блога растет, количество «+1» под постами увеличивается, а вы уже думаете о том, чтобы нанять менеджера по продвижению в социальных сетях или отправить всех сотрудников на специализированные курсы, сделайте паузу и спросите себя: «А что это на самом деле значит?»
Короткий ответ: само по себе – ничего. Эти статистические данные о популярности вашего аккаунта – не что иное, как ваша «метрика тщеславия». Чем более вы тщеславны, тем большее значение им придаете. Но эти цифры адекватно отражают только сами себя.
Подсчет ретвитов отражает точное число людей, которые опубликовали ваш пост у себя. Специалист по продвижению в социальных сетях, возможно, назовет это «долей рекламного воздействия», потому что такое определение не стыдно внести в счет на оплату и получить за это деньги. Но ретвиты или «лайки» не отражают того:
• насколько вы популярны,
• купят ли пользователи то, о чем вы написали,
• нравитесь ли вы людям в реальной жизни.
Другие пользователи могут ставить вам «лайки» и делать ретвит ваших постов по целому ряду причин. Например, этот член парламента получил множество ретвитов (до того, как удалил свой пост) и увеличил свою «долю информационного присутствия», при этом он вряд ли улучшил свою репутацию, уровень доверия к себе или число друзей в реальной жизни:
Можно узнать больше о том, как социальные медиа соотносятся с реальной жизнью, если заплатить за проведение так называемого «анализа тональности текста». Он проводится на основании анализа частотности употребления таких ключевых слов, как «нравится», «люблю». К сожалению, его точность составляет в лучшем случае 70 % – это не намного эффективнее, чем просто подбросить монетку, и, скорее всего, даже менее надежно, чем ваша собственная интуитивная оценка, насколько вы нравитесь своим покупателям. Оценить эмоциональную окраску высказывания не всегда просто, особенно если делать это при помощи компьютерных технологий. Например, телевизионная станция хочет узнать, насколько популярна ее программа. Сообщение в твиттере, что пользователю не нравится эта программа, – это негативный отзыв. При этом сообщение, что ему неприятен отрицательный персонаж в этой программе, – это положительный отзыв, потому что он показывает, что зритель смотрит программу, обращает внимание на ее содержание и мотивирован рассказать всему миру, что он смотрит ее и обращает внимание на то, что там показывают. При этом компьютерная программа может оценить оба отзыва как отрицательные.
Все становится очень туманным. Даже если анализ эмоциональной окраски высказываний выполнен точно, он может вообще ничего не значить в реальном мире. Твит или оценка поста занимают считаные секунды, немногие относятся к этому действительно серьезно, кроме того, всегда можно удалить свое сообщение или отменить оценку «Нравится». Таким образом, не стоит расценивать действия в социальных сетях как намерение потратить деньги или взять на себя серьезное обязательство в реальной жизни.
Наконец, пользователи социальных сетей – это, скорее всего, молодые люди среднего класса, образованные и из развитых стран. Очень легко начать слишком доверять социальным сетям, но все же не стоит увлекаться по следующим причинам:
1)-«лайк» и намерение сделать покупку – это не одно и то же;
2) пользователи могут делать ретвиты и «лайкать» ваши сообщения как по положительным, так и по отрицательным причинам;
3) нет доказательств, что это не эмоциональный порыв, а осознанное решение;
4) люди, которые это делают, могут быть не теми, кто вам интересен.
С другой стороны, это бесплатное статистическое представление, которое может обеспечить вас некоторыми полезными данными. Оно отражает те аспекты деятельности вашей компании или вашей рекламы, которые пользователи социальных сетей считают интересными. Оно может выявить тренд. Оно способно обеспечить быструю обратную связь, когда вы вносите изменения или решаете локальные задачи или проблемы, касающиеся одной группы людей. Так что это не информация обо всем на свете, но это самый большой бесплатный инструмент датафикации из созданных на сегодня, и потому было бы глупо его игнорировать.
5. Размер имеет значение
Что такое большие данные и где вы можете их получить?
Если вы не прячетесь в глухой пещере без электричества, скорее всего, вы обратили внимание на то, что сегодня многие говорят о больших данных. Это высшая цель и завершающий этап датафикации: идея о том, что все данные, которые создаются в цифровой реальности, могут быть полезны для улучшения мира, который произвел эти данные. Или в нашем случае могут помочь вам увеличить прибыль на 352 %.
Любое обсуждение темы больших данных начинается с попытки оценить, с каким объемом информации мы имеем дело. Предупреждаю: с большим. Авторы одной из лучших книг по этой теме (с удивительно понятным названием «Большие данные»[6]) Кеннет Кукьер и Виктор Майер-Шенбергер подсчитали в 2013 году, что если бы всю информацию в мире скопировали на CD, а затем сложили их один на другой, получились бы пять отдельных стопок, каждая из которых была бы высотой до Луны.
Сегодня к этим стопкам прибавились бы еще пять новых, но фактически это не имеет значения, так как сделать стопку такой высоты все равно невозможно. Важный вывод из этого заключается в том, что практически вся новая информация сегодня создается в цифровом формате. В 2000 году только около четверти всех данных хранились в цифровом виде. Сегодня это 99 %.
Перспектива больших данных в том, что мы сможем узнать еще больше. Хотя не все так просто. Датафикация не гарантирует финального результата, который вы сможете использовать. Подавляющий объем новых данных плохого качества или с трудом поддается анализу. Например, сегодня практически все системы видеонаблюдения оснащены цифровыми камерами. Однако компьютеры пока не могут «смотреть» изображения с этих камер и определять, что они видят, кроме элементарных, но важных вещей, например большого скопления людей. Хранение тысяч документов в формате текстового редактора – это замечательно, если вам нужно найти слово или фразу, но уже не так хорошо, если у вас нет времени читать все документы по результату поиска. Большинство людей осуществляют поиск для решения проблемы, а не потому что хотят что-нибудь почитать.
Большие данные по определению представляют собой слишком объемный и сложный массив информации по сравнению с теми базами, с которыми обычно работают компании. Для управления этими данными, для их обновления и обеспечения их безопасности не обойтись без применения специальных технологий. Это сложно и дорого, и большинство компаний не могут себе этого позволить. Если ваша организация в их числе, то чем вам могут оказаться полезными большие данные?
Во-первых, те, кто работает с ними, предлагают самые разные варианты их использования для повышения эффективности бизнеса, нередко даже бесплатно. Самый очевидный пример – целый ряд сервисов от компании Google: это и карты Google Maps, и новостные ленты с персональными настройками, и отчеты о статистике по сайтам, которые составляет Google Analytics.
Большие данные также способствуют решению проблем, позволяя поставщикам услуг создавать экспертные системы на основе машинного обучения и искусственного интеллекта. Самым простым примером может служить рекомендательный сервис интернет-магазина Amazon «Люди, купившие это…». Такой тип приложения с использованием «коллективного разума» обладает свойствами, характерными для больших данных: этот сервис не идеален, потому что механизм его работы заключается в том, что он ищет соответствия выявленным ранее закономерностям в информации и совмещает их с потенциальными потребностями пользователя. Тем не менее этот алгоритм работает быстро и лучше, чем просто догадка, а, как нам уже известно, большинство сотрудников впустую тратят 60 % рабочего времени и интуиция не слишком эффективное руководство для принятия решений.
Эти экспертные системы датафицируют функции, которые раньше относились к области человеческих навыков, например набор текста и перевод. Признайтесь, вам нравится перепечатывать тексты? Качество оборудования, распознающего речь, стало гораздо выше, но не потому что мы изобрели новые принципы работы программного обеспечения этого типа, а потому что компьютеры применяют большие данные для самостоятельного обучения. Обучение экспертных систем происходит за счет введения аудиозаписей, отобранных из интернета, вместе с расшифровкой, после чего система анализирует их и самостоятельно «обучается». Если вы не используете ПО для переформатирования аудиозаписей в текст, потому что вы попробовали это в 1990-х годах и получилась полная ерунда (а так оно и было), протестируйте современные онлайн-приложения, например Transcribe, и вы будете поражены. Эти сервисы бесплатны или предлагают свои услуги за символическую стоимость. В основе их работы лежат большие данные, а вы пользуетесь только конечным результатом. Можете ли вы использовать большие данные как-то еще? Да и нет.
Есть два способа, как большие данные могут стать хорошей инвестицией даже для компаний малого бизнеса. Во-первых, исследование их можно применить для улучшения собственных данных: примерами могут быть оценка внешней кредитоспособности или способность автоматически отслеживать лоты, когда они выставляются на продажу на онлайн-аукционах. Это делается в интернете, и существует специальная платформа под названием Kaggle для исследователей разных уровней, которые занимаются поиском решения разных задач на основе больших данных. Компании предлагают различные задачи и назначают вознаграждение, а гики со всего мира борются за него, предлагая собственные варианты решения проблемы. Одной из последних предложенных задач был поиск оптимальных способов работы по управлению клиентскими рекламациями от компании BNP Paribas[7] (вознаграждение $30 000) и определение самых довольных клиентов компании Santander[8] (вознаграждение $60 000).
Возможно, вы не готовы тратить такие суммы. Действительно немногие компании идут на это. Располагая более скромным бюджетом, можно, например, нанять специализированную организацию и исследовать тренды Facebook. Однако вам все равно придется платить за результат, так что это не быстрое решение. Для начала тщательно обдумайте, за информацию какого рода вы готовы заплатить и как вы будете применять ее в дальнейшем в вашей работе. Согласно данным компании Insite Consulting, примерно половина полученной информации остается никак не задействованной в процессе дальнейшего принятия решений. Это в буквальном смысле пустая трата денег.
Вы также можете решить работать с данными самостоятельно. Насколько это сложно? Очень сложно. Вы можете получить нужную вам информацию, в открытом доступе находятся структурированные большие данные, полученные в результате обязательного сбора открытых данных или их анализа и обработки. В Великобритании ведущей организацией, представляющей эту информацию, стал Институт открытых данных (Open Data Institute). Правительство Великобритании публикует информацию по самым разным темам, начиная от планов по производству дорожных работ до статистики по ожирению. В других странах национальная статистика становится все более доступной для пользователей, которые хотят ее получить. Таким образом, доступными становятся огромные массивы данных. Однако главная ценность заключается в их анализе.
А это не так-то просто. На протяжении последних 20 лет миллиарды долларов были впустую потрачены компаниями, которые вкладывались в область данных, но получили больше вопросов, чем ответов. Согласно аналитическим данным компании Ovum[9], в 1998 году четыре из пяти проектов первой волны, связанных с большими данными, потерпели полный провал. Основная причина заключалась в том, что они не были уверены, насколько полученные ими выводы могли способствовать повышению эффективности ведения бизнеса, даже если сами эти выводы были верны. Поэтому они не знали, следует ли инвестировать в проекты, и не понимали, можно ли принимать бизнес-решения на основе этих фактов.
Как ни парадоксально, иногда от больших данных можно получить результат лучше, если начать с малого: использовать бесплатные или почти бесплатные сервисы для повышения эффективности бизнес-процессов, прежде чем делать в эту область крупные финансовые вложения.
Часть 2
Пять основных принципов работы с данными
6. Поддерживайте удобство использования данных
После того как вы собрали данные, они должны храниться у вас в цифровом, а не текстовом формате.
Однажды мне довелось беседовать с руководителем отдела компьютерной графики одной из газет о том, как ей удается превращать сложные визуальные данные в аккуратные графики и диаграммы. Я неосмотрительно упомянул формат PDF.
«Я бы просто запретила использование этого формата, – заявила Кэрол (назовем ее так), вскипая. – Не представляете, сколько времени я убила впустую из-за того, что мне присылают файлы в формате PDF и говорят [здесь Кэрол намеренно стала говорить с дурацкой интонацией]: “Кэрол, ты не можешь сделать график из этого?” НЕТ, Я НЕ МОГУ».
Итак! У вас собран определенный массив данных. Как его хранить? Подсказка: не в PDF. Чаще всего объем нужной информации может храниться в двух местах: базе данных и таблице. Эти файлы могут быть в компьютере, на серверах или в облачном приложении, однако важно, чтобы эти данные хранились в таком формате, с которым вы сможете работать.
Для хранения больших массивов информации используются базы данных. Детали организации этого процесса слишком сложны с технической точки зрения, так что я не буду погружаться в них сейчас, можете выдохнуть с облегчением. Вероятно, вы больше знакомы с тем, как работают таблицы. Если вам приходится работать с бюджетом, или с расписанием, или другими небольшими по масштабу данными, скорее всего, вы уже активно используете какую-то из таблиц, и могу предположить, что это Microsoft Excel.
У баз данных и таблиц есть общая черта: информация организована в виде строк и столбцов. Таблицы – это просто гениальное изобретение человеческой мысли, изначально они использовались в бумажном варианте бухгалтерами, но, когда в 1979 году была разработана первая электронная таблица для персональных компьютеров VisiCalc, приложения для работы с ними стали неотъемлемой частью компьютерного ПО.
Прелесть таблицы в том, что сначала вы можете работать с данными, например, создав строку, дополняющую остальные. Цифры и названия в таблице составляют массив данных. В форматах PDF или Word данные словно перестают существовать: чтобы воспользоваться этой информацией, ее нужно заново набрать или, если повезет, скопировать и вставить. Если с цифрами производились математические операции (например, складывались промежуточные результаты), при переводе этих данных в PDF или Word ссылки, скорее всего, окажутся нерабочими.
При обновлении источника данных свежая информация никогда не попадет в документ в текстовом редакторе. Такие документы устаревают ровно в минуту их создания. При использовании баз данных и таблиц, если немного постараться, можно добиться того, чтобы актуальность данных поддерживалась.
Так что, если уж вы затратили усилия на сбор великолепного массива данных, позаботьтесь о том, чтобы им было удобно пользоваться. В противном случае, как бы замечательно ни выглядели эти данные, они бесполезны. Спросите Кэрол (или лучше не спрашивайте). Это основное правило деловой информации: нельзя вести бизнес, опираясь на прошлогодние факты.
7. Составляйте таблицы
Все знают, как составить хорошую таблицу на основе имеющихся данных?
После того как вы представили информацию в виде таблицы, вы должны быть способны донести ее до других. Качественно составленная таблица нередко становится наиболее эффективным способом представления данных: к сожалению, это также тот способ, которым чаще всего пользуются неправильно. Так что, пока мы окончательно не запутались, давайте потратим пять минут, чтобы прояснить разницу между хорошей таблицей и плохой.
Эдвард Тафти, специалист по информационному дизайну, – это, вероятно, человек, который больше всех думает о том, как эффективно доносить информацию до других. Тафти считает, что «графический мусор» (то есть то самое замысловатое форматирование, которое пользователи применяют для оформления таблиц) представляет собой «очевидный признак статистической глупости». Используйте подобное форматирование в своей презентации, и слушатели обоснованно заключат, что вы мало что смыслите в статистических данных. Обсуждение этого вопроса можно найти на его (достаточно аскетичном) сайте, который указан в разделе дополнительных ресурсов.
Принцип создания таблиц по Тафти заключается в том, что каждая единица информации и каждый элемент дизайна должны помогать пользователю лучше понять тему. Это сложнее, чем может показаться, но самый эффективный способ этого добиться – удалить все отвлекающие факторы и структурировать информацию так, чтобы она соответствовала образу мышления человека.
В качестве примера возьмем таблицу, отражающую долю выживших онкологических больных, из научной работы Германа Бреннера «Доля выживших онкопациентов в долгосрочной перспективе на конец ХХ века: периодометрический анализ» (Lancet, 2002, № 360, с. 1131–1135). После публикации научной работы на эту таблицу часто ссылались в газетных статьях. Оригинал ее выглядел как таблица, расположенная на предыдущей странице.
Это далеко не самая плохая из таблиц. Однако неспециалисту сложно в ней разобраться: в чем заключаются хорошие новости, какие виды рака наиболее опасны, в каких областях удалось добиться наибольшего прогресса – словом, то, что интересует всех нас. А вот таблица Тафти (она содержит все те же самые данные):
Я опустил нижнюю часть таблицы: вы и так можете уловить принцип ее построения. Почему теперь воспринимать информацию стало гораздо проще? Есть несколько рекомендаций по созданию качественной таблицы.
Сортируйте данные, чтобы самая важная информация находилась в верхней части таблицы. В таблице Тафти показатель самой высокой доли выживших онкобольных после пяти лет расположен в самом верху. Почему? Потому что, если вам поставили этот страшный диагноз, вас будет интересовать, какие у вас шансы по сравнению с пациентами, больными другими видами рака. Так мы думаем и так принимаем решения.
Не используйте профессиональный жаргон в названиях столбцов и строк. Возможно, пользователи знают, что такое «стандартная ошибка» (величина, показывающая отклонение данных от среднего показателя), но вот «% (СО)» в заголовке понять гораздо сложнее. Обратите внимание на то, как в легенде таблицы, находящейся вверху, где пользователи прочитают ее раньше, чем перейдут к цифрам, объясняется, что означают цифры.
Используйте как можно меньше строк, но не меньше, чем нужно. Для каждого вида рака приводится по восемь показателей, но они сгруппированы в четыре столбца. Объединение среднего показателя и стандартной ошибки без дополнительных строк и ячеек позволяет сразу выделить самую важную информацию. Показатели стандартной ошибки больше не заключены в скобки, и потому читать их стало проще.
Не стоит автоматически применять форматы, предлагаемые Excel. В большинстве случаев они слишком вычурные. Взгляните на таблицу, созданную Тафти: форматирования практически нет, так как линии и цвета отвлекают от цифр.
В бизнесе данные используются для принятия решений. Именно так вы добьетесь роста прибыли на 352 %, как я и обещал, принимая другие решения. Качественная таблица – это единственный, самый важный актив, который у вас есть, когда нужна точность. Как в этом примере, таблица может быть единственным что вам потребуется, чтобы получить важную информацию, необходимую для принятия решения. Но помимо этого, данные из нее удобны в использовании: в отличие от файла в формате PDF, их можно использовать для следующего шага, чтобы построить диаграмму.
8. Стройте диаграммы
Диаграммы способны не только структурировать информацию, но и сделать ее непонятной.
Открываем Excel, вносим данные, выделяем их, выбираем тип диаграммы, строим ее, копируем, вставляем в PowerPoint, проводим презентацию. Каждый из нас когда-нибудь это делал, а затем наблюдал за печальными лицами людей, перед которыми он выступает, когда они пытаются выделить важную информацию.
Вот три способа (хотя их гораздо больше) сделать так, чтобы ваши диаграммы стали более понятными. Основное правило – вы должны спросить: «Понимаете, что я имею в виду?», и каждый, кто видит вашу диаграмму в презентации, должен суметь самостоятельно ответить на этот вопрос.
Ниже представлена диаграмма, демонстрирующая рост числа сотрудников.
Название диаграммы говорит о том, что число сотрудников увеличилось, но, чтобы убедиться в этом придется напрячь зрение. Фактически более удачным названием этой диаграммы в таком виде было бы, что число сотрудников примерно одинаково каждый год.
Вопрос: должна ли ось значений начинаться с нуля? (Вопрос об усеченной вертикальной оси впервые был поднят в 1954 году в книге Даррелла Хаффа «Как лгать при помощи статистики»[10], которая до сих пор остается самой популярной книгой об этой науке). Если вероятность, что число сотрудников будет на отметке «0» и «10», примерно равна, то начинать следует с нуля; важная информация в данном случае будет состоять в том, что число сотрудников превышало отметку «9» на протяжении 12 лет! Отлично. При этом, если возможное число сотрудников никогда не было меньше 9, пусть все внимание будет направлено на историю, которую вы хотите рассказать, а не на девять десятых, которые не так важны. Ниже приведена та же самая диаграмма, но теперь по форме подачи информации она соответствует названию.
Прелесть плоских столбиковых диаграмм в том, что они отражают одну зависимость: высота столбца соответствует данным. Это невозможно игнорировать. Но Excel (как и другие программы работы с таблицами) предлагает нам 3D-диаграммы, если вдруг нам хочется развлечься, а не получить информацию. В лучшем случае дополнительное измерение не дает новой информации, отвлекая при этом от высоты столбца.
В худшем случае эта диаграмма дезинформирует пользователей. В Excel есть возможность строить 3D-диаграммы с конусообразными элементами. Пользователи должны оценивать высоту конусов, но человеческий мозг имеет тенденцию к преувеличению разницы.
Самый худший из грехов – использование объемных иллюстраций. Ниже представлен один из таких примеров.
Второй мешок с деньгами в два раза выше первого. Однако, помимо этого, в нашем воображении он еще и в два раза шире, и в два раза глубже, чем первый. Объем второго мешка в восемь раз больше объема первого. Этот прием всегда используется для преувеличения разницы. У нас нет «полиции», следящей за использованием изображений, поэтому при желании вы вполне можете так поступить. При этом вы исказите смысл данных. Тем не менее если вы осведомлены об этом приеме, то будете начеку, если его попробуют применить в отношении вас.
В данном случае, если вы все-таки не готовы отказаться от идеи картинок с мешками, то правильный способ это сделать – использовать во втором случае изображение, на котором в два раза больше точно таких же мешков и чтобы при этом они лежали друг рядом с другом, дабы можно было сравнить длину линии, которую образуют эти мешки. Это сопоставимо с линейной диаграммой, которая составлена из изображений маленьких мешков.
Круговые диаграммы, напоминающие куски пирога, повсеместно встречаются в презентациях, так как формат таблиц считается устаревшим. К сожалению, нередко они не несут полезной информации. Ниже приведен такой пример. В этой диаграмме есть легенда и все, что нужно, но какой ее сектор самый большой? На практике большинство людей ответили бы, что передний сектор (он кажется самым крупным, потому что расположен ближе всего к смотрящему). Но даже на плоской секторной диаграмме было бы сложно различить эти три практически одинаковых «куска пирога».
Можно поместить цифры на сектора диаграммы или указать процентное соотношение. Это лучше, но обычно на чтение и понимание этой истории уходит много времени, особенно если секторы не расположены в очевидном порядке от большого к маленькому.
Покажите кому-нибудь вашу круговую диаграмму и попросите быстро сказать, о чем она. Если вы не получите ответ в течение 10 секунд, вероятно, вам лучше использовать столбиковую диаграмму:
Это отвратительная диаграмма, в которой горизонтальные столбцы затенены так, словно это маленькие трубки. Почему? Потому что Excel предлагает этот вариант по умолчанию. Привет компании Microsoft! К счастью, теперь хотя бы видно, что средний столбец самый длинный, а еще через несколько секунд мы даже посчитаем значения каждого столбца с помощью вертикальных линий. Уже лучше. Возможно, более удачным вариантом было бы сделать ряды маленьких человеческих фигурок вместо горизонтальных столбцов, к тому же это напомнило бы, что речь идет о людях. Однако такой подход потребовал бы больше времени, и в Excel это нельзя сделать автоматически, хотя, казалось бы, сегодня программа уже должна предлагать такие опции.
У меня радикальное предложение. Если у вас очень небольшой объем данных, скажем пять цифр или меньше, и вы хотите представить их, почему бы не оставить все в форме таблицы, как раньше? В таблице содержится вся информация, представленная в предыдущих двух диаграммах, она быстрее читается, и ее невозможно неправильно понять.
Сколько времени вы добираетесь до работы?
9. Устанавливайте закономерности
Графики часто рассказывают историю взаимосвязи данных. Разобравшись с этой историей, вы сможете принять правильное решение.
Графики, как мы увидим далее, не доказывают наличия взаимосвязи, но определенно помогают ее выявить, и по многим причинам с этого стоит начинать. Ниже приводится таблица, демонстрирующая, как часто британское правительство называло состоятельных людей «производителями материальных благ», год за годом.
Я не буду комментировать, действительно ли люди, у которых больше денег, производят материальные блага (создавая компании и новые рабочие места или покупая большие дома, позволяя тем самым заработать другим) или потребляют их (если они покупают несколько домов, которые стоят пустыми, кто-то другой мог бы на эти деньги приобрести необходимое жилье). Это относится к разряду субъективных мнений, и у разных политиков своя точка зрения на этот счет.
Как мы видим, цифры увеличиваются, но не сильно. Теперь мы можем составить точечную диаграмму, как показано далее.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Это весьма интересно: теперь стало очевидно, что цифры увеличиваются. При анализе диаграммы слева направо вырисовывается определенная история. Кажется, мы уловили закономерность.
Сейчас впервые в этой книге настало время серьезно задуматься о проблеме интерпретации данных. Точки на диаграмме рассеивания – это статистические данные. Статистика представляет собой информацию, но это не сама информация. В данном случае это измерение количества статей в прессе в базе данных под названием Factiva.com, которая собирает публикации газет и журналов со всего мира. Тем не менее статистика тоже может ошибаться (база данных может быть неполной), и закономерности в реальной жизни не бывают такими же четкими, как в школьных научных экспериментах. Эти данные подвержены влиянию множества факторов. Так что история, которую я рассказываю, – это всего лишь один из многих возможных вариантов.
В чем заключается моя история? Есть веские основания предполагать наличие закономерности: политики все чаще использовали этот термин на протяжении периода времени, обозначенного на диаграмме. Обратите внимание, если бы я просто отметил первый и последний годы и показатель последнего года был бы выше, речь шла бы о разнице, а не о закономерности.
Тогда, может быть, стоит соединить точки, чтобы сделать закономерность более очевидной, как на следующей диаграмме.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Визуально стало лучше, но можно пойти дальше. Никто не может предполагать, что количество статей было в точности таким. Одна хаотичная линия внесла ясность в диаграмму, но не в историю, которая стоит за ней. Лучше провести прямую линию, чтобы обозначить закономерность.
Чтобы начертить такую линию, прибегнем к методу наименьших квадратов, который активно используется в статистике. Для этого берутся все точки и рассчитывается линия с минимальным квадратом расстояния от каждой точки до линии. Эта черта называется линией наилучшего соответствия. Не переживайте, если до этого вы не имели дела со статистикой, – функция для создания этой линии заложена в программу по работе с таблицами. Однако одна линия может оказаться не слишком информативной. Как видно, точки располагаются не по прямой. Получается, что в начале и конце графика большинство точек находятся выше линии наилучшего соответствия, а в середине большинство точек располагаются под этой линией. Это не очень хорошо.
Взгляните на следующий график. Я разделил данные на две части. В период с 2000 по 2006 год линия наилучшего соответствия была горизонтальной. В период с 2006 по 2012 год она пошла вверх. Из этого можно сделать вывод, что термин «производители материальных благ» начал активно вводиться в употребление после 2006 года.
Соотношение числа статей в британской прессе с упоминанием «производителей материальных благ» (2000–2012)
Насколько это соответствует действительности? Статистика – точная наука, но анализ закономерностей всегда субъективен. Простая столбиковая диаграмма так же показала бы, что частота употребления этого термина повысилась, и, возможно, это все, что нам стоит знать. Можно выдвинуть предположение, что примерно в этот период кто-то принял решение о введении в употребление нового термина, но это так и останется лишь предположением.
Суть в том, что простое составление таблиц или графиков – это еще не способ принимать более эффективные решения. Важно улавливать закономерности. Они либо указывают на необходимость понимания того, что происходит, если мы не знаем причин появления этой закономерности, либо показывают, что какой-то фактор оказывает влияние, если мы понимаем какой. Чем лучше прослеживается закономерность и чем ближе располагаются точки к линии, тем больше это указывает на то, что нужно искать причину.
10. Ищите среднее
Усреднение может сделать информацию яснее. Однако существует больше чем одно среднее значение, и выбор неверного может скрыть от вас то, что вам действительно стоит знать.
В 1918 году Джон Меклин ввел в употребление фразу, которую то и дело применяют специалисты по статистике. Он впервые использовал ее в названии своей научной работы «Тирания обычного человека», опубликованной в журнале International Journal of Ethics.
О какой тирании идет речь? Меклин объясняет. «Очарование острова Капри полностью покоряет путешественников даже без колких фраз Тацита, напоминающих им о…» Постойте, это не тот отрывок. «Наш современный тиран – с головой гидры, с бесчисленным количеством рук…» И это не то! В конце концов автор сообщит нам, что он против «кричащей и банальной сентиментальности дешевого романа, глупого остроумия воскресного приложения к газете, абсолютно пустых песен популярных эстрадных шоу».
Претензия Меклина, высказанная в столь резкой форме, тем не менее обоснованна и заключается в том, что мы уделяем слишком много внимания вкусам большинства и игнорируем тех, кто выделяется из общей массы. Меклин работает в Университете Питтсбурга, издалека наблюдает за процессом зарождения массового социализма и распространением демократических идей, и его одновременно интересуют и пугают привычки обычных людей, от которых, по его словам, будет зависеть процесс принятия решений.
Здесь необходимо сделать пояснение, что это эссе отражает исключительно субъективное мнение автора, который не приводит примеров «обычного» вкуса, не показывает, чем он отличается от вкусов богатых и успешных людей, которыми он так восхищается, и не обосновывает, действительно ли выбор большинства объективно хуже любого другого.
Кроме того, это мнение далеко не всегда справедливо. Мы живем в мире, где слушают музыку и Адель, и Rage Against The Machine, где играют в футбол или в 3D-шахматы. Тем не менее для целей нашей книги у Меклина можно почерпнуть важную мысль. Среднее значение часто отвлекает от более полезной информации.
Есть три средних значения, которые обычно применяются, и все они в определенных ситуациях бывают полезны.
• Среднее арифметическое. Именно это значение большинство людей понимают под средним. Это сумма всех статистических элементов, деленная на их количество. Среднее арифметическое последовательности 1, 3, 3, 4, 4, 6 – это 21/6, или 3,5. Если мы хотим, например, узнать уровень рождаемости, среднее арифметическое будет наиболее полезным статистическим показателем. В Великобритании в 1964 году, по данным Всемирного банка, уровень рождаемости составил 18,8 на 1000 человек. В 2013 году этот показатель был 12,2. Интересно.
• Медианное значение. Проблема со средним арифметическим показателем состоит в том, что при наличии резко отклоняющихся значений – как в большую, так и в меньшую сторону – результат получается искаженным. Например, если покупатели тратят 1, 3, 3, 4, 4, 6 и 28, то получается, что в среднем каждый из них тратит 49/7, или 7. Медиана – это уровень показателя, который делит некоторый набор данных на две равные половины. В данном случае это четвертый элемент из семи, то есть 4. Это более адекватное среднее значение при наличии чрезвычайно высоких показателей.
• Мода. В статистике мода – это значение во множестве наблюдений, которое встречается наиболее часто. Это то, что делает самая большая группа (или каким признаком она обладает), так что по этому показателю можно выстраивать приоритеты. Если среднее арифметическое товаров, которые покупают пользователи вашего сайта, равно 7, но при этом 8 из 10 пользователей не покупают ничего, то мода уровня покупок равна 0. И, возможно, с этого и стоит начинать, если вы хотите что-то менять.
К сожалению, средние значения могут затуманивать информацию. Например, с точки зрения правительства, среднее значение имеет смысл высчитывать, принимая за целое все население. С точки зрения компании по организации праздников, логичнее сначала разбить информацию по сегментам. Среднее число детей у одной женщины снижается, но нередко бывает полезным узнать среднее значение по отдельным группам. Например, для компании по организации праздников важнее информация о том, что у женщин, рожденных после 1981 года, в возрасте 30 лет медиана и мода по рождению детей равны нулю: половина из них в эти годы еще даже не вышли замуж, по данным Бюро национальной статистики Великобритании. Эта информация может повлиять на решения компании относительно того, какие праздники ей выгоднее организовывать для своих клиентов.
Среднее значение также способно подвести, если вы стремитесь определить, что может произойти, а не что уже произошло. В каждой области есть так называемые опережающие индикаторы, которые можно назвать законодателями мод, или трендсеттерами. Возьмем, например, индустрию моды и стиля: к тому времени, когда изменится среднее значение, которое вы пытаетесь измерить, будет уже слишком поздно. В этом случае лучше определить 100 человек, на стиль которых ориентируется массовый рынок, и анализировать информацию по ним – тогда, возможно, прогноз будет отличаться большей точностью.
Еще один наглядный пример – данные по уровню удовлетворенности ваших покупателей. Среднее значение может не сильно меняться, при этом оно состоит из небольшого числа очень довольных покупателей (возможно, именно на них вам и стоит сделать акцент, предлагая свои товары), группы чрезвычайно недовольных покупателей (которые, вероятно, от вас уйдут) и всех остальных (которым, скорее всего, все равно).
Если относиться ко всем покупателям как к «среднему», это может разочаровать ваших преданных поклонников, покажется «слишком мало и слишком поздно» для тех, кто вами недоволен, и может быть не вполне адекватно для всех остальных. Приведу реальный пример из жизни, когда британская телекоммуникационная компания О2 перестала ориентироваться на «среднего» клиента при определении уровня удовлетворенности ее услугами и предложила бонусы, чтобы сделать довольных клиентов еще счастливее, и при этом снизила риск игнорирования недовольных клиентов. Выяснилось, что на прибыли компании гораздо лучше отражается повышение лояльности клиентов из числа недовольных, чем равное распределение бонусов по всем или награждение довольных. В терминах маркетинга это называется сегментированием. И вам лучше опираться на сегментирование аудитории по принципу пола, возраста, покупательной способности или привычек (названия этих категорий могут быть, например, «опытные мамочки» или «индивидуальный городской тренд»), а не на политику, ориентированную на среднее арифметическое, медиану или моду.
Тиранию средних значений можно победить с помощью вопроса: что на самом деле означает это среднее, насколько оно помогает вам принять решение? Средние показатели по всему населению могут быть полезны, но помните, что данные, на основе которых вы можете действовать, обычно включают в себя анализ того, из чего складывается это среднее.
Часть 3
В какой точке вы сейчас находитесь?
11. Что означает эта «тревожная лампочка»?
Дэшборд (Dashboard)[11] кажется отличным инструментом первые два дня, затем на него чаще всего просто перестают обращать внимание. Тем не менее качественный дэшборд может оказать помощь в принятии решений на основе данных.
Он позволяет найти необходимые данные, когда они вам нужны. Дэшборды, формальные или неформальные, для сбора всех данных в едином месте применяются во многих компаниях. При этом их создание не ограничивается просто помещением всех данных на экран.
Дэшборд – это актуальный отчет о том, что происходит в бизнесе. Это эффективный инструмент, позволяющий руководителю выработать полезные привычки работы с данными. Когда вас о чем-то спрашивают, первой мыслью должно быть: «Посмотрим, что говорит дэшборд». Как ни парадоксально, самый большой минус этого инструмента заключается в том, что он делает слишком много. Если данные там организованы не очень хорошо, ваша следующая мысль: «Не совсем понимаю, что именно означают эти цифры».
Признаки качественного дэшборда:
• вся информация, необходимая для работы, собрана на одном экране;
• информация постоянно обновляется, так что вы уверены, что пользуетесь актуальными данными;
• на ней выделены важные моменты.
Все чаще этот инструмент можно встретить на переднем экране мобильных приложений. Например, бухгалтерское ПО может предоставлять быстрый обзор всех данных, когда пользователь входит в аккаунт. Однако нередко мы просто пропускаем этот экран и не стремимся использовать его по назначению.
Так что независимо от того, выбрали ли вы внешнего разработчика для создания индивидуального дэшборда или установили готовое ПО, оно должно быть действительно качественным. К сожалению, такое встречается чрезвычайно редко. Давайте рассмотрим основные минусы и как их исправить.
Велик соблазн помещать на дэшборд все данные, которые попадают в ваше распоряжение. В итоге отчет о движении денежных средств соседствует с последними твитами, заголовками новостей и данными об уровне удовлетворенности покупателей. Вы должны быть в состоянии быстро ориентироваться во всей этой информации, поэтому оставьте несколько действительно важных показателей, сгруппированных логически. Например, для бухгалтера это данные о контрагентах из числа злостных неплательщиков по счетам над списком просроченных платежей.
Каждый элемент статистики должен нести значимую информацию: этот показатель лучше запланированного или хуже? Задачи, требующие активных действий, сразу должны бросаться в глаза. В плане работ или таблице используйте условное форматирование и выделяйте «проблемные» ячейки, например красным, чтобы вам не приходилось их искать. Это подразумевает, что вам нужно установить цели до того, как вы создадите дэшборд.
В коммерческом дизайне существует идея, что дэшборд должен выглядеть как приборная доска в кабине самолета или гоночного автомобиля. Дизайн последних разработан с большой тщательностью, но они предназначены для профессионалов. Простые столбиковые диаграммы и линии трендов легче для понимания и точнее, чем круговые 3D-диаграммы или имитации спидометров, которые нередко не показывают значимой информации.
Данные должны обновляться автоматически. Невозможно принимать верные решения на основе устаревшей информации. При настройке приложения уделите время в том числе синхронизации с обновлением банковской информации или новостных лент (если ваше приложение этого не может, смените его). Возможно, первоначальная настройка потребует времени и усилий, но затем это будет ежедневно окупаться сторицей.
Точно так же как многие из нас привыкают к папке «Входящие», в которой скопилось 3000 непрочитанных сообщений, мы приучаемся игнорировать тревожные сигналы на дэшборде, если пока не можем решить, что с этим делать. Такая реакция провоцирует инертность. Если это данные о процессе, на который вы никак не можете повлиять или который для вас не важен, то как они оказались на вашем дэшборде? Если вы не уверены относительно срочности какой-то задачи, подумайте о том, чтобы ввести систему ранжирования, а не только «тревожную лампочку» (90 % от намеченной цели все-таки отличаются от 50 %), например, используйте желтый, зеленый и красный индикаторы или систему звезд от одной до пяти. Наконец, вы можете не знать, в чем причина возникшей проблемы; в этом случае у вас должна быть возможность получить более подробную информацию.
Таким образом, первый шаг – это обращать внимание на дэшборд в тех ежедневных приложениях, которые вы используете. Например, если у вас малый бизнес, бухгалтерское ПО, как правило, предлагает быстрый обзор, когда вы входите в свой аккаунт. Если вы активно используете социальные медиа для ведения и продвижения бизнеса, любую программу управления социальными медиа можно настроить так, чтобы ее стартовым экраном был дисплей с отчетом. Каждый раз, когда вы начинаете использовать какую-то программу, установите стартовый экран для этого приложения. Это может быть несколько утомительно, но заставляет задуматься о том, какая информация для вас важна, а какая просто отвлекает. Например, данные о средней продолжительности периода, в течение которого каждый клиент оплачивает счет, не настолько полезны, как список счетов, оплата по которым не была совершена более 60 дней. Регулярно проверяйте данные и убирайте избыточную информацию.
Если вы хотите создать индивидуальный дэшборд для основных показателей деятельности вашей компании, есть множество коммерческих компаний, которые способны вам в этом помочь. Многие из них для привлечения клиентов предлагают бесплатный тестовый период. Помните, если данные организованы плохо, вы скоро перестанете обращать на них внимание. Кроме того, учтите, что ваши приложения должны своевременно генерировать ленты с данными по KPI для дэшборда. Синхронизация этих процессов обычно бывает наиболее длительной и сложной частью проекта.
Наконец, возможно, вы решите нанять программиста. В этом случае ищите специалиста, имеющего опыт разработки интерфейсов; чем больше логики и меньше флеш-технологий, тем лучше.
12. Отслеживайте изменения
Во многих компаниях практикуется проведение трекинговых исследований. Но, как видно по результатам, не все они одинаково полезны.
Сложно планировать результат, если не знаешь, в какой точке находишься и в каком направлении собираешься двигаться. Это в равной степени относится к тому, что о вас думают клиенты, поставщики и сотрудники, а не только к тому, сколько единиц товара вы продали вчера. Периодический опрос клиентов лежит в основе исследовательского инструмента под названием «трекер». Суть в том, чтобы подвергать проверке одни и те же базовые данные через равные промежутки времени, чтобы следить за динамикой при помощи простых показателей.
Самое важное не то, насколько часто вы проводите эти опросы, а о чем вы спрашиваете. Во время трекингового исследования одни и те же вопросы должны задаваться в одинаковой манере примерно одной выборке респондентов. Результатом должно стать число. Статистический показатель повышается, если бизнес на подъеме, и понижается, если дело переживает не лучшие времена. Большинство компаний помещают вопросы трекингового исследования на дэшборд.
Это просто. К сожалению, на этом легкая часть заканчивается. У многих компаний бесполезные или недостоверные «трекеры» напоминают зомби в поисках данных еще долго после того, как сотрудники полностью перестали обращать на них внимание. «Сегодня компании отслеживают совсем не те показатели, которые следовало бы», – предупреждает Фил Кодлинг, менеджер по исследованиям и аналитике Института по изучению работы с потребителями (Institute of Customer Service).
«В ходе современных трекинговых исследований задают, во-первых, неверные вопросы и, во-вторых, слишком много вопросов», – говорится в заключении аналитического отчета The Trouble with Tracking («Проблемы трекинга»), подготовленного Яном Хофмейром, который создал модель преобразования системы отслеживания. Задавать нужно только тот вопрос, который повлияет на принятие решения и который подразумевает конкретное действие, если трекинговый показатель повышается (или понижается). Компании задают слишком много вопросов, их охватывает «исследовательская лихорадка», люди любят получать как можно больше информации. Проблема в том, что респонденты не утруждают себя ежемесячным заполнением длинных опросных форм или просто выдумывают ответы. Так что руководитель получает неадекватную информацию, трекинговый показатель случайным образом прыгает то вверх, то вниз.
Может показаться парадоксальным, но качественный трекинговый показатель не меняется слишком сильно, поскольку реагирует на стратегические тренды, а не на события вчерашнего дня. Его смысл в долгосрочной перспективе, а не краткосрочных решениях.
Сегодня в качестве трекера наиболее часто используется так называемый индекс потребительской лояльности NPS. Он был создан в 2003 году консультантами по вопросам управления компании Bain[12], которые выяснили, что ответ на вопрос «С какой вероятностью вы бы рекомендовали наши продукты/услуги/компанию своим друзьям и членам семьи?» по шкале от 0 до 10 представляет собой хороший индикатор будущего роста.
Для вычисления трекингового показателя берется число тех, кто рекомендовал бы услуги компании своим друзьям и родственникам (показатели 9 и 10), и вычитается число тех, кто не рекомендовал бы (показатели ниже 6). Компании используют трекинговый показатель для отслеживания качества клиентского обслуживания, определения приоритетов среди проектов (те, что имеют самый высокий индекс NPS, обеспечивают самый быстрый рост компании) или для сравнения офисов или департаментов.
Как и все остальные трекеры, этот индекс имеет и плюсы, и минусы. Например, одна из функций трекера – стимулировать принятие решений, а не просто выступать инструментом отчетности, поэтому рост и падение показателя необходимо обсуждать. При этом многие компании не считают собственные трекинговые исследования источником данных для принятия решений, и в этом случае они в буквальном смысле выбрасывают деньги на ветер.
Кроме того, трекер выступает индикатором того, что что-то происходит правильно или неправильно, но не указывает непосредственно, что именно. Это раннее предупреждение и инструмент быстрой обратной связи, тем не менее бизнесом управляет не трекер: это должны делать вы. При этом трекер быстро поможет вам понять, двигаетесь ли вы в верном направлении.
На другом конце шкалы – компании, которые уделяют слишком много внимания трекинговым исследованиям, например привязывают их результат к серьезным материальным бонусам. В результате сотрудники таких организаций могут попытаться манипулировать трекинговым показателем, а не реально увеличивать прибыль компании. Например, они могут стараться повысить долю людей, которые не относятся ни к тем, кто рекомендовал бы услуги компании своим друзьям и родственникам, ни к тем, кто не рекомендовал бы, независимо от того, какое влияние это оказывает на процесс продаж.
Итак, для решения каких важных вопросов должно применяться трекинговое исследование? Я спросил об этом создателя индекса NPS Роба Марки из компании Bain. Он выделил три категории.
1. Сравнительный анализ конкурентов. У кого выше трекинговый показатель – у вас или у конкурента? Это, согласно данным компании Bain, связано с вашим уровнем роста.
2. Взаимоотношения с клиентами. Что думают ваши покупатели? Это полезно для выявления проблемных моментов в работе маркетинговой службы или отдела по работе с клиентами, пока они не стали слишком серьезными.