О чем говорят цифры. Как понимать и использовать данные Дэвенпорт Томас

Глава 1

Почему аналитические способности нужны каждому

Мы живем в мире информации, объем которой нарастает с поразительной скоростью – все больше и больше данных сваливается на наши головы, причем большую их часть собирают, чтобы улучшить качество принимаемых решений в бизнесе, государственном управлении или общественной деятельности. Если нам не удается это сделать методами количественного анализа, тогда данные пропадают впустую, а уровень эффективности нашей деятельности далек от желаемого. Цель этой книги в том, чтобы показать читателю, как работает количественный анализ (даже если у читателя нет математической подготовки) и как использовать его для улучшения принимаемых решений.

Актуальность данных и аналитических исследований

Рост объема информации характерен почти для каждой сферы общественной деятельности. Если вы занимаетесь спортом, то наверняка знаете о бейсбольной статистике Moneyball[1] и революции в профессиональном бейсболе, которую позволил совершить анализ данных об эффективности действий отдельных игроков. Сейчас такая статистика внедрена практически во всех популярных видах спорта. Если вы увлекаетесь сетевыми компьютерными играми, то наверняка знаете, что разнообразные сведения о вашем игровом поведении накапливают и анализируют компании Zynga и Electronic Arts. Любите кино? Возможно, слышали о методике, применяемой компанией Netflix для прогнозирования предпочтений в области кино. Может быть, вы не знаете, что некоторые голливудские киностудии (например, Relativity Media) используют похожие методики, принимая решение о том, какие кинопроекты финансировать.

Важно, что существуют различные типы данных. Некоторые используют для бухгалтерского учета. Например, ваша компания наверняка сохраняет информацию о том, с какого числа вы зачислены в штат или сколько дней ежегодного отпуска использовали. Но по мере накопления все большего объема данных того или иного типа у компаний возникает понятное желание найти им полезное применение, в частности использовать для принятия решений. Обычно активно пользуются базой данных о персонале. На основе этих данных руководство может задать вопрос: какое количество сотрудников, возможно, уволится в следующем году? Есть ли взаимосвязь между полным использованием отпуска за текущий год и результатами работы сотрудника за тот же период?

Но сбор данных и аналитика не просто способствуют принятию оптимальных управленческих решений. Многие интернет-компании – Google, Facebook, Amazon, eBay и прочие – используют так называемые большие данные о текущих онлайновых операциях не только когда нужно обосновать принимаемое решение, но и при разработке новых продуктов и их свойств. Стремитесь ли вы создать дополнительную ценность для потребителей или оптимизировать принимаемые решения – все это задачи для аналитиков. Они обобщают данные, ищут в них внутреннюю логику и на ее основе разрабатывают модели. Найти в данных логику и эффективно их использовать можно лишь с помощью методов математического или статистического анализа, обобщенно называемых аналитикой.

Что такое аналитика

Аналитикой мы называем всестороннее использование баз данных, статистический и количественный анализ, объяснительные и прогнозные модели, а также доказательный менеджмент, применяемые для поддержки решений и увеличения ценности для потребителей.

В зависимости от цели и методов аналитику можно разделить на описательную (дескриптивную), предсказательную (предикативную) и нормативную (прескриптивную). Описательная аналитика включает сбор, систематизацию, представление данных в табличной форме, а затем выделение их основных характеристик. Этот вид аналитики всегда ориентировался на информирование о характеристиках данных. Он может оказаться весьма полезным, но ничего не говорит о причинах сложившейся ситуации или о том, что произойдет в будущем.

Предсказательная аналитика выходит за рамки простого описания данных и зависимостей между переменными (в виде показателей, которые могут иметь целый ряд значений) и прогнозирует динамику показателей в будущем на основе данных за прошлые периоды. Сначала определяются связи между переменными, а затем на основе их анализа оценивается вероятность того или иного события: например, насколько вероятно, что потребитель отреагирует на рекламу и купит данный продукт. Хотя связи между переменными используются для прогнозирования будущего, явная причинно-следственная связь обнаруживается далеко не всегда. По сути, она совсем не обязательна для получения точного прогноза.

Нормативная аналитика ориентируется на более широкий круг задач и включает такие методы, как проведение экспериментов и оптимизация. Подобно тому как доктор выписывает рецепт, нормативная аналитика предлагает направление действий. Эксперимент призван ответить на вопросы о причине тех или иных явлений. Чтобы с уверенностью делать выводы о причинных связях, исследователи изменяют одну или несколько независимых переменных и наблюдают реакцию зависимой переменной, одновременно контролируя внешние по отношению к исследуемой системе факторы. Если тестовая группа, подчиняющаяся условию эксперимента, показывает существенно лучшие результаты по сравнению с контрольной группой, то ответственный менеджер может принять решение о широком внедрении этого условия.

Еще один вид нормативной аналитики – оптимизация. Она направлена на выявление оптимального значения конкретной переменной во взаимосвязи с другой переменной. Например, нам необходимо рассчитать цену продукта, обеспечивающую максимальную рентабельность его продаж. В розничной торговле оптимизационный подход таким же образом позволяет выявить уровень запасов, гарантирующий отсутствие сбоев из-за временного отсутствия какого-либо товара.

В зависимости от применяемых методов и видов данных, подлежащих сбору и анализу, аналитику можно разделить на количественную и качественную. Цель качественной аналитики состоит в углубленном понимании причин и мотивов тех или иных явлений. Обычно для этого собирают ограниченное количество неструктурированных данных на основе нерепрезентативной выборки[2], а анализ проводят нестатистическими методами. Качественная аналитика полезна при проведении поисковых исследований, то есть на первом этапе исследований аналитических. Количественная аналитика представляет собой систематическое изучение событий при помощи статистических, математических и вычислительных процедур. На основе сбора информации о большом количестве репрезентативных событий с последующей статистической обработкой обычно получают структурированные данные.

В зависимости от целей исследователи применяют различные аналитические методы:

статистика – сбор, систематизация, анализ, интерпретация и оглашение данных;

прогнозирование – оценка динамики той или иной переменной в определенный момент в будущем на основе данных о ее динамике в прошлом;

интеллектуальный анализ данных (Data mining) – автоматизированное или полуавтоматизированное выявление ранее неизвестных зависимостей в больших массивах данных с помощью специальных вычислительных алгоритмов или статистических методов;

интеллектуальный анализ текстов – выявление неизвестных зависимостей или тенденций в тексте методами, подобными интеллектуальному анализу данных;

оптимизация – использование математических методов для того, чтобы найти оптимальные решения на основе заданных критериев и установленных ограничений.

эксперимент – формирование тестовой и контрольной групп методом случайного отбора и выявление причин и степени влияния независимых переменных на зависимую переменную.

В этом списке приведены широко известные аналитические методы, причем многие из них используют одни и те же аналитические приемы и процедуры. Например, регрессионный анализ – наиболее распространенный аналитический прием в предсказательной аналитике – не менее популярен и в статистике, прогнозировании и интеллектуальном анализе данных. Точно так же анализ временных рядов, специальная аналитическая процедура из арсенала статистики, предназначенная для анализа меняющихся во времени значений переменных, используется не только в статистике, но и в прогнозировании.

Учетные данные, помогающие принимать решения по персоналу (мы уже говорили о них), являются структурированными (легко представляются в виде таблицы), количественными и относительно небольшими по объему (не более терабайта или двух даже в очень крупных компаниях). Такие данные традиционно использовались в аналитике, поэтому назовем их малыми данными. Долгое время аналитики ни с чем другим дела не имели.

Но сегодня крупные компании, некоммерческие организации и даже стартапы сталкиваются с так называемыми большими данными – неструктурированными массивами информации колоссальных объемов. Их источниками могут быть онлайновые дискуссии в интернете, видеоматериалы или данные анализа ДНК пациентов больницы. У данных такого рода объем намного больше – иногда тысячи петабайт[3]. Например, Google обрабатывает порядка 24 петабайт интернет-данных ежедневно, а AT&T[4] передает по телекоммуникационным сетям около 30 петабайт музыки и прочих данных в день. Благодаря новым прикладным компьютерным программам и техническим новшествам мы можем анализировать огромные массивы данных и извлекать из них полезную информацию.

Что такое большие данные

Термин большие данные применяется для обозначения данных уникально большого объема или неструктурированных данных. Приведем несколько примеров:

• За месяц 600 миллионов пользователей Facebook добавили в сеть 30 миллиардов единиц контента.

• Компания Zynga, занимающаяся сетевыми виртуальными играми, ежедневно обрабатывает более петабайта игровой информации.

• Пользователи YouTube просматривают более двух миллиардов видеоклипов в день.

• Пользователи Twitter выполняют 32 миллиарда поисковых запросов в месяц.

• Пользователи Google в 2011 году выполняли почти 5 миллиардов поисковых запросов в день.

• В 2009 году ежедневно отсылалось более 2,5 миллиарда текстовых сообщений.

• В 2010 году население планеты использовало 5 миллиардов мобильных телефонов.

• Объем файла с полной расшифровкой человеческого генома составляет около одного терабайта.

• Беспроводной датчик для контроля физических параметров одной коровы передает около 200 мегабайт данных в год.

• В 2008 году количество подключенных к интернету устройств превысило численность населения земного шара.

• По оценке компании Cisco Systems, к концу 2011 года двадцать типичных домохозяйств генерировали более интенсивный интернет-трафик, чем все пользователи интернета в 2008 году.

• McKinsey & Company считает, что почти в каждой отрасли американской экономики компании с численностью персонала более 1000 человек накапливают в среднем больший объем информации, чем Библиотека Конгресса США.

Большие данные и основанная на них аналитика способны существенно изменить практически каждую отрасль экономики и бизнес-процессы в течение следующих десяти лет. Любая организация (и любой ее сотрудник), если вовремя ознакомится с сутью и методами обработки больших данных, получит огромное конкурентное преимущество. Точно так же как компании, в свое время первыми освоившие методы обработки малых данных, опередили своих конкурентов, сейчас на позиции лидеров выйдут те, кто раньше других сумеет использовать возможности больших данных.

Потенциал больших данных можно реализовать благодаря глобальным устройствам их сбора и обработки. Сенсоры и микропроцессоры в скором времени будут везде. Практически каждое механическое или электронное устройство регистрирует свои действия, местонахождение или состояние. Эти устройства и люди, их эксплуатирующие, поддерживают связь через интернет, а это еще один колоссальный источник данных. Если добавить к этому объемы информации, проходящие через прочие средства связи (беспроводные и проводные телефонные линии, кабели, спутники и т. п.), трудно даже оценить все перспективы.

Доступность всех этих данных означает, что практически любая предпринимательская или управленческая деятельность может рассматриваться либо как проблема больших данных, либо как возможность их обработки. Производство, в котором значительная часть оборудования оснащена одним или несколькими микропроцессорами, все чаще становится средой, где функционируют большие данные. Потребительский маркетинг с мириадами покупок и историй посещений покупателей также сталкивается с проблемой их обработки. Google даже описывала свою самоходную повозку из будущего как проект, связанный с обработкой больших данных.

Гэри Лавмен, CEO[5] компании Caesars Entertainment (известный своим выражением «Мы так полагаем или мы знаем?»), глава Amazon Джефф Безос («Мы никогда не пренебрегаем данными») и Рид Хоффман, руководящий LinkedIn («Web 3.0 – это сеть с новым типом данных»), публично заявляли, что аналитическое мышление и принятие решений – это надежный способ обеспечить успех компании и свой личный успех. Любая компания в любой отрасли заинтересована в том, чтобы извлечь пользу из вала данных. Для этого требуются люди, умеющие провести их детальный анализ. У них разные имена, но всех их называют квантами[6], и эта книга предназначена не им. А еще компаниям нужны люди, способные принимать оптимальные решения на основе анализа и воплощать их в жизнь. Именно для них написана эта книга. Это вовсе не те самые кванты, не аналитики, у них нет математической подготовки, но им приходится работать с количественными данными и принимать решения на основе их анализа.

Какую пользу вы извлечете из этой книги

У нас, авторов, по этому вопросу разные мнения, но общая цель: расширить применение аналитического мышления в бизнесе и обществе, в первую очередь помогая не-квантам извлекать больше пользы из массивов данных. Том вообще не очень-то серьезно относится к квантам, будучи социологом по образованию и не слишком хорошо разбираясь в статистике, но ему приходится заниматься аналитикой и определять направления ее применения в бизнесе. В течение двадцати лет Том вел исследования, писал книги, обучал студентов и консультировал компании по вопросам формирования аналитического потенциала. Его опыт работы с менеджерами и обучения их аналитическим исследованиям лег в основу этой книги. Кроме того, Том – автор и соавтор бестселлеров Competing on Analytics («Аналитика как конкурентное преимущество»)[7] и Analytics at Work («Аналитика в работе»), в которых рассказывается о том, какую роль аналитика играет в разработке стратегии больших компаний. В предлагаемой вниманию читателей книге основное внимание уделено тому, как помочь сотрудникам развить аналитические навыки и способности.

Джин Хо в университете учился именно деловому администрированию и статистике и, естественно, стал убежденным квантом. Он исследовал применение аналитических методов для решения разнообразных проблем в бизнесе и общественной деятельности. Кроме того, он разработал и вел образовательный курс по развитию аналитических способностей сотрудников. Джин Хо получил в Корее звание профессора делового администрирования и статистики, написал шесть книг, в том числе 100 Common Senses in Statistics («100 здравых смыслов в статистике») и Freak Statistics («Причудливая статистика»). Главная их цель – помочь людям без статистической или математической подготовки лучше понимать и интерпретировать статистические данные и результаты.

Мы надеемся, что эта книга поможет вам разобраться в аналитике и уверенно использовать статистическую информацию. Она облегчит сотрудничество с квантами и научит на равных дискутировать с ними об аналитических процедурах и методиках. Вы заговорите языком количественного анализа и сможете задавать правильные вопросы. Может быть, она даже вдохновит вас на то, чтобы стать квантом!

Информированный потребитель аналитических данных

У менеджеров, тесно сотрудничающих с аналитиками, множество вариантов того, как можно использовать количественно-аналитические данные для обоснования своих действий. Вот, например, какие решения недавно приняла Дженнифер Джой, вице-президент отделения клинических исследований и управляющая колл-центром компании Cigna, ведущей в отрасли здравоохранения. Колл-центр активно работает с клиентами, стремясь улучшить их состояние, особенно если у них хроническое заболевание (например, диабет или болезни сердца), требующее постоянного лечения и контроля. Это способствует повышению качества медицинских услуг. Джен в свое время работала медицинской сестрой и не занималась аналитикой. Но она получила степень магистра делового администрирования и считает, что аналитика очень важна для компании. На ее примере легко убедиться в том, что два ключевых аспекта аналитического мышления – умение определять проблему и задавать правильные вопросы – помогают сберечь деньги для компании и ее клиентов.

Ключевой вопрос в работе Джой – сколько времени следует уделять консультированию клиентов Cigna через колл-центр по поводу того, как предотвратить хроническое заболевание или замедлить его развитие. Она стремится доказать, что можно одновременно создавать дополнительную ценность для потребителей и контролировать издержки компании. Ключевая итоговая переменная для Джой – это частота первоначальной и повторной госпитализации пациентов. С одной стороны, она просматривает десятки страниц ежемесячных отчетов, где отражена динамика этого показателя. Процент повторной госпитализации то повышается, то понижается, и Джой не уверена, что понимает, почему так происходит: «Мне приходится изучать множество разных показателей, но это всего лишь цифры, они не отвечают на вопрос, что из этого следует». Но ей действительно хотелось бы выяснить, помогают ли пациентам звонки в колл-центр компании и влияют ли они на частоту повторных госпитализаций.

Чтобы лучше понять причинно-следственную связь между этими показателями, Джой обратилась к экспертам по аналитике в Cigna. Группу аналитиков в компании возглавляет Майкл Казинс. Он и его коллеги решили помочь Джой разобраться в возникшей проблеме. По словам Майкла, «хотя Джен и не специалист по методике анализа причинно-следственных связей, у нее блестящая логика, пытливый ум и она умеет задавать правильные вопросы. У нее нет математической подготовки, но она придает огромное значение аналитике». Джен относится именно к тому типу лиц, принимающих решения, с которым аналитики особенно любят работать.

Группа Казинса специализируется на применении аналитики для нужд бизнеса Cigna. Майкл и его коллеги целиком разделяют мнение Дженнифер о том, что показатель частоты госпитализаций не слишком полезен сам по себе, вне связи с вопросом о влиянии консультаций ее врачей на здоровье пациентов. Иными словами, предшествующие отчеты, показывавшие то повышение, то понижение частоты госпитализаций, были основаны на методике, которая не искала решения проблемы. В частности, не проводилось обоснованное сравнение с контрольной группой, результаты которого можно было бы использовать при принятии решения. В прошлом, например, отчеты не учитывали степень тяжести заболевания тех или иных пациентов. Группа Казинса разработала методику парной группировки пациентов в зависимости от тяжести заболевания, демографических параметров, образа жизни, региона проживания. Один из пары пациентов, у которых эти показатели были похожими, пользовался консультационными услугами колл-центра, а второй – нет. Казинс подчеркнул, что «Джой потребовалась определенная решимость, чтобы проверить, действительно ли эффективна консультационная служба, ее любимое детище. И все же она без колебаний приступила к выяснению истины».

Полученные результаты свидетельствовали: консультации врачей колл-центра по поводу некоторых болезней оказались вовсе не столь эффективны, как ожидалось; зато по другим заболеваниям картина была обратной. Джой решила сократить время телефонных консультаций для пациентов из целевой группы с определенными заболеваниями на тот период, пока не удается выяснить, как сделать их более эффективными. Для контрольной группы предполагалось внедрить консультации, способные принести реальную дополнительную ценность.

В то же время Джой продолжала совместную работу с группой Казинса над другими аналитическими проектами. Один из них – контролируемый эксперимент с разными подходами к консультированию, например с включением в процесс консультаций персонального врача пациента. Вместо того чтобы полагаться на интуицию, решая, какой подход сработает лучше, Джой с энтузиазмом реализовывала идею структурированной аналитики, например пилотные программы типа «тестируй и учись», в соответствии с которыми в год выполнялось двадцать или тридцать тестов.

Дженнифер Джой всегда отличалась аналитическим складом ума, но благодаря сотрудничеству с аналитиками она получила инструменты, позволяющие проверять различные гипотезы и принимать обоснованные решения. И хотя так и не удалось отыскать идеальный способ лечить болезнь по телефону, но Cigna по крайней мере тратит меньше денег на неэффективные формы работы с пациентами и больше на те, которые доказали свою эффективность. С другой стороны, Майкл Казинс и его коллеги извлекли большую пользу из работы с Джой и другими аналитически мыслящими топ-менеджерами компании. Они научились излагать результаты исследований языком бизнеса и объяснять их смысл пациентам.

Вот почему эту книгу мы писали для множества Дженнифер Джой в разных уголках мира, а не для Майклов Казинсов. Мы не предлагаем вам стать квалифицированным количественным аналитиком или специалистом по базам данных. Для этого потребуется намного больше, чем просто прочесть книгу, да и не у каждого есть к этому интерес и способности. Но мы предлагаем стать компетентным пользователем данных и аналитики. Тогда вы сможете правильно ставить задачу аналитикам, использовать данные в своей работе, принимать на их основе решения и пропагандировать их применение в вашей организации. Мы хотим, чтобы о вас говорили как о человеке, глубоко увлеченном аналитикой, или как о Джен Джой из Cigna: «Сама она не аналитик, но понимает их и ценит их работу». Мы не ожидаем, что вы сами начнете проводить сложный анализ баз данных, но очертить поле поиска решения, поставить нужные вопросы о данных и методологии их анализа, интерпретировать полученные ответы и на их основе повысить эффективность действий компании вы сможете. Если перефразировать заведующего кафедрой статистики Гарвардского университета Сяо Лименга, цель этой книги не в том, чтобы сделать из вас винодела (так он называет обладателей степени PhD[8] по статистике), а в том, чтобы привить вкус к хорошему вину[9].

В прошлом в большинстве случаев было куда трудней стать компетентным пользователем информации, не ориентируясь в методах и приемах ее получения и обработки. Но сегодня в этой области произошли большие перемены. Теперь не надо до тонкостей разбираться в устройстве двигателя внутреннего сгорания, чтобы стать хорошим водителем; точно так же не обязательно вникать в детали статистического анализа, чтобы использовать статистические данные для принятия решений. Аналитическое программное обеспечение взяло на себя черновую работу, иногда даже может выбирать методику анализа, соответствующую характеру данных и переменных. Некоторые новые программы (например, от компании SAS) имеют справочную функцию, простым и понятным языком объясняющую смысл тех или иных зависимостей или характер методов, применяемых для прогнозных расчетов.

Хотя потребность в квалифицированных потребителях аналитики высока, на текущий момент нет книг, просто и без математического сленга написанных для новичков в области количественного анализа. В этой книге говорится о том, что такое аналитика, как можно ее использовать во многих жизненных ситуациях и как развить свои аналитические способности. Это поможет вам не только лучше разбираться в аналитике, но и значительно эффективнее обсуждать со специалистами различные аналитические методы и их применение для решения проблем компании. В соответствии с отчетом международной консалтинговой компании McKinsey Global Institute о больших данных за 2011 год, экономике требуются более полутора миллионов компетентных в аналитике менеджеров, чтобы эффективно использовать данные, накапливаемые обществом[10]. Надеемся, что вы станете одним из них.

Роль аналитики в принятии решений

Решения в коммерческих и некоммерческих организациях принимают исходя из целого ряда факторов: опыта, интуиции, результатов экспериментов, аналитических исследований и накопленных данных. В книге Moneyball, посвященной применению аналитических процедур в профессиональном бейсболе, говорится, что одно это отнюдь не гарантирует неизменно положительного результата. Команда Oakland Athletics выигрывала далеко не каждую игру описанного в книге сезона, да и всех последующих тоже. Тем не менее аналитика способна обеспечить некоторое конкурентное преимущество тем, кто в ней разбирается. Oakland Athletics добивается гораздо лучших результатов, чем можно было бы ожидать с учетом ее более чем скромного бюджета.

Конечно, ответственный менеджер вполне способен принять удачное решение, руководствуясь лишь интуицией и опытом, особенно когда решение лежит в сфере его непосредственной компетенции. Но почти в каждой области деятельности можно найти доказательства того, что решения, принятые на основе анализа данных, более точны и эффективны, обеспечивают больший выигрыш для организации[11]. В настоящее время в профессиональном бейсболе практически каждая команда применяет аналитические подходы, разработанные в Oakland Athletics. Даже команда New York Yankees, некогда чуть ли не гордившаяся отказом от аналитики в вопросах подбора игроков и определения стратегии игры, сейчас пригласила на работу 21 специалиста по спортивной статистике.

В коммерческих организациях традиционная аналитика чаще всего применяется для поддержки внутренних решений компании: «Сколько должен стоить этот продукт?» или «Как стимулировать покупателей совершать у нас покупки?» Аналитика в среде больших данных часто используется для разработки новых видов продуктов или дополнительных потребительских свойств. Например, Google создала PageRank – алгоритм ранжирования для поиска, социальная сеть LinkedIn – функцию «Люди, которых вы можете знать» или «С кем я могу связаться в сети», а компания Zynga – новые игры. Все эти продукты и свойства стали результатом управленческих решений или компаний, или их потребителей. (На рис. 1.1 «Типы управленческих решений, которые требуют аналитической поддержки» приведены еще некоторые примеры.)

Рис. 1.1. Типы управленческих решений, которые требуют аналитической поддержки

Маркетинг

• Ценообразование

• Размещение торговых точек и региональных подразделений

• Целевое продвижение продуктов

• Дизайн сайта компании

• Размещение рекламы в электронных СМИ

Поставщики

• Объем складских запасов

• Размещение дистрибьюторских центров и складов

• Маршруты доставки продуктов или движения транспорта

• Загрузка транспорта

Финансы

• Факторы финансовой деятельности

• Сбалансированная система показателей

• Различные виды прогнозов

Персонал

• Каких сотрудников нанимать

• Кто из сотрудников собирается уволиться

• Какой должна быть сумма выплат и компенсаций

• Какое образование предпочтительно для сотрудников

Исследования и разработки

• Какие потребительские свойства продукта больше всего привлекают потребителей

• Насколько эффективно производство и продажа продукта

• Какой дизайн продукта максимально привлекает потребителей

И это только то, что лежит на поверхности. В других отраслях и секторах экономики (государственном управлении, здравоохранении, спорте и других) можно найти массу подобных образцов.

Тот, кто принимает решения, оценивает возможные варианты решений с учетом информации как количественного, так и качественного характера. Источники качественной информации включают интуицию, опыт, здравый смысл, житейскую мудрость, слухи и предположения. Иногда они оказываются полезными, однако нужно помнить об их недостатках. Даже если у вас богатый опыт принятия решений в той или иной области, очередная ситуация может оказаться непохожей на предыдущие. Принимать решения на основе предположений всегда рискованно, а интуиция может вас обмануть. Большинство людей слишком полагаются на нее при принятии решений. Экономическая школа «Поведенческая экономика» исходит из постулата о том, что интуиция – далеко не лучший советчик при принятии экономических решений.

Несмотря на все достоинства аналитических исследований, бывают ситуации, когда нецелесообразно опираться на них при принятии решения. Если проблема слишком незначительна, носит единовременный характер или решение зависит от личных предпочтений, нет особого смысла тратить время на сбор и анализ данных, построение аналитической модели. Если действовать нужно быстро, то заниматься анализом просто некогда. Напротив, если решения приходится принимать периодически, есть время на проведение анализа, а проблема достаточно серьезна, чтобы оправдать и затраты, и труд, то аналитический подход будет весьма полезен.

Три этапа аналитического подхода и порядок их выполнения

В центре внимания в этой книге – три основных этапа аналитического подхода, каждому из которых посвящено по главе. Приводятся примеры аналитических задач, для которых особенно важен тот или иной этап. Схематически эти этапы вместе с входящими в них шагами показаны на рис. 1.2.

Рис. 1.2. Три этапа и шесть шагов количественного анализа

Формулирование проблемы
1. Определение проблемы
2. Изучение предыдущих поисков решения
Решение проблемы
3. Моделирование ситуации
4. Сбор данных
5. Анализ данных
Результаты и необходимые меры
6. Демонстрация результатов и дальнейшие действия

В главе 2 рассказывается о первом этапе – формулировании проблемы. Он включает в себя постановку вопросов, на которые предстоит ответить аналитику, и поиск формулировки для проблемы, которую нужно решить. Понятно, что это очень важный этап, ведь если сформулировать проблему некорректно, никакие данные или процедуры анализа не помогут ее преодолеть. Этот этап включает два шага: определение проблемы и изучение предыдущих поисков решения. В главе 2 мы увидим, что после того, как проблема определена и сформулирована для решения аналитическими методами, как правило, оказывается, что некоторые ее аспекты уже рассматривались другими исследователями ранее, и это помогает уточнить формулировку.

Второй этап рассматривается в главе 3 и охватывает наиболее интересующие читателей методы решения проблемы. На этом этапе вам предстоит отобрать переменные для будущей модели, собрать данные об их значениях за определенные периоды, а затем провести анализ. Допустим, вы вовсе не квант и не имеете особого желания им становиться. Тогда выход один: поручить большую часть этих работ количественному аналитику. Тем не менее очень полезно знать хотя бы в общих чертах, что и как тот собирается делать. Вам не обязательно решать всю проблему самостоятельно, но если вы будете уметь задавать правильные вопросы и понимать общие принципы анализа, то это, безусловно, поможет вам найти лучшее решение.

В главе 4 рассматривается третий и последний этап количественного анализа, ничуть не менее важный, чем остальные, но часто игнорируемый, – оформление результатов анализа и принятие необходимых мер. От того, как вы расскажете о результатах анализа, в определяющей степени зависит, станут ли они толчком к дальнейшим действиям. Если тот, кто принимает решения (возможно, это вы и есть), не понимает, в чем именно заключается проведенный анализ и что означают полученные результаты, то вряд ли они станут основой для управленческих решений. Тогда не стоит и тратить время на прохождение первых двух этапов. Мы живем в информационно перегруженном мире, в котором трудно привлечь к чему-то внимание. Вот почему особенно важно подать результаты анализа в интересной, захватывающей форме. Сейчас уже нельзя представлять информацию в виде толстого отчета, переполненного сухими цифрами, и при этом надеяться, что для кого-то они станут стимулом к действию.

В остальных главах рассматриваются некоторые частные вопросы аналитического подхода. В частности, в главе 5 мы говорим о роли креативности в аналитической работе: оказывается, эти понятия вполне совместимы! В главе 6 описаны несколько способов развития аналитических способностей для тех, кто почувствовал вкус к аналитике. Глава 7 посвящена налаживанию конструктивных взаимодействий менеджеров и квантов для принятия более эффективных решений. Нечего и говорить, что успех этих взаимодействий зависит от обеих сторон. Мы приводим много разнообразных примеров, иллюстрирующих возможности использования аналитических методов для решения проблем (или, напротив, то, как из-за пренебрежения ими возможности были упущены; см. вставку «Почему опасно пренебрегать аналитическими методами»). Кроме того, в этой главе показаны примеры расчетов и описаны самые простые возможности применения аналитики, для внедрения которых не требуется много времени и сил.

Почему опасно пренебрегать аналитическими методами

Мы учимся как на положительных, так и на отрицательных примерах, но почему-то отрицательные обычно производят более сильное впечатление. Трудно найти более яркий образец, чем история Джо Кассано, практически в одиночку доведшего до кризиса огромную компанию, а заодно и экономику США, да черт возьми, всего мира!

Кто же такой Кассано и чего он не знал об аналитике? Возможно, вы вспомните этого человека, если назвать его должность – глава AIG Financial Products (AIGFP), подразделения с четырьмя сотнями сотрудников, входящего в состав гиганта страховой отрасли AIG. Именно он несет ответственность за потерю компанией колоссальной суммы денег, о точной ее величине все еще идут споры, но что-то около 85 миллиардов долларов. Столько американским налогоплательщикам пришлось заплатить, чтобы удержать AIG на плаву и погасить ее долги.

Не один Кассано терял деньги, но, по словам расследовавшего эту историю репортера Мэтта Тайбби из журнала Rolling Stone, он был «виновником № 1 мирового экономического кризиса»[12]. Тайбби описывал его как «толстого лысеющего коротышку с глазами-бусинками и высоким лбом, окончившего Бруклинский колледж», хотя это не имеет особого отношения к нашей истории. Уверены, если бы он зарабатывал деньги вместо того, чтобы их терять, его внешность показалась бы репортеру более привлекательной.

Итак, к чему же привело пренебрежение аналитикой и количественным анализом? AIGFP потеряла эти деньги в результате активной продажи финансового продукта, называемого кредитным дефолтным свопом (CDS) и представляющего собой своего рода страховку ипотечных деривативов. Репортер New York Times Гретчен Моргенсон вскоре после этих событий писала: «Хотя крах рынка жилой недвижимости в США часто называют непосредственной причиной кризиса, надо отметить, что экономическая система в целом отличалась неустойчивостью из-за широкого распространения загадочных ценных бумаг – кредитных деривативов, предоставлявших кредиторам страховку на случай неплатежеспособности должников. Их выпускали частным образом, не привлекая внимания регуляторов фондового рынка, а иногда и не слишком включая мозги менеджеров, ответственных за их выпуск»[13].

Кассано уж точно оказался одним из топ-менеджеров, не перегружавших мозги размышлениями о последствиях. И деривативы, и CDS принадлежат к числу сложных финансовых инструментов, разрабатываемых методами статистического и математического анализа, но, как позже выяснилось, на этот раз математика и статистика подвели. Если ипотечные заемщики оказывались неплатежеспособными, деривативы обесценивались и AIG сталкивалась с необходимостью выплачивать их держателям страховую стоимость ценных бумаг. Стоит ли говорить, что именно это и произошло?

Майкл Левис описал суть проблем подразделения AIGFP в журнале Vanity Fair[14]:

«Трейдеры AIGFP считают загадкой причины, приведшие их компанию к катастрофе. А начиналось все просто – с изменения процедуры принятия решений новым руководством. В конце 2001 года второй по счету генеральный директор компании Том Саваж ушел в отставку и на эту должность назначили его бывшего заместителя Джо Кассано. Саваж имел солидную математическую подготовку и хорошо разбирался в моделях оценки риска, применявшихся трейдерами AIG для гарантии получения достаточной компенсации. Кроме того, Саваж любил и часто проводил внутрикорпоративные обсуждения достоинств тех или иных моделей, а также сделок. Новый генеральный директор намного хуже разбирался в математике и не имел особого желания вести дискуссии по этим вопросам.

Кассано не слишком беспокоился о том, насколько точна оценка риска и адекватны ли модели, на основе которых она получена. Он не задавал лишних вопросов аналитикам AIG и Уолл-стрит, разрабатывавшим эти модели. Он просто продавал CDS всем, кто желал их купить. Мысль о том, что их цена рассчитана на основе неверных допущений, в частности о том, что люди, бравшие эти недорогие ипотечные кредиты, окажутся неспособны их выплатить, кажется, никогда не приходила ему в голову. И даже если приходила, то не слишком его беспокоила».

Развить в себе аналитические способности путем самостоятельных занятий очень сложно. Мы создали специальный сайт (http://keepingupwiththequants.weebly.com), где читатели могут задавать любые вопросы об аналитике, аналитических процедурах или трудностях, с которыми приходится сталкиваться при решении конкретных проблем. Не стесняйтесь обращаться туда со всем, что показалось непонятным. На сайте подробно проанализированы некоторые ситуации, описанные в этой книге. Периодически мы будем ссылаться здесь на этот сайт.

Глава 2

Формулирование проблемы

Хотя в мире существует множество разных видов количественного анализа, все они имеют некоторые общие черты и порядок проведения. Как мы уже говорили в главе 1, количественный анализ включает три основных этапа и шесть шагов.

Формулирование проблемы

• Определение проблемы

• Изучение предыдущих поисков решения

Решение проблемы

• Отбор переменных и разработка модели

• Сбор данных

• Анализ данных

Результаты и необходимые меры

• Демонстрация итогов и дальнейшие действия

В этой главе и в главах 3 и 4 мы рассмотрим по отдельности каждый этап и шаг, а также приведем несколько примеров количественного анализа, которые включают в себя все шесть шагов и показывают их отличительные особенности в той или иной ситуации. В конце каждой главы для иллюстрации шести шагов даны два примера, обычно один – из сферы бизнеса, а второй – из сферы общественных или личных отношений. Наша трехэтапная и шестишаговая методика выполнения количественного анализа не единственная в своем роде (например, существует методика анализа отклонений качества продукции «Шесть сигм», направленная на обеспечение уровня брака не выше 3,4 единицы на миллион единиц произведенной продукции), но мы думаем, что большая часть экспертов-аналитиков одобрят ее. К тому же она достаточно гибкая, чтобы помочь выявить и проанализировать множество разнообразных проблем в бизнесе.

Шаг 1. Определение проблемы

Количественный анализ начинается с идентификации проблемы и подходов к ее решению. В анализе принятия решений этот этап называется формулированием проблемы и считается одним из наиболее важных для получения оптимального решения. Информацию для формулирования проблемы можно получить разными способами:

• обыкновенное любопытство (здравый смысл, наблюдение за событиями);

• опыт работы;

• потребность в решении либо действии;

• актуальные события, требующие внимания (сотрудника, организации в целом, нации);

• ранее проводившиеся исследования и уже существующие концепции;

• разработка проектов решений и анализ имеющегося и необходимого финансирования.

1. Формулирование проблемы

Заметим, что на этом этапе анализ как таковой пока отсутствует. Решение о проведении анализа часто принимают на основе интуитивных догадок. Особых доказательств их правильности не требуется. Главная цель количественного анализа в том и состоит, чтобы путем исследования массива данных проверить правильность интуитивной догадки. Аналитики отличаются от других людей именно тем, что тестируют свои предположения, используя массивы данных и аналитические процедуры.

На этапе формулирования проблемы самое главное – глубоко осознать, в чем ее суть и что делает ее актуальной. Именно правильный ответ на эти два вопроса позволяет не только оценить, что нам может дать ее решение, но и спланировать действия на последующих этапах.

Кто заинтересован в результатах?

Очевидно, что в наибольшей степени в результатах анализа заинтересованы менеджеры и те, кто принимает решение (владельцы бизнеса и менеджеры, ответственные за конкретные корпоративные вопросы). Тем не менее даже на этом этапе опытные количественные аналитики, имеющие представление о сути проблемы, процедурах принятия решений и возможных методах количественного анализа, могут оказать существенную помощь. Если не удается найти одного человека, разбирающегося во всех этих вопросах, надо создать группу, включив в нее тех, кто обладает необходимыми компетенциями.

Стоит серьезно задуматься: кто составит основной круг заинтересованных в результатах предполагаемого анализа и что они думают по поводу проблемы, для решения которой анализ проводится?

Оцените тех, кто заинтересован в результатах анализа

Если вы не можете ответить «да» на большинство приведенных вопросов, предполагаемый аналитический проект с самого начала под угрозой провала.

1. Знаете ли вы, кто именно из топ-менеджеров кровно заинтересован в результатах количественно-аналитического проекта?

2. Имеют ли они представление о проблеме и возможных вариантах ее решения?

3. Могут ли они предоставить необходимые ресурсы и внедрить преобразования, необходимые для успеха проекта?

4. Готовы ли они использовать аналитику и анализ данных в процессе принятия решений?

5. Соответствуют ли предлагаемая методика анализа и способы ее представления их традиционному образу мышления и методам принятия решений?

6. Предусмотрели ли вы меры для регулярного информирования и обратной связи с теми, кто заинтересован в результатах анализа?

Обладают ли они необходимыми полномочиями, чтобы предпринимать какие-либо действия на основе полученных результатов? Может быть, они не уверены в существовании проблемы, для решения которой разрабатывается аналитический проект? Можно ли их убедить в необходимости принятия мер, диктуемых результатами анализа?

Аналитики вообще склонны сразу переходить к выбору методики и способов анализа, не слишком задумываясь о тех, кто будет пользоваться результатами их труда. Чем больше они полагаются на свои аналитические навыки, тем меньше беспокоятся о распространении результатов и переходе к действиям.

Если вы убеждены, что вашему аналитическому проекту нужно внешнее руководство, то следует принять некоторые меры. Они, в частности, включают:

1) выявление всех заинтересованных в результатах анализа;

2) документирование их требований;

3) оценку и анализ интересов и сфер влияния тех, кто заинтересован в результатах анализа;

4) управление их ожиданиями;

5) принятие мер;

6) контроль результатов предпринятых действий и повторный анализ[15].

Анализ пользователей позволяет установить, кто является ключевыми лицами, принимающими решения, и достаточно ли убедительными окажутся для них результаты аналитического проекта. Даже наиболее корректный и точный аналитический подход окажется бесполезным, если его результаты не побудят к действиям тех, кто принимает решения. Иногда имеет смысл применить даже сомнительный с методологической точки зрения аналитический подход, если он окажется единственным средством убедить пользователей в достоверности полученных результатов.

Вот пример. Рон Дубофф возглавляет компанию по маркетинговым исследованиям и стратегиям Hawk Partners. Вообще говоря, он убежден в том, что количественный анализ полезен и продуктивен практически в любой ситуации. Но он давно уже понял, что некоторые топ-менеджеры не понимают, какие он дает возможности для изучения покупательских потребностей и пожеланий, и гораздо больше доверяют качественным методам изучения спроса, например методике целевых групп. Суть ее такова: отбирают небольшую группу фактических или потенциальных покупателей, которым предлагают ответить на несколько вопросов о продуктах компании, при этом наблюдая за их реакцией и фиксируя ответы. Дубофф считает, что целевые группы – это методологически сомнительный подход. Специалистам по маркетинговым исследованиям хорошо известно, что покупатели склонны говорить то, что интервьюеры хотят от них услышать. Так что если они утверждают, что им нравится продукт, это еще не означает, что они будут его покупать. Опытный руководитель исследования целевой группы в некоторой степени может сгладить эту проблему, но результаты опроса нельзя распространять на более широкую аудиторию. Тем не менее Дубофф считает, что хоть какое-то изучение лучше, чем никакого, и если топ-менеджер доверяет результатам опроса целевых групп и не доверяет результатам количественного анализа, то пусть будет целевая группа.

Подобным же образом те, для кого предназначены результаты анализа, могут помочь определить, как и в какой форме их представить в отчете. У всех разные предпочтения о том, как лучше преподносить количественные данные: кто-то предпочитает табличную форму, кто-то графики и диаграммы, а еще кто-то – текст, описывающий количественные закономерности. Очень важно выявить эти предпочтения на относительно ранней стадии. Если данные предназначены для компьютерной обработки (а такое бывает все чаще и чаще по мере полной или частичной автоматизации процедур принятия решений), то не имеет смысла разрабатывать идеальный формат визуального представления. Просто скормите компьютеру цифры, и это окупится!

Может оказаться, что те или иные аналитические подходы лучше других помогают вовлечь пользователей в процесс анализа. Например, в компании Cisco Systems при выборе метода прогнозирования было установлено, что статистические методы позволяют получить намного более точные и надежные прогнозы (мы приведем описание всех шести шагов этого проекта в главе 7). Некоторые топ-менеджеры сразу поддержали эту идею, но кое-кто сомневался, что прогноз окажется более качественным. Руководитель проекта Энн Робинсон решила применить поэтапный подход: каждые несколько недель появлялись новые результаты, которые немедленно сообщали всем заинтересованным. Такое постоянное предъявление новой порции результатов помогло пользователям осознать преимущества проекта и втянуться в его выполнение. В итоге даже наиболее скептически настроенные менеджеры убедились в том, что прогнозы, полученные с помощью статистических методов, надежнее, делаются быстрее и охватывают более широкий круг продуктов, чем при применении прежних качественных методов.

Сконцентрируйтесь на решении

Мы обнаружили, что фокусировать внимание на конкретных решениях, которые будут приниматься по итогам анализа, весьма полезно уже на этапе формулирования проблемы. Тому есть много причин. Во-первых, внимание к будущим решениям заставляет всех участников проекта помнить о том, что количественный анализ проводится не просто из любопытства, а с конкретной практической целью. Во-вторых, внимание к ключевым решениям помогает определиться с ключевым «потребителем» результатов анализа – человеком или группой людей, которые будут принимать решение на основе полученных результатов. В-третьих, если не удается определить, какие решения будут приняты по итогам, то возникает вопрос: целесообразно ли проводить исследование?

Вот как описывает переговоры с клиентом на этапе формулирования проблемы Майк Томпсон, SEO фирмы First Analytics. Клиент, представитель сети ресторанов, считал, что первоочередным вопросом для анализа должна стать рентабельность продуктов. Топ-менеджеры сети ресторанов хотели, чтобы First Analytics оценила, насколько рентабельно каждое блюдо в их меню. Майк разделяет мысль о том, что необходимо сосредоточиться на будущих решениях уже на этапе формулирования проблемы, поэтому он спросил, какие решения его собеседники собираются принять по итогам анализа рентабельности. Последовало долгое молчание. Один менеджер предположил, что ключевым должно стать решение о том, оставить ли блюдо в меню. Но другой отметил, что за последние двадцать лет в их ресторанах не было случаев исключения блюд из меню. После короткой дискуссии представители клиента пришли к выводу, что в фокусе анализа должна быть не рентабельность, а цена блюд. «Мы периодически меняем цены на протяжении всего времени существования», – заявил один из менеджеров.

Какой проект количественного анализа вам нужен

Если вы определили, какие решения собираетесь принимать, можно переходить к следующему этапу анализа – изучению предыдущих попыток решить проблему. В главе 4 мы поговорим о том, какую историю могут рассказать данные, именно в этом состоит лучший способ ознакомить с результатами анализа неспециалистов. Уже на первом этапе нужно начинать думать о том, какого рода эта история и как вы будете ее рассказывать, хоть многие ее детали и станут известны позже, уже в процессе анализа. Конечно, она связана с числами. Существует по меньшей мере шесть видов проектов количественного анализа. Рассмотрим их и приведем примеры.

Проект CSI: полиция Майами. Некоторые проекты количественного анализа напоминают детективные телесериалы, только в них вопросы бизнеса «расследуются» методами количественного анализа. Обнаруживается определенная проблема, и анализируются данные, для того чтобы удостовериться в правильности ее идентификации и найти пути решения. Часто в такой ситуации не нужен углубленный статистический анализ – достаточно корректно подготовленных и представленных данных. В интернет-магазинах, например, каждый щелчок покупателя мышью несет в себе огромное, иногда даже слишком, количество информации для анализа.

Одним из главных действующих лиц в нашей «следственной истории» станет Джо Меджибов – вице-президент и SEO онлайнового туристического агентства Expedia из США. Когда-то Джо был специалистом по веб-аналитике. Он и сейчас им остается, и его подходы к решению бизнес-проблем на основе количественного анализа данных привели к нескольким блестящим решениям.

Во многих онлайновых исследованиях Expedia возникал вопрос о том, почему транзакции по некоторым заказам не завершаются. В частности, руководство отеля хотело выяснить, почему уже в процессе оформления заказа не удается довести дело до перечисления средств на счет компании. Анализ данных показал, что после выбора отеля и заполнения формы с данными о сроках путешествия и стоимости номера, а затем щелчка по кнопке «Оплатить сейчас» часть транзакций оказываются незавершенными. Группа аналитиков под руководством Меджибова решила разобраться в причинах неудач, используя систему показателей интернета и лог-файлы операций, хранящиеся на сервере.

Очевидно, проблемы возникали из-за поля «Компания», размещенного под полем фамилии клиента. Некоторые клиенты считали, что в нем надо указать название банка, эмитировавшего их кредитную карту, а в поле «Адрес, на который будет направлен счет» указывали адрес этого банка. В результате в процессе списания средств с карты клиента операция отменялась как некорректная. После того как поле «Компания» просто убрали из формы, прибыль Expedia возросла на 12 миллионов долларов. Меджибов говорит, что специалисты Expedia расследовали несколько таких историй, и это всегда либо приносило фирме дополнительную прибыль, либо эффективность операционной деятельности повышалась.

Иногда расследование требует более глубокого статистического и количественного анализа. Один из сотрудников Меджибова изучал вопрос о том, какие точки взаимодействия с покупателями важнее всего для стимулирования продаж. Аналитик использовал регрессионную модель Кокса – метод, обычно используемый для прогнозирования вероятности дожития пациентов до определенного момента в будущем; «анализ выживаемости». Оказалось, что более простые модели, применявшиеся ранее, давали искаженную информацию о том, какие маркетинговые подходы наиболее эффективны. Меджибов прокомментировал это так: «Мы и не знали, сколько денег утекает сквозь наши пальцы»[16].

Проект «Эврика!». Проекты этого типа напоминают проекты CSI, но только целенаправленно подходят к выявлению и решению проблемы в отличие от ситуаций, когда трудности возникают неожиданно. Обычно рассматриваются проблемы, порождаемые глобальными переменами в стратегии компании или ее бизнес-модели. Как правило, такие аналитические проекты требуют больше времени для реализации и предполагают больший объем статистического и математического анализа. Иногда проекты типа «Эврика!» включают в себя элементы проектов других видов, поскольку ожидаемые результаты очень важны для заказавших анализ организаций.

Вернемся к анализу в компании Expedia. Встретился там и проект типа «Эврика!», когда требовалось отменить штрафы за перенос сроков и отмену бронирования номеров в отелях, туров и автомашин. До 2009 года Expedia и ее конкуренты взимали до 30 долларов за перенос сроков или отмену брони – в дополнение к соответствующим санкциям со стороны отелей. При заказе отеля через Expedia или другие онлайновые агентства номер обходился клиентам значительно дешевле, чем при заказе непосредственно в отеле, поэтому они мирились со штрафами за перенос или отмену заказа. Но к 2009 году стало ясно, что это превратилось в проблему. Стоимость номера при заказе через Expedia существенно приблизилась к расценкам самих отелей, поэтому Expedia сделала упор на удобство обслуживания, а штрафы за перенос и отмену бронирования стали неудобны. Аналитики изучили коэффициенты удовлетворенности клиентов, и оказалось, что у тех, кому пришлось платить этот штраф, уровень удовлетворенности существенно ниже. Сотрудники колл-центра Expedia имели право отменить штраф только по одной причине – в случае смерти кого-либо из членов семьи клиента. Темпы роста численности освобожденных от штрафа по этой причине за последние три года составляли двузначную цифру. То ли в это время свирепствовала эпидемия с высоким процентом смертельных исходов, то ли клиенты поняли, что это единственный способ вернуть свои деньги.

Топ-менеджеры агентства поняли, что на рынке туристических услуг произошли существенные изменения, но штрафы за отмену и перенос сроков бронирования составляли значительную часть общей выручки. Возник вопрос, как поведет себя коэффициент перехода контактов в продажи (то есть процент оплативших номер по отношению к числу приславших заявку), если отменить эти штрафы. В апреле 2009 года Expedia объявила о временном (сроком на месяц) моратории на штрафы за перенос сроков и отмену бронирования (в чем-то похоже на историю об эксперименте сумасшедшего ученого, описанную ниже). Коэффициент перехода контактов в продажи существенно вырос. Топ-менеджеры поняли, что получено достаточно доказательств того, что отмена штрафов целесообразна, и очень скоро примеру Expedia последовали другие компании отрасли.

В центре Сиэтла находится штаб-квартира компании Zillow, предоставляющей информацию о жилой недвижимости в регионе. Вероятно, эта компания известна в среде квантов прежде всего благодаря разработанному ее сотрудниками алгоритму Zestimates, позволяющему рассчитать стоимость объектов недвижимости. Но, как и в Expedia, корпоративная культура Zillow построена на культе данных и аналитики, что и неудивительно, поскольку основателем обеих этих компаний является Рик Бартон.

Один из проектов типа «Эврика!» посвящен глобальной проблеме: реорганизации отношений с агентами по недвижимости. Zillow начала работать с агентами по недвижимости в 2008 году, а до этого взаимодействовала непосредственно с покупателями. Особенность бизнес-модели, построенной на работе с агентами, в том, что компания рекламирует своих агентов и направляет к ним потенциальных покупателей. За каждого покупателя с агента взимаются комиссионные, но, с точки зрения топ-менеджеров, их размер недостаточен. Директор Zillow по продуктам и стратегии Хлоя Харфорд особенно заинтересована в разработке адекватной модели оптимизации комиссионных за направленных к агентам покупателей.

Харфорд, получившая ученую степень по вулканологии, уже проводила довольно сложные математические анализы раньше. Тем не менее она и ее коллеги первоначально полагалась на методы, которые называли «расчетами на салфетке», чтобы оценить другие пути, позволяющие привлечь больше потенциальных покупателей и установить справедливые комиссионные с агентов. В апреле 2010 года Zillow внедрила новую модель взаимоотношений с агентами, немедленно скопированную конкурентами и включавшую помимо прочего продажу рекламных услуг агентам. В результате поток контактов с потребителями резко возрос, причем они были переключены непосредственно на агентов. Zillow также внедрила интеллектуальный алгоритм расчета комиссионных за потенциальных покупателей с учетом их экономической стоимости и коэффициента перехода контактов в продажи. Конкуренты в той или иной степени старались повторить эти новшества, но не в таком объеме, как Zillow. Контакты потенциальных покупателей и определение комиссионных за их направление к агентам настолько важны для Харфорд и ее коллег, что постоянно тестируются различные подходы к их оценке, в том числе и с использованием методов, описанных в истории о безумном ученом. Коротко говоря, проекты «Эврика!» тесно связаны с моделью бизнеса компании и ее коммерческим успехом.

Проект «Сумасшедший ученый». Мы знаем, как широко распространены научные эксперименты в высокотехнологичных отраслях, например фармацевтической. Производящие лекарства компании тестируют продукты на целевых и контрольных группах, давая членам последних плацебо (лекарства-«пустышки», вещества без лечебных свойств). Они уделяют огромное внимание соблюдению случайного метода распределения участников между целевой и контрольной группами, чтобы их состав был однородным и не влиял на оценку эффективности лекарства. Этот действенный аналитический прием делает возможным причинно-следственный анализ и распространение выводов, сделанных на основе данных, полученных в целевой группе, на генеральную совокупность.

Строгий эксперимент больше не является прерогативой одних только ученых; сейчас он стал аналитическим приемом, необходимым каждой крупной компании. Сейчас широко распространено программное обеспечение, помогающее менеджерам и аналитикам проводить анализ. Компании получили возможность принимать решения на основе строго научных экспериментов. В прошлом любое вторжение в область рандомизированного тестирования (случайного распределения участников целевой и контрольной групп, о котором мы только что говорили) требовало приглашения дипломированного специалиста по статистике или по разработке научных экспериментов. Теперь магистр делового администрирования, прошедший курс статистического анализа, вполне может организовать процесс с помощью нужного программного обеспечения, помогающего определить численность целевой и контрольной групп, сайты для тестирования и контроля, а также сделать оценку статистической значимости любых отклонений, выявленных в ходе эксперимента.

«Проекты сумасшедших ученых» особенно удачно подходят для розничных сетей с многочисленными супермаркетами, банков с множеством отделений и других подобных компаний. Это упрощает использование части торговых точек или отделений в качестве целевых, а остальных – в качестве контрольных. Стало легко проводить эксперименты на сайтах, где часть посетителей можно направить на одну версию интернет-страницы, а вторую часть – на другую ее версию, а потом проверить, окажутся ли результаты существенно отличными (это называется А/В тестированием в сфере исследования сайтов).

Некоторые примеры «проектов сумасшедших ученых» приведены ниже[17].

• Способствует ли установка аквариумов с живыми омарами их продажам в супермаркетах Food Lion? Видимо, ответ будет утвердительным, если покупатели этого супермаркета уже привыкли покупать здесь омаров (то есть принадлежат к группе лиц со сравнительно высокими доходами), и отрицательным, если обеспеченные покупатели не заходят сюда.

• Увеличится ли общая выручка супермаркета Kmart, если часть его торговых площадей отвести под магазины супермаркета Sears? Председатель совета директоров компании Sears Holdings Эдди Ламперт является большим поклонником рандомизированного тестирования. Он протестировал различные комбинации использования торговых площадей. На этот конкретный вопрос у нас ответа нет, но можно предположить, что если бы он был положительным, то таких комбинированных супермаркетов было бы гораздо больше.

• Какие из сети ресторанов морепродуктов Red Lobster (с высоким, средним или низким уровнем цен) обеспечивают максимальный объем продаж и что важнее для привлечения клиентов: внешний вид ресторана или его внутренняя отделка? Топ-менеджеры Red Lobster утверждают, что наибольшие продажи обеспечивают рестораны средней ценовой категории. Внешний вид ресторана играет очень большую роль в привлечении новых клиентов, но если они увидят, что его внутренняя отделка не соответствует внешнему виду, то второй раз в этот ресторан не придут.

Проект «Опрос». Опросы – это классический метод количественного анализа. Аналитики, проводящие их, имеют дело с уже произошедшими или происходящими в данный момент событиями. Аналитик не пытается повлиять на результаты, он только наблюдает, классифицирует и анализирует их. В типичном случае интервьюер стремится выявить статистически значимую зависимость между рядом исходных и рядом изучаемых факторов или переменных. Самый простой пример – опрос в выборке покупателей конкретного продукта об их личных характеристик, в том числе демографических (возраст и пол). Задавая вопросы о том, какие продукты они предпочитают, можно выяснить, пользуется ли конкретный продукт спросом в большей степени у мужчин, чем у женщин, будут ли определенные продукты пользоваться спросом преимущественно у молодых покупателей.

Опросы весьма популярны и несложны с точки зрения организации и проведения. Однако следует помнить, что полученные результаты могут существенно отличаться в зависимости от постановки вопросов и изменения их формулировок с течением времени. Например, Бюро переписи населения США десятилетиями работает над формулировкой вопроса о национальной принадлежности граждан. Количество вариантов ответа на этот вопрос постоянно увеличивается; в 2010 году предлагалось выбрать из пятнадцати вариантов, в том числе «другая национальность». Этот ответ пользовался большой популярностью среди граждан США – латиноамериканцев: 18 миллионов из более чем 50 миллионов отметили именно его[18]. Если уж вопрос о национальности вызывает столько сомнений, то что говорить о таких скользких темах, как политика, религия, социальный статус или сексуальные привычки!

Кроме того, нам следует помнить, что сама по себе связь между двумя переменными еще не говорит о ее причинно-следственном характере. Мы поговорим об этом подробнее в главе 6, а пока просто отметим, что вполне могут существовать и другие переменные, оставшиеся за рамками анализа; именно они, возможно, обусловливают выявленную зависимость. Опросы предполагают выяснение убеждений или отношений людей к тем или иным событиям, но их вопросы не должны задевать эмоции интервьюируемых. Рассмотрим в качестве классического примера (приводимого во многих учебниках по статистике) устроенный во время Второй мировой войны опрос об организации ремонта самолетов.

Во время Второй мировой войны нужно было обеспечить максимально длительное функционирование самолетов, поэтому было решено выяснить, можно ли сократить количество трудоемких ремонтов моторов без роста аварийности. Был проведен ретроспективный опрос о самолетах, потерпевших катастрофу, и вопреки всем ожиданиям оказалось, что количество аварий из-за проблем с моторами достигало максимума непосредственно после ремонтов, а затем постепенно снижалось. В результате было принято решение существенно удлинить интервалы между ремонтами и, естественно, пересмотреть их характер, чтобы убедиться в том, что все гайки и болты затянуты как надо[19].

Если вы планируете провести опрос или проанализировать его результаты, сначала убедитесь, что смысл включенных в анкету вопросов, равно как и отобранных для анализа переменных, тщательно продуман. Переменной называется любая количественно измеримая характеристика параметров людей, ситуаций или поведения с двумя или больше уровнями или вариантами значений. Пол, балл на экзамене, температура в помещении, любовь, счастье, сплоченность команды – все это примеры переменных.

Кроме того, важно убедиться, что выборка для опроса репрезентативна для той группы населения, которую вы собираетесь тестировать. Способы проведения опроса могут повлиять на результаты. Например, если хотите изучить поведение молодежи или ее отношение к чему-то, не стоит нанимать маркетинговую компанию, проводящую опросы исключительно по стационарным телефонам. Да, это стандартный способ их проведения, но мы ведь знаем, что у многих молодых людей просто нет стационарных телефонов, да они и не собираются ими обзаводиться. В результате выборка для молодежи будет нерепрезентативной[20].

Проект «Предсказание». Все проекты этого вида имеют целью прогнозирование того, что должно произойти в будущем. Получить надежную информацию о грядущих событиях довольно трудно, но если речь идет о прошлых событиях и их причинах, то для количественного аналитика это несложно. Обычно проекты такого рода относятся к предсказательной аналитике или предсказательному моделированию.

Проекты вида «Предсказание» весьма разнообразны. Приведем некоторые ситуации, в которых они целесообразны.

Реакция на коммерческое предложение. Кто из покупателей мог бы отреагировать на разосланное по электронной почте коммерческое предложение с бесплатной доставкой продукта в течение двух рабочих дней при сумме заказа 50 долларов или больше?

Кросс-продажи и продажи более дорогих версий продукта. Кто из клиентов, имеющих чековый счет с остатком более 2000 долларов, мог бы купить одногодичный депозитный сертификат под 1,5 процента в год в течение одного месяца с момента рассылки коммерческого предложения?

Убыль персонала. Кто из сотрудников, проработавших более шести месяцев и еще не подписавшихся на программу страхования 401(k), уволится в течение следующих трех месяцев?

Существует много других вариантов того, как можно применить результаты предсказательного анализа. В бизнесе чаще всего нужно определить, какое именно коммерческое предложение, скорее всего, примет потребитель. Более сложные варианты анализа «следующего по привлекательности предложения» все чаще проводятся с помощью прикладного программного обеспечения. Во-первых, содержание коммерческих предложений нужно хранить в тайне, пока не наступит время довести его до потребителя; во-вторых, таких предложений могут быть сотни и даже тысячи.

Например, Microsoft, как мало кто другой, постоянно разрабатывает все новые усовершенствования для своей поисковой системы Bing (поисковик бесплатный, поэтому компания старается таким образом просто привлечь как можно большее количество пользователей). Эти новшества побуждают вас испробовать предлагаемый поисковик, ввести панель инструментов Bing в браузер, испытать дополнительные свойства Bing и т. п. Модификация поисковика в соответствии с предпочтениями пользователя производится по разным параметрам: возраст, место жительства, пол, часто посещаемые сайты и т. п., определяемым на основе cookies[21] пользователя и других источников. Если вы когда-нибудь получали идентификатор Microsoft Passport, то компания располагает еще большим объемом информации о вас, и это позволяет формировать «коммерческое предложение» целенаправленно. С помощью программы Infor Epiphany Interaction Advisor компания Microsoft имеет возможность мгновенно формировать и отсылать адресное электронное сообщение в тот момент, когда вы щелкаете мышкой по заголовку сообщения в почте: это занимает около 200 мс. По словам представителей компании, это средство отлично работает на повышение коэффициента конверсии веб-узла.

Зачастую проекты вида «Предсказание» весьма напоминают ловлю рыбы сетью. Мы точно не знаем, какие именно факторы позволят сделать обоснованный прогноз, поэтому тестируем все и отбираем те, которые срабатывают. Иногда это дает неожиданные результаты. Например, в ситуации с усовершенствованием поисковика Bing, о котором мы только что рассказали, оказалось, что в зависимости от количества контактов пользователя в Microsoft Messenger можно с уверенностью предсказать, захочет ли он использовать Bing.

Google поставила цель выяснить, какими особенностями отличаются наиболее эффективные сотрудники компании. Анализ показал, что те критерии, на которые компания обращала внимание изначально, – диплом университета и рейтинг по итогам собеседования – практически бесполезны при прогнозировании будущей эффективности работы. Поскольку неизвестно было, какие критерии окажутся более надежными, сотрудникам предложили заполнить анкету из трехсот вопросов. Как отметил начальник отдела персонала Google Ласло Бок, «мы решили забросить очень широкую сеть. В нашей компании нет ничего необычного в том, чтобы выйти в коридор и наткнуться на человека с собакой. Может быть, у владельцев собак есть общие черты характера, говорящие об их творческих качествах?»[22]

Вряд ли привлечение собак к прогнозированию даст какой-либо результат, но Google все же удалось найти некоторые неожиданные критерии. Например, если претендент на рабочее место ставил мировые или национальные рекорды в любой области, учреждал некоммерческую организацию или клуб, то чаще всего он оказывался высокоэффективным работником. Сейчас Google включил вопросы об этом в свои онлайновые анкеты для претендентов на вакансии.

Конечно, если обнаруживаются факторы, которые демонстрируют связь с анализируемыми параметрами, но при этом сами по себе бессмысленны, стоит вернуться к самому началу и проверить доброкачественность исходных данных и корректность методики анализа. Однако в большинстве случаев анализ массивов данных более эффективен, чем прогнозы на основе качественного анализа. Только учтите, что предсказательные проекты основываются на информации за прошлые периоды для прогнозирования событий в будущем. Если со времени проведения последнего анализа в мире что-то изменилось, то полученный прогноз может оказаться недостоверным.

Проект «Что случилось, когда…?» Проекты, описывающие ряд событий и показателей на основе собранных данных, распространены наиболее широко. Они представляют структурированные данные: сколько единиц продукта было продано, за какой период и где, какие финансовые результаты продемонстрировала компания в прошлом квартале, сколько человек взяли на работу в прошлом году. Поскольку эти проекты ориентированы в основном на отчетные данные, сложные математические методы в них, как правило, не используются, и может показаться, что они очень просты в исполнении. Но колоссальный рост данных, генерируемых современными организациями, привел к тому, что аналогично возрос и объем отчетности на их основе. Вот почему иногда бывает сложно привлечь внимание целевой аудитории к создаваемым и распространяемым отчетам.

Этот вид проектов особенно полезен, когда требуется наглядно представить данные. Достаточно сказать, что если в ваших отчетах в основном таблицы, заполненные цифрами, вряд ли вы привлечете внимание аудитории. Кое-кто скажет, что устал от обилия графиков и цветных диаграмм, но большинство наверняка считают, что они более понятны, чем цифры на бумаге. Поскольку в главе 4 мы подробно рассматриваем, какими способами можно проинформировать о результатах анализа, там же поговорим и о том, как сделать цифровые отчеты более интересными и привлекающими внимание.

Масштаб проблемы

По определению, у аналитического проекта, основанного на количественном анализе, узок круг рассматриваемых вопросов, поскольку требуется сбор данных и проверка на их основе некой гипотезы (см. вставку «Примеры проверяемой гипотезы»). Трудно собирать данные по широкому кругу. Но на этом этапе важно не сузить преждевременно масштабы рассматриваемой проблемы или будущего решения. Взгляд на проблему должен быть достаточно широким для того, чтобы выделить несколько возможных вариантов решения. Например, если организация считает, что в отдельном подразделении или регионе возникла проблема с эффективностью деятельности, то причин этого может быть много – начиная от недовольства потребителей до производственных факторов или особенностей продуктов и услуг.

Примеры проверяемой гипотезы

• Анализ видов продуктов, пользовавшихся спросом в прошлом году, лучше всего поможет понять, на какие коммерческие предложения, рассылаемые по электронной почте, мы получим максимальный отклик в будущем.

• Продолжительность учебы является надежным критерием будущей эффективности деятельности сотрудников на должностях, требующих высокого уровня компетентности.

• Десятипроцентные скидки с цены продуктов за неделю до праздников менее эффективны, чем скидки, введенные в другое время.

• Размещение товара на витрине в конце прохода наиболее эффективно с точки зрения стимулирования продаж.

• Наших покупателей можно разделить на четыре группы в зависимости от того, какие продукты они предпочитают.

• Возможность повышать цены на продукты стандартного качества и при этом не вызвать сокращения спроса существенно уменьшается в годы экономической рецессии.

• Наши подразделения, централизовавшие склады, предпочитают поддерживать меньший операционный запас материалов для производственного процесса.

В примере с компанией Transitions Optical, приведенном в конце этой главы, к идентификации и формулированию проблемы менеджеров подтолкнуло смутное ощущение, что маркетинговые расходы избыточны. Однако из области решений было выбрано только одно, включавшее комплексную оптимизацию маркетинговых расходов и привлечения средств массовой информации.

Мы называем первый этап количественного анализа формулированием проблемы, но его же можно назвать и выявлением возможностей. Британский инженер Джозеф Джаггер (1830–1892) понял, что есть возможность сорвать банк в казино Монте-Карло[23]. Он приобрел опыт работы с машинами и механизмами на хлопкопрядильных фабриках Йоркшира. Это помогло ему понять принципы движения колеса рулетки и предположить, что под действием механической неисправности одни цифры выпадают чаще, чем другие. А что если использовать эту неисправность в своих интересах? Он поехал в Монако, чтобы проверить свое предположение.

На колесе рулетки французского/европейского образца есть цифры от 1 до 36, а также 0. Если колесо делает один оборот, то теоретическая вероятность выпадения каждого номера равна 1/37. Таким образом, удельный вес числа выпадений каждого номера при большом количестве оборотов колеса также равен 1/37. Джаггер предположил, что разбалансированность колеса приведет к тому, что вероятность выпадения определенных чисел превысит 1/37.

Эти рассуждения побудили Джаггера нанять шестерых помощников для наблюдения за шестью столами с рулеткой в легендарном казино Beaux-Arts в Монте-Карло. Каждый помощник получил инструкции относительно записи результатов всех розыгрышей на своем столе. Проанализировав результаты, Джаггер понял, что на пяти столах числа, как и ожидалось, выпадали случайным образом. Но на шестом столе девять чисел (7, 8, 9, 17, 18, 19, 22, 28 и 29) выпадали чаще, чем остальные. Джаггер сделал вывод, что у колеса на этом столе имеется какой-то дефект, нарушающий его балансировку. Свои первые ставки на этом столе он сделал 7 июля 1875 года и быстро выиграл приличную сумму (14 тысяч фунтов стерлингов – в 2012 году она равнялась бы примерно 840 тысячам фунтов стерлингов, или более 1,3 миллиона долларов с учетом инфляции). Казино разобралось, в чем состоит выигрышная стратегия Джаггера, и в конце концов нейтрализовало ее. Но к этому моменту он уже успел выиграть сумму, равную более чем шести миллионам современных долларов. Это и есть возможности аналитики!

Решите, что конкретно вы хотите выяснить

Страницы: 12345 »»

Читать бесплатно другие книги:

Впервые на русском – новейший бестселлер от создателя таких готических триллеров, как «Тень автора» ...
«Венгерская рапсодия» – сборник лучших эротических новелл. В книге собраны чувственные, невероятно у...
Пособие содержит информативные ответы на вопросы экзаменационных билетов по учебной дисциплине «Крим...
Братьям Димке и Лешке Оболенским попала в руки таинственная записка, расшифровав которую можно найти...
В данной шпаргалке изложены основные вопросы и ответы по дисциплине "Криминология".Предложенный мате...
Когда у тебя три сестры, то и проблем в три раза больше, чем обычно. А если к тому же все сестры бли...