О чем говорят цифры. Как понимать и использовать данные Дэвенпорт Томас
Результаты и необходимые меры. Дизайн первых супермаркетов Homeplus в Ансане обеспечивал такую же приятную обстановку для покупок, как в универсальных магазинах, зону отдыха для покупателей на первом этаже с ресторанным двориком на 400 посадочных мест, аптекой, медпунктом, магазином оптики, автоматической прачечной, отделением банка, детской игровой площадкой, комнатой ухода за младенцами и даже государственным центром по обслуживанию населения, выдававшим удостоверения личности. Культурный центр сделал супермаркет не просто местом для покупок, но и крупнешим центром общения в округе. Все эксперты по розничной торговле, увидев планировку этажей, дружно качали головами и заявляли о нарушении базовых принципов дизайна супермаркетов. С их точки зрения, размещать относительно малоприбыльные общественные удобства на весьма дорогой площади первого этажа не имело никакого смысла. Для супермаркетов считалось особенно важным эффективное управление торговыми площадями, чтобы получать максимум прибыли с каждого метра торговой площади. Поэтому размещение на первом этаже Культурного центра было расценено как нонсенс. Посетители из компании-партнера Tesco тоже выражали сомнения: «Не лучше ли было бы разместить на первом этаже скоропортящиеся продукты, фрукты и овощи, чтобы они сразу попадались на глаза покупателям? Не кажется ли вам, что такая планировка в большей мере соответствовала бы сути розничного бизнеса?» Но Ли ответил: «Генеральный директор уже принял такое решение, а у нас эту должность занимают покупатели», – и продолжил в том же духе.
Homeplus в Ансане, ставший первым «магазином ценности» в Корее, уже в день открытия побил рекорд по объему дневных продаж: этот показатель в полтора раза превысил показатели двух расположенных поблизости конкурирующих супермаркетов, вместе взятых, а число покупателей достигло ста тысяч и примерно равнялось численности населения в радиусе пяти километров. Покупатели немало удивлялись дизайну торговых залов, царившей в них атмосфере, ну а таких общественных удобств они нигде ранее не встречали.
Несмотря на это, эксперты продолжали утверждать, что супермаркет не просуществует и года. Но Homeplus продолжала расти и ставить рекорды с открытием каждого нового супермаркета. Магазин, открывшийся в районе Сеула Yongdeongpo в 2001 году, обеспечил более высокий объем продаж, чем в универсальном магазине. Взрывной рост продаж и бизнеса существенно укрепил репутацию компании не только на местном, но и на международном рынке. Об этом много писали инвестиционные аналитики.
«Homeplus сумел уникальным образом объединить удивительное маркетинговое чутье с передовыми технологиями розничных продаж».
«Концепция этого супермаркета резко отличалась от концепций конкурентов».
«Объем продаж Homeplus просто невероятен».
Конкуренты начали преобразовывать свои «магазины-склады» в «магазины ценности», но и на этом фоне супермаркеты Homeplus выделялись уникальным сервисом (например, созданием школ для обучения взрослых). По состоянию на 2011 год, такие школы открыты в 110 из 124 супермаркетов компании, расположенных во всех уголках страны. В них обучаются более миллиона человек в год и работают около шести тысяч инструкторов. Это крупнейшая программа по обучению взрослых в мире. Homeplus видит огромное преимущество школ для взрослых в том, что они укрепляют лояльность покупателей. Очень многие утверждают, что именно эти школы – главная причина их приверженности компании. В среднем слушатель школы тратит за один визит в супермаркет Homeplus в два раза больше, чем обычный покупатель, и заходит за покупками в два раза чаще. Ну а положительные отзывы миллиона слушателей школ Homeplus, данные их друзьям и знакомым, – это мощное средство укрепления бренда компании.
Глава 5
Креативность в количественном анализе
В один из дней 275 года до н. э. в общественную баню вошел молодой человек. Погрузившись в ванну с горячей водой, он заметил, как вода начала переливаться через бортики. Внезапно он подскочил и, как был голым, побежал домой, крича «Эврика! Эврика!» Видевшие эту сцену прохожие наверняка решили, что парень сошел с ума. Это был Архимед, а эврика на греческом языке означает «Я нашел!» Расскажем вкратце, что же нашел Архимед и почему его это так взволновало. Предварительно отметим, что для решения своей проблемы он использовал одновременно количественный анализ и творческий подход.
Часто считается, что количественный анализ и креативность несовместимы. Креативный подход отличается стремлением к поиску, свободой мышления, вдохновенностью и способностью к провидению. Количественный же анализ воспринимается как скучные, рутинные упражнения с цифрами. Поэтому мы интуитивно ощущаем, что креативный подход и количественный анализ – это противоположные по сути явления, хотя и тесно связанные. Наиболее успешные примеры применения аналитики очень креативны (надеемся, что это уже доказано приведенными в книге историями), да и вообще креативность – важная составляющая аналитического подхода к проблеме. Мы попробуем доказать, что одна только креативность, без сбора информации и аналитики, не может обеспечить оптимального решения. Нам постоянно встречались образцы того, что наиболее успешные люди и организации сочетали креативность с количественным подходом.
В наши дни Apple часто называют одной из самых творческих компаний на планете. Действительно, продукты компании выглядят очень нестандартно. Но тем не менее это не мешает компании строго контролировать производственный процесс и применять аналитику в организации поставок, чтобы удостовериться в том, что необходимые продукты будут готовы к моменту отгрузки. В своих розничных магазинах Apple, к примеру, собирает и анализирует огромное количество данных. В одной статье говорилось: «Когда продукт поступает в продажу, компания может отслеживать спрос в каждом магазине сети за определенный период и на этой основе ежедневно корректировать планы производства»[64]. В описании требований к претенденту на вакансию менеджера в розничной цепи магазинов Apple среди прочего сказано, что успешный кандидат должен «сочетать актуальные знания о цепи поставок продуктов компании мирового уровня, выдающиеся аналитические способности и предпринимательскую жилку»[65]. Если даже высококреативные компании вроде Apple требуют аналитических навыков от большинства своих сотрудников, то в будущем мы, скорее всего, увидим еще больше разнообразных сочетаний креативности и аналитики.
Конечно, креативность в сочетании с аналитикой может представлять угрозу. Возможно, вы слышали о книге Даррела Хаффа «Как обмануть с помощью статистики» (How to Lie with Statistics), вышедшей в 1954 году. Даже из названия понятно, что знающий основы аналитики мошенник способен использовать количественный анализ для искажения правды[66]. Мы часто слышали, как в шутку говорят: «Мы просто пытали статистиков, пока они не сознались». Между допустимой и недопустимой креативностью применительно к аналитике грань довольно тонкая. Критерием тут можно считать искреннее стремление выяснить правду. Если же вы творчески используете аналитику, чтобы доказать правильность вашей (или вашего босса) идеи и при этом обращаете мало внимания на то, что числа упорно не хотят ложиться в заданную схему, то лучше не усердствовать с креативностью и переключиться на другую гипотезу.
Краткий обзор шести шагов количественного анализа
Сначала сделаем краткий обзор того, каким образом творческий подход мог бы вписаться в наши шесть шагов реализации аналитического проекта (описанных в главах 2, 3 и 4). Затем рассмотрим те применения креативного подхода, которые выходят за рамки стандартного процесса количественного анализа.
На шаге определения и формулирования проблемы творческий подход чрезвычайно важен и полезен. Половина дела в решении проблем и принятии решений состоит в креативном подходе к формулированию проблемы; именно это позволяет решить ее максимально эффективно. Именно на этом шаге аналитического процесса аналитик разрабатывает гипотезу о закономерностях, имеющихся в данных. Это творческий и интуитивный акт. В определенном организационном и деловом контексте, с учетом ограничений креативная формулировка проблемы может изменить сам контекст, заставить рассматривать его с других точек зрения, сократить или исключить ограничения. Например, в уравнении цены вина, описанном в главе 3, Орли Ашенфельтер сформулировал проблему цены как показателя, который можно спрогнозировать на основании одних только погодных факторов и возраста вина. Аналогично в исследовании продолжительности браков, описанном в главе 4, Джеймс Мюррей и Джон Готтман весьма творчески предположили, что продолжительность брака можно прогнозировать на основе анализа отношений между супругами. Очень часто применительно к аналитическим исследованиям креативность означает, что целый ряд сложных факторов можно прогнозировать и объяснить на основе намного более простых и легко измеримых факторов.
Очевидно, что обзор результатов предшествующих исследований не назовешь самым творческим шагом, но и здесь существует возможность проявить креативность, решая вопрос о том, какие именно предшествующие исследования теснее всего связаны с текущим. Например, процедура анализа «дожития» традиционно применяется в тех ситуациях, когда требуется выяснить причины и уровень смертности людей или других живых существ. Однако один из исследователей, Хун Сянлу, успешно применил ее для прогнозирования ценности, получаемой зрителями на протяжении всей жизни в области телекоммуникаций[67]. Другие исследователи применили ту же процедуру для решения иных проблем маркетинга, в частности оценки готовности покупателя купить тот или иной товар[68].
Моделирование (выбор переменных), несмотря на аналитическое название, также может быть творческим делом, особенно если вы впервые используете данную модель. Выбор переменных для модели иногда очевиден и определен предшествующими исследованиями или интуицией, а иногда может стать по-настоящему креативным. Вспомним хотя бы анализ длины употребляемых в тексте слов для определения авторства Марка Твена, описанный в главе 3. Для Клода Бринегара это был умеренно креативный шаг, поскольку о таком методе анализа он и раньше читал в книгах. Зато для Томаса Менденхолла это определенно был весьма творческий подход, поскольку он впервые применил его для установления авторства Шекспира. Конечно, если вы используете такой же подход к разработке модели и выбору переменных, как и все остальные исследователи, то, скорее всего, получите такие же результаты, как у остальных. Тогда зачем вообще тратить время на этот анализ?
Сбор данных сам по себе довольно скучен, но решение вопроса о том, какие именно данные собирать, несет в себе массу креативности. Хотите ли вы изучать поведение людей, крыс или атомов, нужно найти какой-то способ наблюдать и оценивать интересующие вас явления, которыми, может быть, никто до вас и не интересовался.
Социальные психологи Михай Чиксентмихайи и Рид Ларсон хотели исследовать эмоции и отношения в среде тинейджеров. Чтобы собрать данные о том, как меняются эмоции подростков на протяжении дня, пришлось разработать уникальный метод. Исследователи раздали пейджеры 75 старшеклассникам и набрали группу студентов университета, поручив им в течение дня в произвольные моменты посылать школьникам на пейджер запрос о том, какие чувства они испытывают сейчас. Этот метод сбора данных получил название метода выборки переживаний и ныне широко используется в психологических исследованиях[69].
Исследователи не слишком удивились тому обстоятельству, что в течение большей части дня тинейджеры чувствовали себя несчастливыми. Но то, что их настроение переключается на позитив, когда им нужно выполнить трудное и ответственное задание, оказалось по-настоящему неожиданным. В 1984 году по итогам эксперимента вышла книга Being Adolescent: Conflict and Growth in the Teenage Years, в которой впервые Чиксентмихайи описал особое состояние увлеченности и вдохновения, получившее название потокового. Впоследствии именно оно оказалось предметом большей части исследований психолога[70]. По сути, Михай весьма творчески собирал данные о креативности!
Анализ данных считается неподходящим шагом для проявления креативности, если только вы не разбираетесь профессионально в математике и статистике, но и в этом случае лучше действовать осторожнее. Это именно тот этап аналитического процесса, креативность на котором может закончиться большими неприятностями. Любой статистический эксперимент или математический анализ имеет исходные предпосылки и ограничения; пренебрегать ими не стоит, разве что вы действительно знаете, что вы делаете.
В противоположность этому на шаге обнародования результатов и принятия мер творческий подход жизненно важен, но не так уж часто к нему прибегают. Поскольку слушатели без специальной подготовки обычно не воспринимают результаты анализа, изложенные математическим или техническим языком, хороший аналитик должен проявить креативность, придумав, как оформить их в понятном и даже забавном виде. Например, не стоит рассуждать о значениях коэффициентов или доле объясняемой вариации. Вместо этого формулируйте выводы примерно так: «Если мы увеличим расходы на рекламу на доллар, то в среднем получим 1,29 доллара дополнительной выручки». Это звучит гораздо более доступно для понимания и принятия необходимых мер, чем технические рассуждения. Для того чтобы перевести аналитику на доступный язык, как раз и требуется проявить творческий подход.
Четыре этапа креативного аналитического мышления
Мы не сторонники выделения очень уж большого количества этапов и шагов, но, возможно, будет полезно поговорить о том, каким образом процесс креативного аналитического мышления вписывается в те шесть шагов, о которых мы говорим в этой книге. В целом креативность включает четыре последовательных этапа.
Подготовка. Подготовительная работа для решения проблемы.
Погружение. Интенсивное погружение в решение проблемы и анализ имеющихся данных. Обычно от аналитика требуются настойчивые и длительные усилия для оптимального решения.
Созревание. Проблема «отлеживается» в подсознании, что включает нестандартное мышление (нередко проявляющееся в тот момент, когда аналитик растерян и готов сдаться).
Озарение. Большой прорыв в понимании путей решения проблемы с помощью методов количественного анализа.
Обычно большая часть обзора предшествующих исследований и выбора переменных для модели по данной классификации приходится на этап подготовки. Этап погружения включает часть шага моделирования, весь шаг сбора данных и часть шага анализа данных. Этап созревания начинается тогда, когда аналитик заходит в тупик на шаге анализа данных. Затем, когда внезапно приходит озарение, все части пазла сходятся. Графически все вышеизложенное представлено на рис. 5.1.
Рис. 5.1. Качественный анализ и креативность
Пример аналитического мышления: Архимед и корона
Проиллюстрируем наложение четырех фаз процесса аналитического мышления на шесть этапов количественного анализа на примере истории Архимеда – одного из первых известных в истории примеров креативного аналитического мышления[71].
Определение и формулирование проблемы. Тиран Сиракуз (Сицилия) Гиерон пожелал украсить храм, посвященный бессмертным богам, золотой короной в форме лаврового венка. Он отмерил точное количество необходимого золота и отдал золотых дел мастеру. В назначенный день мастер, к восторгу Гиерона, принес изящную корону тонкой работы, по весу равную полученному количеству золота. Но когда король уже готовился к церемонии подношения храму, до него дошли слухи, что корона сделана не из чистого золота. Якобы мастер заменил часть золота серебром (в те времена, как и сейчас, ювелиры частенько прибегали к такому мошенническому трюку). Гиерон заподозрил, что стал жертвой обмана. Но как это выяснить? Гиерон задал этот вопрос своим советникам, но те не смогли порекомендовать надежный способ. Наконец Гиерон поручил Архимеду до назначенного дня церемонии выяснить, не было ли разбавлено золото, и при этом ни в коем случае не повредить корону. Архимеду на тот момент было всего двадцать два года, но он уже был широко известен своими работами по математике и физике. Он принял вызов.
Обзор предшествующих исследований Тогда не существовало способа измерить объем предмета произвольной формы, поэтому Архимеду предстояло самостоятельно его найти. С этого начался этап подготовки. Архимед, возможно, один из величайших математиков и изобретателей всех времен, умел измерять объем большинства предметов правильной формы. Он рассудил, что, поскольку золото весит больше, чем серебро, то корона, изготовленная из сплава золота и серебра, при одинаковом весе должна иметь больший объем, чем корона из чистого золота. Проблема в том, как точно измерить объем предмета неправильной формы (короны), не повредив его.
Моделирование (выбор переменных). На том же этапе подготовки Архимед решил, что объем короны и будет ключевой переменной, вычислив которую можно будет ответить на поставленный вопрос. Но чтобы сделать это, требовалось полностью погрузиться в имеющиеся данные и возможные варианты измерения объема. Самый простой способ – переплавить корону в куб и измерить его грани. Но этого делать нельзя, ведь Гиерон приказал не повреждать ее. Ученый постоянно думал об этой проблеме и в конце концов решил отложить поиск решения на некоторое время. Однако, как он ни старался, найти ответ не удавалось.
Сбор данных. Погрузившись в проблему, Архимед должен был собрать некоторые данные. Он выяснил плотность золота и серебра и предположил, что сплав, из которого изготовлена корона, содержит 30 процентов серебра. Но как бы то ни было, требовалось измерить объем короны в форме лаврового венка, а он не знал, как это сделать.
Анализ данных. День церемонии подношения короны храму приближался. Расстроенный Архимед уже готов был признать поражение, пусть даже его репутация гениального математика и физика серьезно пострадала бы. Но в результате глубокого погружения в проблему мозг продолжал работать над ее решением на подсознательном уровне. Начался этап созревания. Как-то раз Архимед решил дать отдых телу и духу, изнуренному бесплодной борьбой с проблемой, отправившись в общественную баню. Когда он погрузился в горячую ванну (это другая форма погружения!), вода начала переливаться через борта. Внезапно математик понял, что объем вытесненной воды равен объему той части его тела, которая погружена в воду. Это означало, что найден способ точно измерить объем предметов неправильной формы: если погрузить корону в заранее известный объем воды и она вытеснит больше воды, чем такое же по весу количество золота, то отсюда можно будет сделать вывод о том, что объемы короны и бруска золота не равны. Он выскочил из ванны и голым помчался по улицам Сиракуз, радостно крича: «Эврика! Эврика!» Очевидно, что в этот момент на Архимеда снизошло озарение. Он провел эксперимент, погрузив в воду сначала корону, а потом брусок золота равного веса, и обнаружил, что их объем различен. Следовательно, можно было утверждать, что корона изготовлена не из чистого золота и мастер действительно добавил более дешевый металл, стремясь присвоить часть драгоценного материала.
Результаты и необходимые меры. Архимед сообщил о своем эксперименте тирану Гиерону, и тот восхитился изяществом найденного решения. Репутация Архимеда как гениального математика и физика еще более упрочилась. Однако далеко не для всех история кончилась благополучно, ведь нечистого на руку мастера казнили.
Креативность можно определить как способность генерировать оригинальные и полезные идеи. Пример Архимеда говорит о том, что с точки зрения количественного анализа креативность – это всего лишь способность видеть неочевидные связи между переменными, предварительно отобрав их для анализа и собрав необходимые данные. В соответствии с этим определением креативности можно научить и научиться, внедрить в практику повседневной деятельности. Человек может развить в себе творческий подход, приобретя аналитические навыки. Компании могут добиться того же, внедрив ряд образовательных программ по аналитике для сотрудников и создав корпоративную культуру, поощряющую аналитическое мышление.
Погружение и упорный труд как источники креативности и озарения
Томас Эдисон произнес знаменитую фразу: «Гений – это на 99 процентов труд и лишь на 1 процент – вдохновение». Творение – это озарение, нисходящее к человеку неожиданно и позволяющее решить проблему. Но откуда берутся творческие находки? Мы считаем, что это продукт упорного труда. Озарение и ведущее к нему креативное аналитическое мышление отнюдь не даются человеку от природы случайно – это результат упорного труда на ниве количественного анализа: анализа предшествующих исследований, отбора и измерения переменных, настойчивого поиска закономерностей, управляющих динамикой данных. Если вы каждый день без устали бьетесь над решением задачи и не сдаетесь, то в один прекрасный день сможете воскликнуть: «Эврика!» Именно это случалось с Архимедом, Ньютоном и многими другими гениями.
Американский ученый Барбара Макклинток в 1983 году получила Нобелевскую премию за открытие генной транспозиции. Она единственная женщина, единолично получившая Нобелевскую премию в физиологии и медицине. Во время своих полевых экспериментов она часто испытывала моменты «Эврика!» и говорила, что источник ее вдохновения – это забвение себя, полная погруженность в работу и подчинение всей жизни ей.
Макклинток настолько хорошо изучила кукурузные стебли, что, исследуя хромосомы, идентифицировала себя с ними:
Я обнаружила, что чем больше я работаю, тем большая часть моей личности ассоциируется с ними. Я уже не воспринимала себя отдельно от них; казалось, что я где-то там, внутри. Я стала частью системы. Казалось, я могу рассмотреть внутреннее устройство хромосом – все, что там было. Это было удивительно, ведь была полная иллюзия вхождения в клетку, а все, что там было, стало моими друзьями. Когда вы смотрите на них, то чувствуете, что они становятся частью вас. Вы забываете себя. Это самое главное: вы забываете себя[72].
Конечно, креативность и тяжелый труд ассоциируются не только с миром количественного анализа. Например, они точно так же присутствуют в мире искусства и литературы. Известный корейский автор Те Дзюн Ра тоже считает, что вдохновение не вспыхивает внезапно на пустом месте, а требует долгой и трудной подготовительной работы, погружения в тему.
Вы концентрируетесь и погружаетесь в одну тему, продолжая накапливать разнообразные идеи, а затем в один прекрасный момент вас озаряет вспышка, неожиданный полет вдохновения и вдруг становится понятно, что же вы так отчаянно искали все это время. Говорят, что вдохновение приходит внезапно. Это правда, если говорить о самом моменте озарения. Но до этого может потребоваться долгий и кропотливый труд. В конечном счете можно сказать, что глубина погружения в предмет и объем проделанной кропотливой работы предопределяют приход вдохновения[73].
Чаще всего интуицию определяют как непосредственное восприятие истины без всякого объяснения или логического обоснования. Однако мы верим в то, что интуиция – это качество, которое можно развить в себе путем постоянного анализа, как количественного, так и качественного. Нейробиологи считают, что нейроны можно «обучать» путем постоянного повторения анализа. Мы считаем, что точно так же способность к интуитивному восприятию развивается, если человек на основе накапливаемого со временем опыта пытается выявить взаимосвязи между переменными, не собирая и не анализируя для этого данные. Немецкий философ Георг Гегель считал, что только тот, кто способен мыслить глубоко аналитически, обладает чистой истинной интуицией[74].
Поиск моделей методами аналитической креативности
Суть креативного анализа данных состоит в выявлении модели отношений между переменными. Модель – это устойчивая неочевидная взаимосвязь переменных. На этом этапе математическое мышление весьма полезно, поскольку математика сама по себе является наукой о моделях: эвклидова геометрия, первая великая наука Древней Греции, развилась из наблюдения за геометрическими фигурами в окружающей природе. Теорема Пифагора – это не что иное, как модель зависимости между тремя сторонами прямоугольного треугольника.
Поиск моделей в современных организациях осуществляется главным образом путем статистического, а не чисто математического анализа. Некоторые статистические инструменты помогают выявить наличие в данных модели – связи, встречающейся чаще, чем можно было бы ожидать, если бы распределение было случайным. Анализ дает основания полагать, например, что потребители с определенной моделью покупательского поведения (или ее отсутствием) в тот или иной момент могут вообще прекратить покупки. Или что покупатели, приобретающие определенную книгу, часто покупают и другие: например, на сайте Amazon.com имеется встроенная функция рекомендаций. (Друг Тома Дэвенпорта получил от Amazon.com рекомендацию купить вместе с книгой Тома шуточный сувенир в виде собачьих экскрементов – по мнению сайта, именно такое сочетание предпочитают другие покупатели!) В табл. 5.1 представлены различные виды моделей, а также бесплатное и коммерческое программное обеспечение для их построения.
Таблица 5.1
Программное обеспечение для интеллектуального поиска данных для построения моделей на основе баз данных
Пример аналитического мышления: пиво и пеленки
Более подробно механизм выявления моделей на основе анализа массива данных можно проиллюстрировать на хорошо известном примере из области интеллектуального поиска данных: мужчины, заходящие в продовольственные магазины только по выходным, склонны вместе с пивом покупать пеленки. Это открытие было сделано отнюдь не в Древней Греции, а в Чикаго в 1992 году. Его определенно можно считать примером выявления модели поведения; другое дело, что вряд ли это удачный пример аналитического мышления (правда, мы считаем, что изучение и положительных, и отрицательных примеров в равной степени поучительно)[75].
Определение и формулирование проблемы. Том Блисчок, на тот момент менеджер группы консультантов по розничной торговле в компании Teradata, создающей аппаратно-программные комплексы для обработки и анализа данных, вместе с командой проводил анализ розничной торговой точки (point-of-sale – POS) для своего клиента, компании Osco Drug. По словам одного из членов этой группы, Джона Эрла, целью их работы был поиск закономерности в том, какие продукты чаще всего приобретаются вместе: «Мы предложили несколько экспериментов по размещению товара в торговом зале, чтобы посмотреть, как это будет влиять на склонность потребителей приобретать определенные товары вместе»[76]. Эрл предполагает, что истинной целью анализа было не столько решить какую-то конкретную проблему или обосновать управленческое решение для клиента, сколько продемонстрировать ему преимущества технологий, применяемых Teradata.
Обзор предшествующих исследований Подобные исследования ранее практически не проводились. Единственное, что было известно, это то, что товары для малышей высокорентабельны, поэтому было бы хорошо найти товары, вместе с которыми они бы чаще продавались и, соответственно, рос бы их объем продаж.
Моделирование (отбор переменных). Частота покупок различных видов товара по данным кассовых аппаратов аптек.
Сбор данных. Osco Drug располагала данными с кассовых аппаратов в своих аптеках (розничных торговых точках) и предоставила их аналитикам. База данных содержала информацию о перечне и ценах купленных по одному чеку товаров по 1,2 миллиона таких чеков, пробитых в двадцати пяти аптеках сети.
Анализ данных. Сегодня доступны значительно более сложные технологии интеллектуального поиска данных, но в 1992 году они еще не получили распространения. Команда аналитиков Teradata сформулировала запросы по базе данных, чтобы выявить товары, покупаемые вместе чаще, чем другие. Такой анализ, проведенный К. Хис, одной из членов группы, показал, что покупатели (вообще говоря, не обязательно мужчины), заходившие в магазин в интервале между 17:00 и 19:00 по четвергам и субботам, очень часто покупали вместе пиво и пеленки. Однако никаких статистических тестов для подтверждения того, что это не случайное явление, проведено не было.
Результаты и необходимые меры. Это именно тот случай, когда анализ показал свою неэффективность. В досужих рассуждениях об этой истории частенько проскальзывали разные предположения – например, что магазинах пиво и пеленки располагались на соседних стеллажах или что, наоборот, они находились в разных концах магазина и покупателям приходилось пересекать весь торговый зал. По сути, ни одно из этих предположений не подтвердилось. Результат анализа сочли забавным курьезом, и ни аналитики Teradata, ни менеджеры Osco Drug даже не пытались произвести какие-то действия на их основе или хотя бы оценить потенциальные их последствия.
У нас недостаточно информации, чтобы судить о том, почему этот интересный пример поиска моделей в данных так и не получил достойного продолжения. Но он наглядно свидетельствует о том, что любой этап аналитического процесса будет эффективным только в том случае, если приведет к какому-то результату. Компьютеры способны найти модели в базе данных, но только человек может сказать, есть ли в этих моделях какой-то смысл, и принять соответствующие меры (см. вставки «Компьютеры и модели: число » и «Закон первой цифры – способ обнаружения мошенничества»).
Компьютеры и модели: числоЧисло – это отношение длины окружности к ее диаметру. приблизительно равно 3,141592 в обычном десятичном исчислении. Многие формулы математики, инженерного дела и науки используют это значение, что и делает его самой важной математической концепцией после теоремы Пифагора[77].
– иррациональное число, что означает, что его значение не может быть выражено обыкновенной дробью, а последовательность знаков после запятой никогда не заканчивается и не является периодической. Однако это не значит, что человечество, начиная с древних вавилонян и до современных математиков, прекратило попытки обнаружить повторяемость в десятичных знаках .
Конечно, появление компьютеров в XX веке привело к новым попыткам поставить рекорд, рассчитав число до еще большего количества знаков; компьютеры полностью заменили в этом деле людей. Нынешний рекорд количества разрядов, до которых рассчитано число , составляет пять триллионов. Дальнейшее увеличение числа разрядов зависит не столько от математических способностей человека, сколько от технических возможностей компьютеров. Тем не менее до сих пор повторяющихся групп цифр в знаках числа не обнаружено.
Зато математики нашли множество новых применений этому замечательному числу, что говорит о важной роли креативности в аналитическом мышлении. Например, математик Дэвид Ачесон рассказывает такую историю.
Представьте себе удивление математиков, когда в середине XVII века они обнаружили появление числа в разных областях, подчас весьма далеких от геометрии окружности. Один из самых замечательных фактов этого рода состоит в необычной связи между и рядом нечетных чисел.
…Удивительные взаимосвязи такого рода принадлежат к явлениям, которые всегда волновали математиков»[78].
Была обнаружена также взаимосвязь между рядом четных чисел и числом . Более того, появляется в уравнении «знаменитая пятерка»[79], выведенном великим швейцарским математиком XVIII века Леонардом Эйлером. В 1988 году читатели авторитетного математического журнала признали это уравнение «самой красивой математической формулой в истории математики».
Все эти изыскания в области истории расчета и применения числа говорят о том, что даже сейчас, когда компьютеры выполняют многие математические расчеты, креативность человеческого ума всегда найдет себе выход. Применительно к количественному анализу в сфере бизнеса и корпораций компьютеры взяли на себя подавляющее большинство статистических расчетов. Но творчеству по-прежнему есть место там, где заходит речь об использовании этих расчетов для принятия решений.
И в заключение об аналитике и креативности
Хотелось бы надеяться, что нам удалось показать читателям: аналитическое мышление и креативность не только вполне совместимы, но и тесно взаимосвязаны. Вы не сможете ни стать хорошим количественным аналитиком, ни компетентно пользоваться аналитическими данными, если не умеете подключать к делу все ваши творческие способности. Однако помните, что в манипулировании цифрами и интерпретации результатов анализа баз данных креативность должна иметь предел. Творческий подход очень важен, но правда еще важнее.
Закон первой цифры – способ обнаружения мошенничества
Профессор математики в Политехническом институте штата Джорджия Тед Хилл в начале курса дает студентам задание на дом: или подбросить монетку двести раз и записать результаты, или представить, как подбрасываешь монетку двести раз, и сфальсифицировать результаты. На следующем семинаре он просматривает отчеты о домашней работе и, к восторгу аудитории, легко обнаруживает почти всех, кто занимался фальсификациями. Как это ему удается? На основании небольшого эксперимента он знает, что в некоторый момент при длительном подбрасывании монетки начинают выходить серии из шести-семи орлов или решек подряд. «Фальсификаторы» об этом не знают и интуитивно пытаются не писать подряд слишком много одинаковых результатов, поскольку считают, что это маловероятно. Хилл с первого взгляда выявляет записи о шести-семи орлах или решках, выпавших подряд (или их отсутствие), на основе чего и делает вывод о действительно проведенном студентом эксперименте или о фальсификации его результатов. На первый взгляд, это просто небольшой фокус для привлечения внимания студентов, но на самом деле в этом есть глубокий смысл. Если в данных отсутствуют те модели и зависимости, которые вы ожидали там увидеть, логично предположить фальсификацию или мошенничество.
Мы хорошо знаем, что наша система исчисления использует цифры от 1 до 9. Поэтому можно предположить, что вероятность выбора любой из этих цифр в качестве первой значащей в числе равна 1/9. Но, как ни странно, это не так. «Закон первой цифры», называемый также законом Бенфорда, гласит, что в списке чисел, взятых из реальных баз данных, частота распределения той или иной цифры на первое место в числе подчиняется специфической закономерности: примерно в 30 процентах случаев такой цифрой будет 1, а вероятность появления на первом месте остальных цифр тем меньше, чем цифра больше[80]. В соответствии с законом Бенфорда вероятность распределения цифр на первом месте в числе такова:
Этот довольно удивительный факт был обнаружен в 1881 году американским астрономом Симоном Ньюкомбом, заметившим, что в справочнике логарифмов первые страницы всегда гораздо более потрепанные, чем последующие. В 1938 году физик Франк Бенфорд сделал то же открытие на основе анализа гораздо большего массива данных, чем Ньюкомб. Он рассмотрел 20 229 наборов данных, включая географические координаты рек, бейсбольную статистику, количество статей в журналах, и номера домов первых 342 человек, перечисленных в рейтинге «Деятели науки Америки». Анализ всех этих вроде бы не связанных друг с другом баз данных показал, что вероятность распределения цифр на первое место в числе та же, что и для потрепанных таблиц логарифмов. Эта модель определения первой цифры в числе получила впоследствии название закона Бенфорда в честь ее первого исследователя. Стало общепризнанным действие закона Бенфорда во многих ситуациях реальной жизни.
Многие статистики и бухгалтеры твердо убеждены в том, что закон Бенфорда является очень простым, но надежным способом выявления возможных случаев мошенничества, хищений, неуплаты налогов и бухгалтерской небрежности. Идея проста: если кто-то фальсифицирует базу данных, то вряд ли он сможет имитировать распределение первой значимой цифры в числах в соответствии с законом Бенфорда. Поэтому простое сравнение распределения по закону Бенфорда и фактического распределения первых значимых цифр в базе данных поможет выявить сфальсифицированные блоки чисел. Как правило, в них частота распределения 1 как первой значимой цифры намного меньше 30 процентов, зато частота распределения 6 – намного больше, чем в доброкачественных массивах данных.
В 1972 году докторант университета Беркли Хэл Вэриан показал, что этот закон применим для выявления возможных искажений в массивах социологических данных, предоставляемых для подтверждения общественного мнения по готовящемуся политическому или экономическому решению. Судебный эксперт по бухгалтерским вопросам Марк Нигрини получил известность благодаря применению разработанной им на основе закона Бенфорда системы выявления мошенничества в некоторых громких делах в Бруклине. В наши дни многие налоговые управления используют специальное программное обеспечение для выявления фальсифицированных данных, разработанное на основе закона Бенфорда. Точно так же поступают крупные компании и аудиторские фирмы. В США доказательства фальсификаций на основе закона Бенфорда официально признаны в судебных разбирательствах на государственном уровне, уровне штата и местном уровне.
Пример аналитического мышления: языковые способности и болезнь Альцгеймера
Болезнь Альцгеймера – это дисфункция мозга, вызывающая проблемы с памятью, мышлением и поведением. Симптомы обычно развиваются медленно, с течением времени усиливаются и в конце концов начинают мешать человеку выполнять обычные домашние дела; затем пациент умирает по неизвестной причине. Болезнь Альцгеймера лежит в основе 60–80 процентов всех случаев приобретенного слабоумия. Около 5,3 миллиона американцев, в том числе каждый восьмой в возрасте старше 65 лет (а их 13 процентов от общей численности населения), страдают от болезни Альцгеймера. В США эта болезнь является шестой по распространенности причиной смерти. Помимо страданий самого пациента необходимо принять во внимание эмоциональные и физические страдания его семьи, необходимость повседневного ухода, изменение социальных ролей в семье, трудное решение о помещении в специальное лечебное учреждение.
Причины возникновения и развития болезни Альцгеймера до конца не выяснены. Многие исследователи пытались найти взаимосвязь между развитием болезни и характеристиками (или маркерами) группы повышенного риска. Например, люди с низким уровнем образования в большей степени подвержены заболеванию, чему способствует их образ жизни, в том числе питание, ежедневные занятия, употребление алкогольных напитков и риски профессиональной деятельности. Профессор центра геронтологии Сандерс-Браун при Кентуккийском университете Дэвид Сноудон и его коллеги считают, что языковые способности – более надежный показатель для прогнозирования вероятности болезни Альцгеймера, чем образ жизни[81]. Они предположили, что высокий уровень лингвистических способностей становится неким буфером для разития когнитивного снижения мнемонических процессов в мозгу, обеспечивающих декодирование, организацию и поиск информации. Они провели образцовое и весьма креативное исследование, связав когнитивные способности в молодом возрасте с риском возникновения болезни Альцгеймера в пожилом. В качестве целевой выборки они, что весьма необычно, взяли членов монашеского ордена, причем в качестве источников информации использовались их автобиографии. Рассмотрим это исследование с точки зрения наших шести шагов количественного анализа.
Определение и формулирование проблемы. Определить, ассоциируются ли языковые способности в раннем возрасте с когнитивными функциями и низкой вероятностью болезни Альцгеймера в пожилом.
Обзор предшествующих исследований Многие аналитические процедуры, применявшиеся командой Сноудона, ранее были описаны в работах доктора Дэвида Векштейна и доктора Уильяма Марксбери. В 1989 году они проводили исследование изменений когнитивной функции и поведения, связанных с возрастом, в группе пожилых пациентов, согласившихся после смерти пожертвовать свой мозг для научных исследований. Цель исследования состояла в том, чтобы установить, как изменения ткани мозга связаны с развитием болезни Альцгеймера и других неврологических заболеваний.
Моделирование (отбор переменных). Участниками исследования Сноудона стали сестры ордена Нотр-Дам из Милуоки (штат Висконсин). С 1991 по 1993 год сестер монастыря, родившихся до 1917 года, попросили принять участие в долговременном исследовании причин болезни Альцгеймера в пожилом возрасте. Из 1027 подходивших по возрасту сестер предложение приняли 678 (66 процентов), дав письменное согласие. Процент согласившихся довольно высок, особенно с учетом того факта, что все участницы обязались пожертвовать свой мозг для научных исследований после смерти, а также ежегодно проходить обследование когнитивных функций и общего физического состояния. Далее Сноудон и его коллеги обследовали выборку из 93 участниц, при вступлении в монастырь написавших автобиографию. Эти бумаги сохранились в монастырском архиве. Были выбраны следующие переменные для анализа:
• Языковые способности в молодости (способность формулировать мысли и грамматическая сложность речи).
• Когнитивные функции (семь различных показателей) и наличие болезни Альцгеймера в пожилом возрасте.
Сбор (измерение) данных. Автобиографии сестер использовались для оценки их языковых способностей в молодости. После примерно четырех лет жизни в монастыре каждая из них написала автобиографию незадолго до принятия монашеского сана. Из архивных документов стало известно, что всех их попросили написать краткий очерк о своей жизни. «По объему он не должен был превышать двухсот-трехсот слов и одного листа… в нем должны быть указаны место рождения, имена родителей, памятные и поучительные события детства, посещение школы, факторы, повлиявшие на решение уйти в монастырь, религиозная жизнь с ее замечательными событиями».
Каждую автобиографию оценивали по двум параметрам: способность формулировать мысли и грамматическая сложность речи. Способность формулировать мысли оценивалась путем подсчета «идей», приходящихся на каждые десять слов текста. Под идеями понимались элементарные предложения, в состав которых входили глагол, наречие или прилагательное, существительное с предлогом. Сложные фразы – те, что содержат констатацию или предположение о существовании причинно-следственных, мирских и церковных или других взаимосвязей между элементарными идеями.
Грамматическая сложность рассчитывалась на основе методики оценки развития, классифицирующей предложения по восьми уровням грамматической сложности, начиная от 0 (простые односоставные предложения) и до 10 (сложные предложения со вставными оборотами и подчиненностью).
Когнитивные функции оценивали на основе комплекса из семи нейропсихологических тестов. Они включали оценку памяти, способности к концентрации, речи, способности ориентироваться в пространстве и времени. Девяносто три участницы написали первые биографии в возрасте около 22 лет и прошли обследование когнитивных функций в среднем 53 спустя, в возрасте от 75 до 87 лет.
Анализ данных. Неспособность формулировать мысли и низкая грамматическая сложность биографий, написанных в юные годы, ассоциировались с невысокими результатами когнитивных тестов в пожилом возрасте. При этом неспособность формулировать мысли имела большее влияние на результаты когнитивных тестов по сравнению с низкой грамматической сложностью. Из четырнадцати умерших сестер подтвержденная неврологом болезнь Альцгеймера имелась у всех тех, кто когда-то продемонстрировал низкие способности формулировать мысли; из тех, кто показал хорошие результаты по этому критерию, болезнью Альцгеймера не страдал никто.
Результаты и необходимые меры. Сноудон и его коллеги пришли к выводу, что способность письменно излагать свои мысли, принятая в качестве показателя когнитивных способностей в молодости, «является эффективным маркером когнитивных проблем, болезни Альцгеймера и заболеваний мозга в пожилом возрасте». Это означает, что слабые лингвистические способности в молодости – это первый симптом изменений в мозге, впоследствии ведущих к болезни Альцгеймера. Такие исследования помогают точнее определить группу риска для болезней, связанных с возрастом.
Сноудон и его коллеги опубликовали статью Linguistic Ability in Early Life and Cognitive Function and Alzheimer’s Disease in Late Life в ведущем медицинском журнале Journal of the American Medical Association. Сноудон, кроме того, написал популярную книгу о сестрах ордена Нотр-Дам под названием Aging with Grace: What the Nun Study Teaches Us About Leading Longer, Healthier, and More Meaningful Lives. Ее высоко оценили, в том числе журнал Library Journal.
Книга Сноудона написана с симпатией к этим монахиням и восхищением перед сестрами, благородно согласившимися пожертвовать свой мозг для научных исследований после смерти. Результаты исследования Сноудона показали, что патологические изменения поведения не всегда вызываются видимыми изменениями в мозге, а лингвистические способности в молодости, по всей видимости, предотвращают в старости развитие болезни Альцгеймера. Предупреждение инсультов и сердечных заболеваний помогает избежать деменции (приобретенного слабоумия), а наследственность, диета и физические упражнения также играют в этом значительную роль. Изложение научных фактов на фоне реальных человеческих судеб, вдохновляющий и восхищенный взгляд на процесс старения будут весьма интересны читателям[82].
Работа Сноудона с сестрами-монахинями стала темой статьи, проиллюстрированной на обложке журнала Time в 2009 году[83]. Это еще раз говорит о том, что творческое аналитическое мышление способно заинтересовать самую широкую аудиторию.
Пример аналитического мышления: продажа инсайдерской информации
Симон Хайнес в прошлом работал инвестиционным банкиром в банке Macquarie. Под вымышленным именем Марк Бус он купил опцион на пакет акций транспортной компании TNT на общую сумму около 90 тысяч долларов. Банк Macquarie предоставлял услуги по финансовому консультированию компании TNT, и перед самым увольнением из банка Хайнес получил косвенные свидетельства того, что TNT в скором времени будет поглощена. Так и случилось буквально через пару дней после покупки опциона. Хайнес исполнил опцион и получил прибыль около двух миллионов долларов за одну эту операцию. Кроме того, он умело замел следы, и инспекторам из Австралийской комиссии по ценным бумагам и инвестициям пришлось проделать большую аналитическую работу, чтобы разобраться в сути махинации.
Определение и формулирование проблемы. Нетипичная торговая активность с опционами TNT была отмечена за три дня до объявления о поглощении компании. Это объявление привело к росту рентабельности на инвестиции в акции компании до 200 процентов. Хотя инспекторы биржи называли нескольких физических и юридических лиц, покупавших и продававших акции компании на протяжении этих трех дней, но они не могли определить, кто из них был первым. Дело было передано в Комиссию по ценным бумагам и инвестициям – орган, ответственный за состояние фондового рынка. Несмотря на то, что к расследованию привлекли все возможные ресурсы и обычные судебные процедуры, Комиссия три месяца не могла добиться результата. В конце концов она пришла к выводу, что операции проводились по фальшивым документам.
Изучение предыдущих поисков решения. Конкретно в рамках этого случая предыдущие исследования отсутствовали, поскольку он оказался исключительным. Но у сотрудников Комиссии был большой опыт проведения аналогичных расследований. Они предположили, что информация об операции может «протечь» в социальную сеть. Члены Комиссии умели искать информацию о людях, компаниях и адресах во внутренних корпоративных и социальных сетях.
Моделирование (отбор переменных). В качестве двух основных переменных в модель включены доступ неустановленного лица к информации о грядущем поглощении компании TNT и наличие у него необходимых предпосылок (счет в банке, деньги и т. п.) для торговли ценными бумагами на момент поглощения TNT.
Сбор (измерение) данных. Традиционные методы расследования позволяли установить того, кто имело или мог иметь доступ к инсайдерской информации («информированные лица»). Кроме того, с их помощью можно было отследить операции по снятию соответствующих денежных сумм со счетов («люди с наличностью»). Имея эту информацию, они могли выявлять и накапливать сведения о связях между людьми, компаниями, адресами и активами, принадлежащими «информированным людям» и «людям с наличностью». Процесс анализа этих связей привел к созданию аналитической базы данных, содержащей сведения о более чем 160 тысячах человек, компаний, адресов, активов и операций по снятию наличных, между которыми установлено более миллиона разнообразных контактов.
Анализ данных. Одни и те же элементы многократно встречаются в базе данных в связи с различными операциями, поэтому, прежде чем переходить к следующему этапу, аналитики решили выделить операции, относящиеся к одному и тому же элементу (то человеку, компании, активу или адресу нахождения). Для выполнения этой задачи было задействовано более сотни разработанных специалистами Комиссии алгоритмов. Энтони Вьель, на тот момент главный следователь Комиссии по данному делу, а ныне партнер по аналитике и расследованиям в австралийском отделении аудиторской фирмы Deloitte, так прокомментировал этот процесс: «После того как все повторяющиеся элементы были объединены, мы запустили специальный алгоритм для выявления связей между “информированными людьми” и “людьми с наличностью”. При этом характер связей оценивался как либо “слабый”, либо “прочный”, чтобы можно было отсортировать полученные результаты. На первом этапе анализа мы выявили 65 элементов со слабыми и прочными связями, на втором из них было отобрано только два элемента с прочными связями. Один из них оказался ложной переменной, появившейся в результате некорректно выполненного объединения операций, зато вторым и был тот человек, который нас интересовал»[84].
Результаты и необходимые меры. У Симона Хайнеса, найденного сложными методами сетевого анализа, был проведен обыск. В его доме обнаружили улики, достаточные для предъявления обвинения по нескольким статьям уголовного кодекса. Состоялся суд, и жюри присяжных признало его виновным. Поданная апелляция была отклонена. Хайнес провел два с половиной года в тюрьме и выплатил 100 тысяч долларов штрафа. Кроме того, у него конфисковали всю прибыль, полученную в результате незаконной сделки с использованием инсайдерской информации.
Вьель и сейчас использует те же методы сетевого анализа при расследовании случаев мошенничества.
Глава 6
Развитие навыков количественного анализа
От чего зависит судьба человека или, если хотите, линия его жизни? Давным-давно Аристотель сказал, что привычка – вторая натура. «Нравственные, или этические, добродетели (добродетели характера) рождаются из привычек-нравов: человек действует, приобретает опыт, и на основе этого формируются черты его характера»[85], – писал он. Значит, привычки и определяют нашу судьбу. Можно изобразить это следующим образом:
Мысли Действия Привычки Характер Судьба
Ваш привычный образ мыслей предопределяет ваши действия. Ваши действия вырабатывают привычки. Другие оценивают вас исходя из того, как вы имеете обыкновение поступать. Наконец, мнение окружающих о вас определенным образом влияет на вашу судьбу. Процесс, в результате которого вы можете стать квалифицированным количественным аналитиком, включает примерно такие же этапы (рис. 6.1).
Рис. 6.1. Как стать квалифицированным количественным аналитиком
Привычка подходить к решению проблем с количественно-аналитической точки зрения формирует ваши навыки. Если вы постоянно работаете с числами, то со временем станете квалифицированным количественным аналитиком. Знания в области количественного анализа постоянно расширяются, поскольку используются в процессе реализации навыков и подходов к нему. Далее мы поговорим о том, какие навыки и подходы к количественному анализу надо освоить, чтобы стать квалифицированным специалистом в этой области, а также о том, какие знания и умения необходимы на каждом из этапов.
Количественный подход
В то время как знание методов количественного анализа, безусловно, полезно при принятии аналитических решений, не менее важно выработать в себе количественный подход к решению проблем, то есть стремление оперировать количественными показателями и находить надежные аргументы в поддержку той или иной гипотезы. Если ваш мозг не выключается при виде цифр или уравнения, то вы сами удивитесь, сколько процедур количественного анализа можно освоить.
Не бойтесь цифр
Мы давно подозревали, что аллергия на цифры поражает многих компетентных и разумных людей. Бывает, что они испытывают непреодолимое отвращение к математике. Это не только печально, но и контрпродуктивно. Тем не менее математика – это не главное для количественного образа мыслей. Хорошего количественного аналитика отличают не столько познания в области чистой математики, сколько подход к классификации количественной информации. Количественно мыслящие люди обладают определенными навыками, способностями и привычками, которые помогают им принимать решения, основываясь на ней. Некоторые специалисты даже утверждают, что полученных в средней школе математических знаний вполне достаточно, чтобы научиться мыслить количественно: «Математические знания и количественное мышление – это разные вещи… Очень важно это понимать, поскольку для того, чтобы стать квалифицированным количественным аналитиком, требуется не так уж много знаний по математике, выходящих за пределы программы средней школы»[86].
Если не верите, вот пример Эмили Роуз. Она в девять лет уже провела эксперимент в духе «сумасшедшего ученого», анализируя концепцию бесконтактного массажа. Ее работа оказалась достаточно сложной и актуальной, чтобы получить право на публикацию в профессиональном журнале Journal of the American Medical Association[87]. Выходящий постоянно с 1883 года, JAMA имеет один из самых крупных тиражей и принадлежит к числу наиболее престижных медицинских журналов в мире. Как научная работа четвероклассницы могла попасть в такой журнал? Эмили видела, как ее мать Линда смотрит видеофильм о набирающем популярность виде медицинскихуслуг – бесконтактном массаже (БМ). Это неоднозначный способ лечения недомоганий путем управления «энергетическими полями» пациента. Поборники БМ утверждают, что уже более 100 тысяч человек во всем мире овладели его техникой. БМ преподается более чем в ста колледжах и университетах, расположенных в 75 странах. Говорят, что эта процедура получила наибольшее признание среди процедур, практикуемых сторонниками холистической медицины. Во время сеанса врач делает пассы руками в нескольких сантиметрах от тела пациента, чтобы выявить и устранить в его организме «застой энергии», способный послужить причиной различных заболеваний. Эмили предложила своей маме провести эксперимент. Линда, медсестра по профессии, дала дочери полезные советы по его методике. Проведя некоторые изыскания, Линда и Эмили поняли, что еще никто не пытался установить, действительно ли специалист по бесконтактному массажу способен обнаруживать «энергетические поля» человека.
Эмили сосредоточила свои усилия на поиске ответа на этот вопрос. Если практикующие бесконтактный массаж действительно способны делать то, что обещают, то они должны хотя бы чувствовать «энергетическое поле» пациента. Если они на это не способны, тогда медицинская ценность этого способа лечения по меньшей мере сомнительна. Таким образом, если процент правильно выявленных бесконтактным массажистом «энергетических полей» окажется существенно выше уровня, объясняемого случайностью, то заявления о преимуществах этого вида лечения имеют под собой основание.
Изучив газетные объявления и другие источники информации, Эмили обнаружила 25 физиотерапевтов, практикующих бесконтактный массаж в северо-западном Колорадо; двадцать один из них согласился участвовать в эксперименте. Потенциальных участников предупредили, что исследование будет представлено на ярмарке научных проектов школьников. Во время тестирования физиотерапевт располагал руки ладонями вверх на плоской поверхности, примерно в 25–30 сантиметрах друг от друга. Чтобы тестируемый не видел своих рук, перед его лицом размещался овальный непрозрачный экран с вырезами у основания; к экрану крепилось полотенце, покрывавшее его руки. Эмили подбрасывала монетку, чтобы определить, какая рука будет целевой (этот метод известен как рандомизированное распределение по группам в количественном эксперименте). Затем она протягивала правую руку ладонью вниз в восьми-десяти сантиметрах над целью и говорила «Готово!». После этого физиотерапевт говорил, какая его рука находится ближе к руке Эмили. Этот тест повторялся 280 раз при участии 21 физиотерапевта.
Хотя все участники утверждали, что они способны почувствовать руку пациента, лишь в 122 случаях (44 процента) из 280 они правильно ответили на поставленный вопрос. Это даже хуже, чем если бы они отвечали на вопрос просто наугад (см. сайт этой книги), ведь в таком случае процент угаданных правильно ответов составил бы около 50. Эмили сделала вывод, что физиотерапевты не смогли подтвердить наиболее важный навык БМ, что говорит о беспочвенности их заявлений. Дальнейшее использование БМ в медицинских целях, таким образом, неоправданно. В апреле 1998 года одиннадцатилетняя Эмили (учась в шестом классе) опубликовала результаты эксперимента в JAMA. Редактор журнала Джордж Лундберг сказал, что эксперты по статистике были восхищены простотой эксперимента и очевидностью его результатов[88]. Эмили была занесена в Книгу рекордов Гиннесса как самый молодой автор исследования, опубликованного в ведущем научном журнале.
Эмили отнюдь не гений и не вундеркинд; просто она обладает здравым смыслом и ясным количественным мышлением. Наиболее ценный навык квалифицированного количественного аналитика – это умение извлекать информацию из баз данных, что зависит совсем не от математической подготовки, а от количественного мышления. Первый шаг в этом направлении состоит в том, чтобы преодолеть страх перед числами и чувствовать себя комфортно в цифровой среде. Вы можете быть уверенными, что необходимые познания в математике у вас наверняка есть или, в крайнем случае, их можно легко получить. Главная черта квалифицированного количественного аналитика – это умение обращаться с данными и не испытывать перед ними страха.
Даже если вы не демонстрировали особых математических успехов в школе, это никогда не поздно исправить. Кто сказал, что вы до конца жизни обречены плохо разбираться в числах? Если в школе вам не давалась математика, это не значит, что вы не можете ликвидировать этот пробел в дальнейшей карьере. Например, Ди-Джи Патил, придумавший термин «ученый по данным», чтобы описать свою роль в управлении аналитическими исследованиями в интернет-компании LinkedIn, в школьные годы немало пострадал от математики: «Впервые я завалил экзамен по математике в восьмом классе. То же самое периодически случалось в старших классах, поэтому пришлось подать заявку на повторный курс. Но и его я завалил, в результате чего с трудом получил аттестат о среднем образовании. Сразу в университетский колледж с такими баллами поступать было нельзя, поэтому пришлось пойти в местный колледж низшей ступени… Там я записался на курс по математике, благодаря чему смог перейти в университетский колледж. Там стало ясно, что я не понимаю ничего из того, что говорят преподаватели. Я учился в слишком слабом с точки зрения математической подготовки классе. Было очень стыдно, поэтому я пошел в библиотеку»[89].
Патил взял в библиотеке несколько книг и за одни выходные самостоятельно изучил школьный курс математики. В итоге он добился неплохих успехов и был принят в колледж университета в Сан-Диего, где окончил университетский курс математики за три года. Потом он получал степень PhD по прикладной математике в Мэрилендском университете.
Вначале он столкнулся с некоторыми трудностями. «Я получил образование в США, а конкурировать приходилось с русскими, израильтянами и корейцами. На первом экзамене я катастрофически провалился, получив, кажется, второй балл с конца списка. Самый низкий балл был у студента, не явившегося на экзамен». Зато на второй попытке наш герой набрал самые высокие баллы. Окончив докторантуру, Патил начал преподавать в Мэрилендском университете, одновременно занимаясь исследованиями по моделированию погоды. Ему пришлось поработать и на правительственные разведывательные организации. Финансирование в то время было ограниченным, и он уволился, перейдя работать в Skype, а затем в eBay. Потом он стал ведущим аналитиком в LinkedIn, где люди, занимающие эту должность, имеют огромное влияние на процесс разработки продуктов.
Сейчас Патил – «исследователь данных, проживающий по месту службы» (наверно, первый человек, чья должность носит такое название) в венчурной фирме Greylock Partners; он помогает клиентам компании решать проблемы с данными и аналитикой. Возможно, он представляет собой лучший пример человека со скрытыми математическими способностями.
Используйте поиск в интернете для обнаружения неизвестных концепций и понятий, связанных с вашими данными
В эру глобализации экономические и деловые термины мелькают в новостях каждый день. То же можно сказать о повседневных разговорах. Поскольку многие незнакомы с общеупотребительными понятиями и характеристиками, они просто пропускают их мимо ушей. Но если вы собираетесь стать количественным аналитиком, то вам придется запоминать их, записывать, а впоследствии пытаться при помощи Google найти их значение. Большой объем информации такого рода есть в Википедии; существуют онлайновые курсы и электронные учебники по многим предметам. Распечатайте результаты поиска и систематизируйте их в отдельный файл для последующего изучения. Это хороший способ учиться и с течением времени преодолеть страх перед числами. Вероятно, вы не поймете всего, что прочитаете, но тем не менее чему-то научитесь. Если проявлять упорство в течение хотя бы шести месяцев, то вы немало удивитесь, когда узнаете, что ваши коллеги считают вас весьма информированным человеком, особенно в том, что касается чисел.
Проявляйте любопытство
Если вам действительно интересны числа, то со временем вы будете понимать их все лучше и лучше. Например, когда вы слышите, что Усейн Болт самый быстрый человек в мире, у вас возникает вопрос, каково его лучшее время. Несложно выяснить, что на стометровке оно составляет 9,58 секунды. Теперь задайте себе вопрос, чему равна его скорость в пересчете на километры (или мили) в час. Проведя несложные расчеты, вы обнаружите:
9,58 секунды 10 секунд = 1/6 минуты = 1/360 часа.100 м = 0,1 км.
Таким образом,
Теперь у вас возникает вопрос, чему равен мировой рекорд в марафоне: 2 часа 3 минуты 59 секунд. Простой расчет показывает, что для этого марафонец должен бежать со скоростью около 20,4 километра в час (12,7 мили в час). Сравнив эти две средние скорости, вы поймете, как быстро может бежать человек на самой короткой и самой длинной олимпийской дистанции. Любопытство во всем, что касается чисел, – вот отличительная черта хорошего количественного аналитика.
Количественный подход Количественные знания
Чтобы расширить свои познания в количественном анализе, на следующем этапе полезно ознакомиться с начальным курсом статистики для широкого круга читателей. Одна из наиболее популярных книг такого рода – уже упоминавшаяся нами «Как обмануть с помощью статистики» (How to Lie with Statistics) Даррела Хаффа. Это наиболее продаваемая книга по статистике во второй половине XX века[90]. Она представляет собой краткое, увлекательное, иллюстрированное изложение наиболее часто встречающихся ошибок, как намеренных, так и непреднамеренных, имеющих отношение к статистике и способных привести к неверным выводам. Это действительно прекрасная книга, рассказывающая о том, как можно лгать языком статистики и как проверить достоверность статистических данных. Можно порекомендовать также опубликованную в 1974 году книгу Стивена Кемпбелла «Недостатки и заблуждения в статистическом мышлении» (Flaws and Fallacies in Statistical Thinking). С учетом даты выхода это удивительно полезная книга для всех, кто читает газеты и обращает внимание на содержащиеся в них статистические данные[91]. Гораздо более новая книга на ту же тему – «Распространенные ошибки в статистике и как их избежать» (Common Errors in Statistics and How to Avoid Them) Филипа Гуда и Джеймса Хардина[92]. Таких книг множество, почитайте рецензии и купите лучшие.
Мыслить вероятностно
Ключевой аспект количественного мышления – это понимание законов вероятности и случайности. Отсутствие такого понимания – наиболее серьезный недостаток мышления взрослого человека, который, к сожалению, отмечается у большинства. Нассим Николас Талеб считает, что большинство из нас «одурачены случайностью» (такое же название носит его книга[93]), ведь мы придаем огромное значение вещам, которые вполне могут оказаться случайностью. Например, это может быть совпадение дней рождения у кого-то из гостей на вечеринке. Допустим, что на вечеринке присутствуют 23 гостя, и вдруг двое из них обнаруживают, что родились в один день. Они могут задаться вопросом о том, насколько вероятно такое событие. Оказывается, вероятность достаточно велика: более 50 процентов (см. http://keepingupwiththequants.weebly.com).
Понимание законов вероятности весьма полезно не только на вечеринке, но и во множестве других случаев. Если вы их не знаете, то не сможете понять, что фондовый рынок не что иное, как прогулка среди случайностей (колебания цен на акции не подчиняются каким-либо закономерностям), и некоторые лидеры по темпам роста в течение нескольких лет подряд могут показывать гораздо лучшие результаты, чем средние компании, но рано или поздно произойдет обвал их показателей. Вам не обязательно понимать феномен возврата к норме: например, если ваш доход намного превышает средний уровень, то доход вашего ребенка, скорее всего, будет ниже, чем ваш. Возможно, то, что вы не знакомы с теорией вероятности, обойдется вам в кругленькую сумму, если вы частый гость в казино Лас-Вегаса. Вам также будет трудно получить работу в страховом бизнесе или решить, стоит ли покупать аннуитет. И конечно, вся статистика основана на вероятности. Короче говоря, теорию вероятности следует понимать не только для того, чтобы стать количественным аналитиком, но и для того, чтобы добиться успеха в жизни.
Конечно, существует много источников информации по теории вероятности. В учебниках обычно она рассматривается вместе с основами статистики, поскольку там требуется умение мыслить вероятностно. Если вы хотите сконцентрироваться именно на теории вероятности, а не на статистике в целом, то лучше выбрать книгу Ричарда Исаака «Удовольствия от вероятностей» (The Pleasures of Probability)[94]. Если вы терпеть не можете учебники, то забавное и хорошо написанное введение в статистику для широкой публики содержится в книге The Drunkard’s Walk: How Randomness Rules Our Lives[95] Леонарда Млодинова.
Снова в школу
Если вам трудно разбираться с аналитикой, теорией вероятности и количественным мышлением самостоятельно, то совсем не обязательно это делать. Существует много возможностей дистанционно и очно изучить их. Университеты все чаще размещают учебные материалы в открытом доступе, в том числе и разнообразные курсы по статистике. Например, если вы хотите поучиться в университете, который известен высоким уровнем преподавания и исследовательской работы в области количественного анализа, то зайдите на страничку курса по статистике и теории вероятности на сайте Массачусетского технологического института[96]. Если речь идет о платном дистанционном образовании, то можно приобрести у издательства Harvard Business Publishing курс-самоучитель по количественным методам, разработанный Яном Хаммондом, коллегой Тома Дэвенпорта по Гарвардской школе бизнеса (это стоит чуть больше сотни долларов). Если вы планируете потратить более крупную сумму, можно записаться на дистанционное обучение на степень магистра по предсказательной аналитике в Северо-Западном университете.
Если вы предпочитаете общаться с профессорами лицом к лицу, иметь возможность обсудить с ними проблемы и извлекать пользу из повседневного общения с однокурсниками, то для вас в американских университетах есть все растущее число программ на степень по аналитике, обычно магистерскую. Их прародительница – основанная пять лет назад магистерская программа по аналитике в Университете Северной Каролины[97], одна из лучших в этой области. Почему именно Северная Каролина? Основатель и генеральный директор компании по разработке аналитического программного обеспечения SAS Джим Гуднайт учился именно в этом университете и любезно пожертвовал деньги, чтобы основать эту программу.
Магистерская программа по аналитике – это программа подготовки профессионалов с глубоким пониманием инструментов, методов, приложений и практического применения. Принципы ее организации, по нашему мнению, в полной мере соответствуют задачам и потребности компаний и бизнеса в целом в количественно ориентированных специалистах.
• Короткая по времени. Десять месяцев интенсивного обучения, разбитых на три семестра (лето, осень и весна). Зачисление производится в июле, выпуск в мае следующего года. Заочной и вечерней формы обучения нет.
• Напряженный график обучения. Обучение в течение полного дня (понедельник – пятница с 9:00 до 17:00) в кампусе. Комплексны учебный план для группы студентов; предусмотрена работа в группах; во внеаудиторное время планируется работа над проектами.
• Широкое и рассчитанное на практическое применение содержание курсов. Комплексный, мультидисциплинарный учебный план (разработанный на основе опыта кафедр и колледжей Северной Каролины) направлен на обучение практическим навыкам, пригодным для решения актуальных проблем в статистике, прикладной математике, компьютерных науках, исследовании операций, финансах и экономике, маркетинге.
• Обучение на собственном опыте. Использование практикумов вместо стандартных форм обучения (студенты работают в группах по пять человек, решая реальные проблемы на основе заданий и данных, предоставленных промышленными спонсорами; напряженная работа в течение семи месяцев завершается отчетом перед спонсором).
Магистерская программа по аналитике Университета Северной Каролины основана на инновационном учебном плане, состоящем из специально разработанных для нее курсов. Они посвящены интеллектуальному поиску данных и анализу текстов, прогнозированию, оптимизационным задачам, базам данных, визуализации данных, безопасности баз данных, финансовой и потребительской аналитике. Студенты приходят в программу с разным базовым образованием и опытом, хотя предпочтительна определенная ориентация на количественные исследования. Средний возраст студентов 27 лет, примерно 26 процентов уже имеют университетское образование. Примерно половина студентов до поступления на программу работала на полную ставку. Несмотря на сложную ситуацию и медленный рост в национальной экономике, выпускники программы 2011 года поставили рекорд по количеству интервью с работодателями – 469 (то есть на каждого выпускника пришлось по 12 интервью; в 2012–2013 годы численность студентов возросла до 80 человек). Все выпускники обеспечены заявками работодателей на пять лет вперед. Учитывая, что спрос работодателей на этих выпускников постоянно растет, вполне понятно, что аналогичные программы открываются и в других университетах. Одно из недавних исследований выяснило, что 59 университетов предлагают программы по деловой аналитике или бизнес-разведке, в том числе 37 магистерских и 22 бакалаврские программы[98]. Школы также начинают предлагать курсы по изучению данных, а в скором времени надо ожидать и программ с выдачей диплома.
Количественные навыки
Количественный подход важен, но не менее важны и количественные навыки. Говорят, что легче привести свои действия в соответствие с новым способом мышления, чем придумать новый образ действий. Если постоянно тренировать количественные навыки, то через некоторое время окажется, что у вас выработался количественный подход.
Требуйте чисел
Хорошие количественные аналитики (а также организации, стремящиеся воспитать их в своем коллективе) всегда должны требовать количественную информацию, когда им представляют идеи, теории и случайные наблюдения. Приучитесь задавать вопрос: «Есть ли у вас данные в поддержку этой гипотезы?» Ну а если вы действительно круты, то периодически вставляйте фразу «Множество слухов – это еще не данные». Требование данных играет большую роль, поскольку позволяет ответить на вопросы: «Как человек мыслит?», «Какие инструменты и процессы помогли обеспечить это направление действий?» В дополнение к глобальным задачам спасения мира попытайтесь бороться с желанием перескакивать сразу к выводам, не требуя представления данных.
То же справедливо при презентации ваших идей. Если никаких данных нет, проведите хотя бы небольшой эксперимент в стиле «сумасшедшего ученого» и соберите их. Постоянно стремитесь собрать как можно больше данных до того, как начнете развивать свои теории. Это поможет поставить их на надежную основу количественного анализа и одновременно увеличит шансы убедить слушателей в правильности ваших идей. Навык опираться на цифры и подтверждать ими свои идеи абсолютно необходим любому, кто хочет стать квалифицированным количественным аналитиком.
Никогда не доверяйте числам
Только что мы писали о том, что аналитик всегда стремится собрать числа и прочие данные в поддержку своих теорий и взглядов на мир. Но сейчас мы хотели бы поговорить о необходимости разумно-скептического подхода к ним. Как и в случае с новым знакомым, не доверяйте данным до тех пор, пока не узнаете о них больше. Никогда не принимайте за чистую монету никакие числа, которые вам представили. Существует несколько причин, по которым данные не заслуживают доверия. Люди (а особенно политики) иногда лгут и мошенничают, прикрываясь цифрами, или в крайнем случае неправильно интерпретируют их, стремясь добиться своих скрытых целей. Шотландский поэт и критик Эндрю Ланг писал: «Он использует статистику, как пьяница использует столб – больше в качестве опоры, а не источника света»[99]. Числа могут быть неправильно отобранными, и в таком случае они не отражают состава генеральной совокупности. Критичное отношение к данным оправданно, особенно если они нетипичны и вызывают удивление. Лучший способ получить надежные данные – относиться к ним критично и стараться узнать как можно больше об их происхождении. В частности, скептицизм относительно данных должен включать следующие аспекты.
Релевантность. Представленные данные должны иметь непосредственное отношение к проблеме, для решения которой они собирались. Они должны быть репрезентативными по отношению к той группе или организации, которую они предположительно представляют. Если данные не дают хотя бы некоторых ответов на вопросы, они бесполезны.
Точность. Если данные релевантные, но неточные, их необходимо отбросить. Точность данных можно оценить, изучив вопрос о том, кто и как их готовил. Если данные не проходят эту проверку на точность, они опять-таки бесполезны.
Правильная интерпретация данных. Даже точные данные могут ввести в заблуждение, если их неправильно истолковать. Особенно склонны неверно интерпретировать данные те люди, у которых есть скрытые мотивы и цели. Рассмотрим пример, в котором интерпретация данных способствовала формированию субъективного мнения.
Критик из журнала Newsweek, писавший рецензию на книгу «Лучшая половина» (The Better Half) о первых суфражистках, завершил свой опус несколько провокационно. Он задал риторический вопрос, что сказали бы Сьюзан Энтони и ее подруги, если бы узнали о том, что пятьдесят лет спустя после предоставления американским женщинам политических прав социологи Колумбийского университета обнаружили: лишь одна из двадцати двух женщин голосовала не за того кандидата, за которого голосовал ее муж.
Один из читателей в ответ на это написал: «Я думаю, что суфражистки были бы весьма довольны. Их движение проделало большую работу, если менее чем через пятьдесят лет после предоставления женщинам политических прав только один муж из двадцати двух имел мужество голосовать не так, как его жена»[100].
Таким образом, всегда стоит задавать себе вопрос, насколько правильна интерпретация данных с учетом проблем и мотивов того лица, которое ее представило.
Особенная осторожность с причинно-следственным аргументами
Стоит с особой осторожностью относиться к аргументации, основанной на причинно-следственных связях: их выявить очень сложно. Как мы уже упоминали во вставке об экспериментах «сумасшедшего ученого», если вы формируете контрольную и целевую группу, случайным образом распределяя в них людей, и эти группы демонстрируют различные результаты, то обычно аналитик приписывает это воздействию тестируемого фактора. Но если вы просто выявили статистическую связь между двумя факторами, вряд ли она окажется причинно-следственной. Возможно, вы слышали фразу «корреляция – еще не причина». Это важно помнить.
Когнитивные психологи Кристофер Чабрис и Даниэль Симонс предложили эффективную процедуру для выявления причинно-следственной связи в книге «Невидимая горилла и другие способы нашей интуиции обмануть нас» (The Invisible Gorilla and Other Ways Our Intuitions Deceive Us): «Когда вы слышите или читаете о наличии связи между двумя факторами, задумайтесь, можно ли говорить о том, что в тестовую группу для их проверки люди отбирались действительно случайно. Если это невозможно, слишком дорого или этически неприемлемо, то проводить эксперимент нельзя и причинно-следственная связь считается неподтвержденной»[101].
Например, вы прочитали в газете: «В ходе десятилетнего эксперимента доказано, что запойное пьянство приводит к раку». Задумайтесь над тем, возможно ли в данном случае случайное распределение участников на тестовую и контрольную группы с последующей просьбой к одним запойно пить, а к другим – соблюдать трезвость в течение десяти лет. Наверно, нет. Куда более вероятно, что исследователь обнаружил корреляционную зависимость между запойным пьянством (по всей видимости, по собственным словам опрашиваемого) и случаями рака в группе населения, которую мониторили в течение десяти лет. Возможно, исследователь учитывал, что выявленная корреляция может объясняться и другими факторами (например, сильно пьющие люди часто курят), но уж репортер точно об этом не задумывался.
Если вы заподозрили, что кто-то в вашей организации является сторонником софизма cum hoc ergo propter hoc (после этого – значит по причине этого), то для предотвращения неправильных выводов следует тщательно следить за разработкой условий экспериментов, хорошо знать статистику и эконометрику. Именно в этом случае лучше пригласить эксперта.
Задавайте вопросы
Задавать вопросы стоит для того, чтобы лучше понять суть проблемы и оценить методику ее решения. Аналогично, если у вас возникли сомнения по поводу представленных данных, следует без колебаний задавать вопросы. Многие стесняются задавать вопросы по поводу чисел, поскольку боятся показаться глупыми. Эти страхи преувеличены. Некоторые идеи по поводу того, какие вопросы лучше задавать, приведены во вставке «Хорошие вопросы о количественном анализе».
Хорошие вопросы о количественном анализеПеречень приведенных далее вопросов, конечно, не исчерпывающий, но может помочь вам с чего-то начать. Они пригодны практически для любых видов количественного анализа или такого неколичественного, который должен стать количественным.
• Есть ли у вас данные в поддержку вашей гипотезы?
• Что вы можете сказать об источнике данных, использованных в анализе?
• Вы уверены, что выборка репрезентативна для генеральной совокупности?
• Присутствуют ли какие-либо выбросы в распределении данных? Как они влияют на конечный результат?
• Какие предположения вы положили в основу своего анализа?
• Есть ли какие-либо обстоятельства, способные повлиять на достоверность предположений и модели анализа?
• Почему вы выбрали этот подход к анализу?
• Какие преобразования данных вы провели, чтобы добиться соответствия между ними и моделью?
• Рассматривали ли вы какие-либо иные подходы к анализу данных, и если да, то почему от них отказались?
• Насколько вероятно, по вашему мнению, что независимые переменные действительно обусловливают динамику зависимых переменных? Можно ли провести еще какие-либо аналитические процедуры для подтверждения причинно-следственной связи?
Представьте, что кто-то задает вопросы по поводу представленных данных. Такой человек скорее будет выглядеть смелым и заслужит уважение, чем покажется глупым. Поэтому, если вам встретились непонятные числа, отважно задавайте вопросы. Более того, в некоторых случаях вопросы ожидаемы. Например, если вам показывают средние значения, спросите о дисперсии, или распределении, или стандартном отклонении. Вы можете также спросить, присутствуют ли в данных какие-либо выбросы, являющиеся результатом ошибок или экстраординарных событий, а также не пропущены ли данные, которые могут оказаться значимыми. Вы можете спросить, чему равна медиана, если представлены средние значения. Интерпретировать среднее значение, не имея данных о его дисперсии, опасно, поскольку результаты отдельных наблюдений могут существенно отличаться друг от друга. Кроме того, если кто-то говорит о данных из конкретного обследования, следует спросить, кто проводил это обследование, какова его методика и как были сформулированы вопросы. Говорить о результатах обследования, не зная ответы на эти вопросы, нельзя. Коротко говоря, имеет смысл приобрести привычку задавать вопросы и исследовать данные: это очень важно для выработки навыков количественного анализа.
Практика количественного анализа
Подобно молодому человеку, спрашивавшему, как найти Карнеги-Холл в Нью-Йорке, если вы хотите выработать навыки, искусство и дисциплину хорошего аналитика, вам следует практиковаться, практиковаться и еще раз практиковаться. Возможно, достигнуть прогресса удастся не сразу. Но трудности неизбежны в любом обучении, и только преодолевая их, вы сможете усовершенствовать свои навыки количественного аналитика – медленно, но неуклонно. Работу эту можно представить в виде тех же шести шагов решения любой проблемы, о которых мы говорили на протяжении всей книги.
Определение и формулирование проблемы. Вероятно, у вас на работе немало проблем. Определите их приоритет исходя из срочности и применимости методов количественного анализа для их решения. На этапе определения проблемы самое важное понять, в чем суть проблемы и почему необходимо ее решить. Ответы на эти два вопроса не только дают представление о преимуществах решения проблемы, но и помогают спланировать следующие этапы.
Обзор предшествующих исследований. Если проблема определена, то следует изучить все имевшие место попытки ее решить. Хотя, как правило, этот этап требует довольно много времени, но поисковики вроде Google обычно весьма полезны. Поиск относящейся к проблеме информации очень важен для правильной оценки ее масштаба и для подбора определяющих переменных. Если вы глубоко разобрались в наработках предшественников, то получите более ясную картину того, как можно проблему решить. Это можно сформулировать так: «Проблема сформулирована правильно, предыдущие попытки изучены, значит, полдела сделано».
Моделирование (выбор переменных). Если очертить круг определяющих переменных удалось еще на этапе изучения предыдущих поисков, то на этом этапе остается отбросить те переменные, которые не связаны непосредственно с поиском ответа на поставленный вопрос. То, какие переменные отбросить, а какие оставить, зависит главным образом от целей построения модели. Если вы хотите собрать игрушечный поезд, то размеры и пропорции поезда реального имеют большое значение. Если же вы хотите оценить экономическую эффективность поезда, то на первый план выдвигаются такие параметры, как скорость, грузоподъемность, потребление топлива. Практикуясь в сосредоточении внимания на отдельных особенностях реального объекта (как это делает карикатурист), вы постепенно нащупываете решение, а ваши количественные навыки совершенствуются.
Сбор данных (измерение). Прежде чем собирать данные по отобранным переменным, надо проверить: а не делал ли этого кто-либо ранее? Очень часто оказывается, что в соседнем департаменте, а иногда и в вашем собственном такие данные уже собирались. Не исключено, что их можно найти в открытом доступе. Даже если придется их купить, это иногда обходится дешевле, чем собирать самому. Если данных, непосредственно относящихся к вашей проблеме, нет, то следует определиться с методологией их сбора. Если вы решили провести опрос, то содержание анкеты и даже формулировку отдельных вопросов необходимо тщательно изучить. Если решено провести эксперимент, то лучше пригласить специалиста для консультаций по методике его проведения. Получение точных и актуальных данных для анализа имеет огромное значение для конечного результата, поэтому на данном этапе не стоит жалеть времени и усилий.
Анализ данных. Анализ данных заключается в поиске устойчивой модели взаимосвязей между ними или между переменными. Статистические методы для анализа подбирают на этапе определения проблемы: после того как будет определена суть проблемы, выбор наиболее подходящего метода анализа становится очевидным. Если для решения проблемы необходимо провести сравнение между группами данных или показателей, то потребуется соответствующая процедура. Если проблема во взаимной связи переменных, то логично выбрать процедуру регрессионного анализа или ей подобную. Поскольку все эти аналитические процедуры широко используются в самых разных ситуациях, имеет смысл потратить время на овладение их теоретическими и практическими аспектами. Наверняка в вашей организации найдется специалист, способный помочь вам советом в этом деле.
Результаты и необходимые меры. Не пренебрегайте этим важным этапом количественного анализа. Успешные аналитические команды уделяют ему столько же времени и внимания, сколько предыдущим пяти. Попросите коллег в компании поделиться опытом демонстрации результатов анализа, обсудите с ними ваши идеи и проблемы. Освойте язык визуализации статистических исследований, например найдите постоянное место на рабочем столе книгам Эдварда Тафти. А если сам Тафти приедет в ваш город с однодневным семинаром «Представление данных и информации», не упустите случай пойти.
Количественные навыки Количественные знания и методы
На этом этапе следует ознакомиться с теоретическими основами количественного анализа. В первую очередь стоит обратить внимание на такие курсы, как «Элементарная статистика» и «Методы исследования». Если вы сможете записаться на них дистанционно, это будет прекрасно. Можно поэтапно осваивать их в интернете или с использованием обычных учебников каждый раз, когда появится требующая решения практическая задача. Многие испытывают трудности, осваивая понятия элементарной статистики, поскольку в некоторых учебниках ничего не пишут об их применении в реальном мире. Поэтому следует очень тщательно подходить к выбору учебника, содержащего информацию о прикладных аспектах применения статистических методов в тех или иных реальных ситуациях. Одной теории тут мало. В качестве основного мы рекомендуем учебник Хайнца Кохлера Statistics for Business and Economics[102]. Один из рецензентов так отозвался о нем на Amazon.com:
Лучший учебник по статистике всех времен и народов!
Грядущий экзамен по статистике пугал меня до смерти. Было такое чувство, что освоить все эти понятия и выводы будет невероятно трудно. Но компоновка материала и структура этой книги настолько удобны для изучения… Статистика никогда больше не будет проблемой для меня. Изумительно, как Кохлеру удалось превратить статистику в легкий и очень интересный предмет[103].
То же самое можно сказать и о методах исследования: по ним написано множество учебников и рецензий. Самое важное в изучении этих базовых курсов – постараться решить приведенные в учебнике примеры. Поскольку большинство задач предназначено для иллюстрации связи теории с практикой, теоретические концепции, закрепленные решением примеров, усваиваются намного прочнее. Если вы прочитаете каждый из выбранных учебников не менее трех раз, то можете считать, что необходимый минимум знаний количественного аналитика вы почти освоили. Теперь остается только практиковаться (практиковаться и еще раз практиковаться).
Количественный аналитик
В бизнесе процедуры количественного анализа осуществляются непрерывно и в социальном контексте. Обычно они охватывают не только саму процедуру анализа, но и подготовку отчета (или проведение презентации), совместную работу в сообществе аналитиков, обмен опытом на семинарах и других подобных мероприятиях, работу с экспертами. Все эти виды деятельности крайне важны для развития аналитических навыков.
Подготовьте отчет
Первый шаг в деле реализации результатов анализа – это подготовка отчета, который расскажет «историю данных». Вы многому научились, читая учебники, но гораздо большему можно научиться, упорно стараясь решить реальную проблему, а затем готовя отчет о результатах. Если вы занялись проблемой, которую многие уже пытались безуспешно решить, то это произведет впечатление; но если это не так, нет причин сожалеть. Уделите пристальное внимание выбору подходящей проблемы, поскольку, как говорил Вольтер, люди оценивают вас по вашим вопросам, а не по ответам. Затем педантично соблюдайте последовательность шести шагов количественного анализа и представьте результаты и предложения в форме отчета. Его подготовка преследует три основные цели:
• вы научитесь чему-то новому и усовершенствуете аналитические навыки, самостоятельно решая реальную проблему;
• вы можете внести серьезный вклад в решение проблемы;
• вы поможете создать атмосферу уважения к аналитике, побудить других мыслить и действовать аналитически.
Не ждите слишком многого от первой же попытки, но убедитесь в том, что в отчете отражены результаты предшествующих исследований, ваши собственные усилия по решению проблемы и доказательства аналитической строгости результатов. Помните о том, что слушатели будут в первую очередь оценивать способ, при помощи которого вы решали проблему, а не только ваши выводы и заключения.
Создайте благоприятную аналитическую среду
Найдите товарища или нескольких коллег и создайте группу количественного анализа. Существует множество причин для создания такой группы: вместе изучать теорию анализа эффективнее, равно как и выполнять аналитические проекты. Группа может более успешно продвигать идеи количественного анализа. В кругу единомышленников можно обсудить приоритет тех или иных аналитических задач, обсуждать проблемы, распределять задания в соответствии с шестишаговой схемой анализа, объяснять суть операций, по очереди проводить презентации. Такие группы – самый надежный и быстрый способ освоить количественный анализ. Как сказал Генри Форд, «собраться вместе – это начало, остаться вместе – это прогресс, работать вместе – это успех». Действительно, небольшая группа людей, обладающих аналитическим мышлением, способна изменить компанию, создав аналитическую атмосферу и мотивируя других думать и действовать аналитически.
Регулярно проводите занятия