Почему. Руководство по поиску причин и принятию решений Клейнберг Саманта
Но, поскольку последовательность событий критически важна, ее достоверности при установлении причинных зависимостей может придаваться слишком большой вес.
Скажем, руководство школьной столовой решает сократить число жареных и высококалорийных блюд и увеличить ассортимент фруктов, овощей и цельнозерновых продуктов. После этого каждый месяц вес учащихся снижается.
Рис. 4.5 показывает искусственную медианную кривую значений веса учащихся по временному параметру (половина значений выше медианы, половина ниже). После изменений в меню заметно внезапное снижение, которое устойчиво держится месяцами. Значит ли это, что такой показатель вызван новыми блюдами здорового питания?
Рис. 4.5. Значение переменной по временному критерию. После изменения значение измеренной переменной падает
Такой вид графика, где наблюдается четкое изменение значения переменной после некоторого события, часто применяется для подтверждения вывода; но вряд ли можно считать его убедительным аргументом. Общий пример подобной ситуации – когда сторонники некоего закона заявляют о падении уровня смертности сразу после его введения в действие, или когда человек уверен, что лекарство вызвало побочный эффект, потому что тот проявился через несколько дней после его приема.
В примере со столовой мы понятия не имеем, идет ли речь о той же самой группе учащихся (возможно, в школу поступили новые дети, которым нравится здоровая пища, а те, кто терпеть не может фрукты, разом переехали); а может, дети или их родители потребовали изменить меню, потому что уже раньше пытались регулировать вес; или в отмеченный период произошло некое изменение, вызвавшее такое следствие (возможно, одновременно наметился рост физической активности в каникулы). Редко бывает так (если бывает вообще), чтобы единственная вещь трансформировалась, а остальной мир пребывал в полнейшей неизменности; поэтому представление динамического ряда всего лишь с двумя переменными ведет к ошибочному представлению о том, что следствие нового фактора проявляется изолированно. Это опять-таки лишь корреляция, пусть и временная.
Вмешательства в реальный мир – это гораздо более сложные и гораздо менее безусловные явления, чем лабораторные эксперименты. Скажем, в районе, где располагается промышленное предприятие, регистрируется ряд предположительных диагнозов рака. В итоге предприятие закрывается, и принимаются меры по ликвидации последствий загрязнения воды и почвы. Если после этого снижается число диагнозов рака, можно ли сделать вывод, что именно производство было причиной заболевания?
Мы действительно не представляем, стал ли зарегистрированный спад совпадением (или сам первоначальный рост был таковым), или же что-то другое в то же самое время вызвало изменения и стало истинной причиной, и тому подобное. Помимо того, количественная статистика порой столь мала, что любые вариации не могут быть статистически значимыми.
Есть общеизвестный софизм, который звучит так: post hoc ergo propter hoc, или «после этого, следовательно, по причине этого». Иными словами, некто ошибочно заключает, что одно событие вызвано другим просто потому, что происходит после него.
Например, можно выяснить, как некий рейтинг поменялся после определенного исторического события: действительно ли уровень смертности в ДТП упал после принятия закона о ремнях безопасности? Однако многие изменения случаются в одно и то же время, и даже вся система целиком может трансформироваться в результате вмешательства. О вызове под названием «смерть» мы поговорим в главе 7. Но возможно, однако, что здоровая пища в школьной столовой лишь косвенно вызвала потерю веса, просто побуждая учеников активнее заниматься спортом. Аналогично временные паттерны (к примеру, если спортивная команда побеждает каждый раз, когда перед матчем идет дождь) могут заставить кого-то решить, что это причинная зависимость, даже если события с большой долей правдоподобия можно объяснить совпадениями.
Такая проблема нередко возникает, если концентрироваться на коротком временном промежутке, игнорируя долгосрочные колебания. Две экстремально снежные зимы подряд, рассматриваемые в отрыве от исторических данных, ведут к ошибочному выводу о погодных паттернах холодного сезона. Но если вместо этого проанализировать данные за десятилетия, мы увидим годовые колебания в рамках общего тренда. Наконец, два события могут происходить одновременно только потому, что такую вероятность создают другие факторы. К примеру, если детям дают новую пищу примерно в том же возрасте, когда у них проявляются симптомы определенного заболевания, многие отметят видимую связь между двумя событиями, потому что они всегда случаются примерно в одно время.
Итак, здесь имеет место софизм cum hoc ergo propter hoc («вместе с этим, значит, вследствие этого»), или выявление причинной связи между событиями, которые всего лишь произошли одновременно. Отличие от post hoc («после этого») в том, что это временная последовательность событий, и поэтому такая ошибка встречается особенно часто.
Как всегда, для первого события и следствия может быть общая причина (к примеру, действительно ли лекарства от депрессии заставляют людей совершать самоубийство, или люди, подверженные депрессии, более склонны к самоубийству и употреблению антидепрессантов?); однако следствие также могло случиться само по себе и просто случайно предшествовало причине.
У меня разболелась голова, и я принял некое средство. Через несколько часов боль ушла. Можно ли утверждать, что помогло лекарство? Временной паттерн позволяет сделать предположение, что ослабление симптома произошло благодаря приему лекарства, однако я не могу сказать наверняка, что боль не прошла бы сама. Мне пришлось бы провести множество выборочных экспериментов, где я бы принимал или не принимал препарат, а потом записывал, как быстро исчезала головная боль, чтобы иметь возможность утверждать хоть что-то относительно подобной причинной зависимости. В главе 7 мы рассмотрим, почему результаты такого эксперимента окажутся малоубедительными и почему придется сравнивать действия лекарства и плацебо.
Точно так же, как близлежащие по времени события могут привести к ошибочным заключениям о причинности, длительные задержки между причиной и следствием способны помешать достоверному установлению причинно-следственных связей. Некоторые следствия наступают быстро (удар по бильярдному шару заставляет его двигаться), а некоторые процессы протекают в замедленном режиме. Известно, что курение вызывает рак легких; но между первой сигаретой и днем, когда диагностируют рак, пролегают долгие годы. Побочные эффекты от приема некоторых препаратов проявляются через десятилетия. Перемены в состоянии здоровья благодаря физическим упражнениям достигаются медленно и не сразу, и, если мы будем ориентироваться только на стрелку весов, может показаться, что вес сначала даже увеличивается, потому что мускулы наращиваются быстрее, чем уходит жир. Ожидая, что следствие должно идти непосредственно за причиной, мы не видим связи между этими глубоко взаимозависимыми факторами. Ученым чисто технически непросто собрать данные за десятилетия, чтобы выявить факторы, влияющие на здоровье. Но проблема частично заключается в том, что и обычным людям сложно выявить условия, коррелирующие с их состоянием здоровья, такие как диета и физическая активность.
5. Наблюдение. Как выявить причину, наблюдая за порядком вещей
Однажды по пути на работу я увидела в нью-йоркской подземке объявление: «Получите образование, найдите работу, не заводите детей до брака – и 98 шансов из 100, что бедность вам не грозит!» Цель этого объявления – профилактика подростковой беременности. Неясно, однако, как интерпретировать подобную статистику. Похоже, рекламщики предполагают, что если девушка-тинейджер совершит все вышеизложенное, то с вероятностью 98 % избежит нищеты. Но так ли это? И подразумевается ли, что она в настоящий момент не должна испытывать проблем с деньгами или никогда в жизни не окажется за чертой бедности?
Этот прецедент взят из исследования, где изучались показатели обнищания среди людей с различными характеристиками – такими как семейный статус, возраст и образование, – а потом подсчитывалось, какая часть этой группы населения живет за чертой бедности[182]. Но все равно оказывается, что итоговая статистика основана лишь на данных наблюдений.
Никто пока не ввел в действие политику (в рамках всего общества или индивидуально), стимулирующую беременность подростков или препятствующую ей, опускающую их на дно или поднимающую в общество богатых. А значит, статистика всего лишь описывает некие характеристики, наблюдаемые у населения. Из тех, кто уже окончил школу, получил работу и вступил в брак до рождения детей, 98 % не оказались в нищете. Но если кто-то собирается завершить среднее образование, начать трудиться и завести семью, их личные шансы оказаться среди бедноты могут варьироваться.
Здесь явно то же отличие между риском любой семьи попасть в группу воздействия СВДС (синдрома внезапной детской смертности) и шансами ребенка из конкретной семьи умереть от СВДС (см. главу 1).
Может случиться и так, что аналогичные условия, из-за которых кому-то не удалось окончить школу или найти работу, сами ведут к бедности и находятся вне контроля конкретных молодых людей. Вероятно, им приходится заботиться о пожилом родственнике, или у них ограниченный доступ к медицинской помощи либо поддержке со стороны семьи. Это значит, что они попросту не смогли получить работу из-за сторонних факторов (например, не нашли сиделку для пожилых родителей); но даже соответствие всем трем критериям не изменило бы фактор подверженности риску бедности, если бы он в итоге определялся теми самыми сторонними факторами (к примеру, высокими ценами на медицинские услуги). То есть если бы невозможность окончить школу, получить работу и избежать беременности до брака стали всего лишь иным следствием некоего условия, также ведущего к бедности, то вмешательство в эти обстоятельства было бы сродни влиянию на следствие вместо причины. Бедность может вызываться случайными обстоятельствами, на которые намного сложнее воздействовать: к примеру, дискриминацией, отсутствием рабочих мест в регионе или некачественной системой образования.
Этот факт может иметь громадную значимость для формирования социальной политики. Если мы поставим во главу угла повышение доступности образования и занятости, не зная при этом, что мешает людям получать и то и другое и действительно ли эти факторы оказываются причинами бедности, намного труднее проводить эффективное вмешательство. По-прежнему будут препятствия к финансовой безопасности, которым не уделяется внимание, а мы не будем знать, действительно ли работаем над целевыми факторами, способными обеспечить желаемый результат. Далее, все указанные свойства могут быть следствиями бедности, и, возможно, воздействие должно быть нацелено непосредственно на то, что наполнит карманы людей звонкой монетой[183]. В главе 7 и главе 9 мы подробнее поговорим, как осуществлять успешные вмешательства и какая информация нужна, чтобы спрогнозировать последствия конкретного воздействия.
Напротив, если мы бы имели возможность заставить людей в адресном порядке окончить (или не окончить) школу и поставили бы их выборочно в соответствующие условия (безотносительно прочих обстоятельств), то смогли бы изолировать влияние этих действий на их экономическую ситуацию в будущем. Реальность такова, что наблюдение – часто все, что у нас есть. Неэтично проводить эксперименты, где бы требовалось выяснить, что такое подростковая беременность – следствие или причина бедности (а может, это вообще порочный круг).
Точно так же ученые часто пытаются определить эффект воздействия СМИ (может ли рекламная кампания повлиять на общественное мнение? На самом ли деле передача 16 and Pregnant[184] канала MTV изменила уровень подростковой беременности?). В этих случаях мы не только не способны контролировать влияние на отдельных лиц, но даже редко в силах определить, было ли такое влияние вообще. Часто исследователи вынуждены полагаться на сводные показатели рынка СМИ, где демонстрировалась реклама, и на то, как данные опросов общественного мнения в конкретном регионе изменялись со временем по сравнению с другими. Иногда нереально отслеживать участников эксперимента достаточно долгое время, или же эксперименты оказываются чрезмерно затратными. Чтобы десятилетиями наблюдать группу значительного размера, как в проекте «Фрамингемское исследование сердца»[185],[186], необходимы масштабные изыскания; на практике это скорее исключение, чем правило.
В этой главе мы поговорим о том, как проникнуть в порядок вещей, лишь наблюдая за происходящим. Рассмотрим ограничения как этих методов, так и данных наблюдений в целом.
Закономерности
Скажем, группа программистов устраивает хакерский марафон. Компьютерщики, обожающие работать по ночам, вряд ли могут похвастаться сбалансированной и здоровой диетой, так что многие из них, чтобы продержаться до рассвета, сидят на крепком кофе, пицце и энергетических напитках. К несчастью, на следующий день, когда раздают награды, многие члены команды оказываются больны или по какой-то причине не выходят на связь. Как определить, какие факторы вызвали недомогание?
Попытка понять, что общего и в чем разница у групп с отмеченным или не наблюдаемым определенным результатом, – одна из классических сфер приложения метода, разработанного в XIX веке Джоном Миллем[187] (где подавляющее большинство примеров – это пищевые отравления)[188].
Прежде всего мы можем задаться вопросом: что общего во всех ситуациях, где имеет место некое следствие? Если потребление энергетических напитков – единственный совпадающий фактор для всех случаев головной боли, это дает некоторое доказательство в пользу утверждения, что ее вызывают, возможно, энергетики. Именно это Милль называл методом согласованности. В примере на рис. 5.1 нас интересуют случаи, когда головная боль есть, так что мы просто возьмем из таблицы колонки, где отмечены люди с этой проблемой.
.
Рис. 5.1. J-образная кривая
Итак, мы начнем только с ситуаций, где следствие имеет место, а потом вернемся и посмотрим, что у них общего. Отметим: единственное совпадение – потребление энергетических напитков, а стало быть, по методу согласованности, это и есть причина головных болей.
Согласованность предполагает, что для следствия необходима причина, ибо следствие не наступает до причины. Это, однако, не означает, что следствие происходит каждый раз, когда имеет место причина. Речь идет о достаточности[189]. Например, как следует из табл. 5.1, Бетти также пьет энергетические напитки, но головной болью не страдает. Итак, мы не готовы утверждать, что энергетики – достаточное условие головной боли. Как и относительно трудов Юма, можем только сказать, что эти факторы истинны касательно того, что мы наблюдали.
Таблица 5.1. Применив метод согласованности Милля, мы обнаруживаем, что энергетические напитки вызывают головную боль
На основе ограниченной выборки мы не имеем права заявлять о необходимости или достаточности.
Одно из ограничений такого подхода – требование согласованности каждого конкретного случая. Если сотни людей заболевают, а один нет, здесь не найти причинной зависимости. Заметим, этот метод не принимает в расчет то, что Бетти тоже пила энергетики, но голова у нее не разболелась. Именно поэтому он скажет только о необходимости, но не о достаточности: не рассматривается возможность ненаступления следствия при наличии причины.
Чтобы определить достаточность, посмотрим, в чем отличие между ситуациями, когда следствие наступает и когда нет. К примеру, если все, кто на следующий день чувствовал себя уставшим, бодрствовали ночь напролет, при этом несколько не уставших человек немного поспали, мы могли бы сказать, что полное исключение сна есть достаточное условие (для этого примера) усталости наутро. Это и есть метод согласованности Милля.
С помощью табл. 5.2 путем сравнения мы узнаём, чем отличаются ситуации с наличием и отсутствием усталости. Заметим, что случаи усталости согласованы по всем четырем факторам, а значит, мы не можем выделить из них единственный как причину, если применить метод согласованности. Изучив отличия, мы увидим, что бодрствование допоздна кажется единственным условием, коррелирующим со следствием. При согласованности это довольно жесткое требование, поскольку могут возникнуть неожиданные ситуации, даже если усталость по-прежнему останется в статусе причины.
Таблица 5.2. Применив метод дифференциации Милля, мы обнаружим, что бодрствование по ночам вызывает усталость
В следующей главе мы изучим вероятностные методы, которые не требуют столь жесткой взаимозависимости, но используют показатель относительной частоты встречаемости.
Повторим еще раз: причина есть необходимое условие следствия, если оно не может произойти без причины (каждому факту следствия предшествует факт причины), и причина есть достаточное условие следствия, если она без него не может быть (за каждым фактом причины должен идти факт следствия). Причина может быть необходима, но не достаточна и наоборот. В хакерском марафоне каждый факт усталости, которому предшествует работа допоздна, делает последнюю необходимым условием усталости, но ничего не говорит о ее достаточности (может, некоторые люди бодрствуют всю ночь и не устают).
Аналогично каждый случай употребления энергетика, за которым следует головная боль, свидетельствует, что эти напитки – достаточное условие головной боли, но не необходимое (поскольку бывает головная боль иной этиологии).
Итак, некоторые причины могут быть одновременно необходимыми и достаточными для указанных следствий.
Возьмем табл. 5.3. Чтобы выяснить, какие причины одновременно необходимы и достаточны, объединим согласованность и дифференциацию – способ, названный Миллем «метод согласованности и дифференциации». Здесь мы рассмотрим факторы, общие для всех случаев наступления следствия – и только для них.
Таблица 5.3. Используя единый метод согласованности и дифференциации Милля, мы видим, что кофе способствует боли в желудке
Итак, люди, у которых разболелся желудок, и бодрствовали ночью, и пили кофе. Значит, по методу согласованности, эти факторы могут иметь характер причинности. Посмотрим, отличаются ли они для случаев, когда следствие наступает и когда нет. Диана бодрствовала допоздна, но желудок у нее не болит, а значит, работа по ночам не удовлетворяет критериям метода дифференциации. С другой стороны, потребление кофе им удовлетворяет, так как все те, кто выпил много кофе, ощутили боль в желудке, а никто из воздержавшихся этим недугом не страдал. Таким образом, кофе есть одновременно необходимое и достаточное условие больного желудка, если исходить из таблицы.
Итак, в чем же подвох?
Представьте, что 2000 человек заболели, поев немытых фруктов, при этом двоим удалось избежать пищевого отравления, а еще несколько отравились недоваренной курицей. Методы Милля не нашли бы никакой причинной зависимости между фруктами и отравлением, поскольку здесь нет ни необходимости, ни достаточности. Многие примеры каузальности, взятые из реальной жизни, не соответствуют обоим случаям, так что это условие очень строгое. В целом всего несколько контрпримеров не должны заставить полностью сбрасывать со счетов причины; однако такой метод все же может дать чисто интуитивную ниточку в исследовании каузальных гипотез. К тому же он соответствует некоторым способам качественного выяснения причин[190].
К тому же на практике единственная причина и единственное следствие – редчайший случай.
Допустим, люди едят пиццу, допоздна не спят и пьют немереное количество кофе. Это приводит к тому, что все они одновременно заболевают различными хворями. Если мы видим, что все вместе жалуются на усталость и больной желудок, при этом нет других факторов, общих для всех или отличных, что можно сделать?
В некоторых ситуациях достаточно выяснить различие между причинами, которые привели к каждой болезни. К примеру, из табл. 5.4 мы знаем, что бодрствование по ночам порождает усталость. Итак, то, что Алан, Бетти и Диана устали, объясняется ночным бдением за компьютером. Тогда можно просто взглянуть, в чем сходство и различие в случаях с больным желудком (избыточное потребление кофе), предположив, что должно быть что-то еще, вызывающее подобное недомогание, поскольку неизвестно, повинно ли в этом отсутствие ночного сна.
Таблица 5.4. Используя метод остатков Милля, мы видим, что кофе ведет к боли в желудке
Если проигнорировать усталость и бодрствование допоздна, вторым общим фактором будет кофе. Хотя люди с больным желудком часто тоже не рано ложатся, Милль делает допущение, что мы в итоге можем отбросить известные причины и следствия. Зная, что ночная работа вызывает усталость, нужно посмотреть, что останется после того, как мы примем во внимание эту причину и следствие. Если выявлена одна причина, она и есть вина оставшегося следствия. Это так называемый метод остатков. Конечно, предполагается, что нам известны все следствия других возможных причин и каждая имеет только одно следствие. Если же бодрствование допоздна и потребление кофе совместно вызывают боль в желудке, к этому заключению нельзя прийти подобным образом.
Этот метод способен дать гипотезы по поводу того, что могло вызвать результаты наблюдений, но не может доказать каузальную природу взаимосвязи. Мы вообще ничего не упоминали о наборе переменных или о том, откуда они берутся. Переменные всегда представляют собой подгруппу возможно измеримых показателей; вероятно, они отобраны на основе воспринимаемого соответствия или просто суть результаты фактических измерений при анализе данных после наступления события.
В результате набор гипотез может не охватывать истинных причин, и мы либо терпим поражение в поиске вины конкретного следствия, либо обнаруживаем всего лишь ее индикатор. Иными словами, если каждый, кто ел пиццу, к тому же напился воды подозрительной чистоты, а вода не включена в набор переменных, то мы придем к выводу, что пицца и есть причина. Просто этот индикатор дает сведения о потреблении воды, даже если на самом деле это и не причина. И если бы мы учли потребление воды, если взаимосвязь между водой и пиццей безусловна (все, кто ел пиццу, пили воду, и каждый, кто пил воду, ел пиццу), мы не смогли бы выделить пиццу в качестве единственной причины, поскольку на деле оба фактора могут быть таковыми. Именно поэтому, не наблюдая их по отдельности, мы видим только четкую закономерность между обеими потенциальными причинами и следствием.
Эта проблема не специфическая только для методов Милля: она важна в более широком смысле выведения причинно-следственных связей из данных наблюдения. Если, с другой стороны, мы провели бы эксперимент, заставив людей поесть пиццы без воды, а потом наоборот, это, видимо, решило бы проблему. Мы бы поняли, что заболели только те, кто пил воду (и не важно, ели они пиццу или нет).
Итак, возможно, наши программисты, работая ночью, решили приналечь на пиццу. Если избыточное ее потребление провоцирует набор веса, можно ожидать, что люди будут толстеть. Очередной метод Милля назван «сопутствующее изменение», когда просматривается зависимость реакции от дозы для причины и следствия. По мере количественного роста причины растет и объем следствия. К примеру, если некое исследование утверждает, что кофе снижает риск смертности до определенного возраста, мы можем решить, что должна наблюдаться дифференциация риска в зависимости от того, сколько кофе пьет некий индивидуум. С другой стороны, если одна чашка кофе в день оказывает в точности тот же эффект, что и десять, кажется более правдоподобным наличие чего-то еще, реально снижающего риск, помимо кофе.
Разумеется, реальность всегда сложнее, и может не быть линейной зависимости между причиной и следствием. К примеру, алкоголь в маленьких количествах способен положительно воздействовать на самочувствие. Однако избыточное потребление спиртных напитков – вещь крайне нездоровая. Известна так называемая J-образная (или восходящая) кривая, которая отображает соотношение потребления спиртного и, например, ишемической болезни сердца (рис. 5.1). Симптомы заболевания уменьшаются при потреблении до 20 г в день, а потом начинают усиливаться[191]. Среди других аналогичных зависимостей – гипотетическая связь между интенсивными физическими упражнениями и инфекционными заболеваниями[192], а также между потреблением кофе и количеством инфарктов[193]. Как и со многими лекарственными средствами, для этих факторов есть предел, после которого они могут причинять вред. Итак, мы не обнаруживаем ожидаемого соотношения между дозой и реакцией и наблюдаем затухание эффекта после некой точки вместо постоянного роста.
Один из самых знаменитых в истории примеров применения методов Милля – когда Джон Сноу обнаружил, что именно спровоцировало вспышку холеры 1854 года в Лондоне[194]. Он не копировал методы Милля, однако используемый им подход строился по тому же принципу.
Тогда никто не знал, каким путем распространяется болезнь, но карта города (с нанесенными очагами инфекции) дала возможность увидеть резкие отличия между районами. Передавался ли возбудитель от одного человека к другому? Или болезнь вызвало что-то по соседству? А может, у людей, проживающих в зараженных районах, имелось нечто общее?
Сноу обнаружил, что самая высокая смертность отмечалась не просто в конкретном географическом районе, а возле водяной колонки на Брод-стрит:
В домах, расположенных ближе к колонке на другой улице, умерли всего 10 человек. В пяти случаях из этих 10 родственники больных сообщили, что они всегда ходили к колонке на Брод-стрит, потому что предпочитали воду из нее другим колонкам, даже если те располагались ближе. В трех других случаях это были дети, которые шли в школу мимо колонки на Брод-стрит[195].
Увидев, что умершие в основном пользовались этой колонкой, Сноу рассмотрел, видимо, не соответствующие этой тенденции случаи, когда люди не жили по соседству, и выяснил, что они тоже брали воду на Брод-стрит. Это и есть в точности метод согласованности Милля, где выясняется, что общего у всех случаев наступления следствия (например, заболевание холерой). Сноу также применял метод дифференциации, когда писал, что «в этой части Лондона не отмечалось никаких особых вспышек или заболеваемости холерой, кроме как среди людей, имеющих обыкновение пить воду из вышеупомянутой колонки»[196]. Иными словами, доказал, что заболеваемость возросла в группе лиц, пользовавшихся колонкой, и только в этой группе.
Единственная проблема с методами Милля – ситуация, когда причина обусловливает, с той или иной долей вероятности, зависимость следствия от иных факторов. К примеру, два лекарственных препарата сами по себе могут не влиять на содержание глюкозы в крови, однако, взаимодействуя при одновременном приеме, способны существенно повысить ее показатель. Один из вариантов преодолеть эту трудность – не концентрироваться на парных зависимостях между отдельно взятыми причинами и следствиями, но рассматривать комплекс условий, вызывающих следствие. Так, одной из причин дорожного происшествия может быть нетрезвое вождение в комбинации с близко проезжающими машинами, другой – плохая видимость на обледеневшей дороге и неосторожное вождение, третьей – нарушение скоростного режима и отправка электронных сообщений за рулем.
Подобные ситуации часто возникают в эпидемиологии, где принято считать, что причины всегда взаимосвязаны, и такие факторы, как длительная подверженность окружающим условиям, образ жизни, острые кратковременные воздействия (например, инфекционные заболевания) и так далее, комбинированно влияют на здоровье. Взяв за основу подобные рассуждения, эпидемиолог Кеннет Ротман[197] ввел идею изображения таких комплексов причин в виде секторных диаграмм[198].
Секторная диаграмма причинно-следственных связей – группа факторов, достаточных для возникновения следствия, которая содержит все необходимые для этого компоненты. На рис. 5.2 изображены такие диаграммы для всех трех примеров с вождением.
.
Рис. 5.2. Три причинных комплекса дорожных происшествий
В этом примере каждая диаграмма – достаточное условие для наступления следствия, поэтому ДТП произойдет в каждом случае присутствия этих факторов. Но каждый из них по отдельности не необходимый, поскольку лишь множество условий вызывают следствие. Соблюдение требования, что причина всегда производит следствие (по утверждениям Милля и Юма), в то время как могут существовать необходимые условия для проявления следствия, которых нет в наличии; или что причина есть необходимое условие каждого случая проявления следствия, когда может быть множество возможных его причин, – это исключительно жесткие рамки. В реальности разнообразные следствия могут проявляться множеством различных путей, для чего часто требуется целый набор факторов.
Таким образом, согласно одной из концепций, причина есть компонент группы факторов, которые вместе оказываются достаточным условием возникновения следствия. Правда, такая группа может не быть необходимой, поскольку их способно оказаться множество. Этот подход разделяет Джон Маки[199], который описывает причины как INUS (недостаточные, но необходимые компоненты не-необходимых, но достаточных условий)[200]. В примере с секторными диаграммами каждый «кусочек пирога» сам по себе недостаточен (поскольку, чтобы вызвать следствие, нужны другие кусочки), но необходим (потому что, если какой-нибудь кусочек будет упущен, следствие не возникнет). С другой стороны, любая диаграмма (или «пирог») сама по себе не необходима, поскольку таких пирогов может быть много и каждый окажется достаточным условием следствия.
Итак, вместо того чтобы пытаться выделить такие факторы, как экономика, рекламные кампании конкурентов или рейтинги общественной поддержки, в качестве единственной причины результатов выборов, мы отобразим все сопутствующие факторы и, возможно, попробуем выяснить их относительную значимость.
Но не все причины становятся необходимыми INUS-условиями. К примеру, причинно-следственная связь может не иметь характер детерминизма, так что, даже если бы мы владели всей возможной информацией и наблюдали все необходимые условия, следствие не всегда возникало бы. Один из примеров индетерминизма – радиоактивный распад, где никогда нельзя знать наверняка, будет ли иметь место распад частицы в конкретный момент времени: нам известна только вероятность события. INUS-условие распада – вещь невозможная, поскольку достаточных условий здесь не существует. Точно так же могут наблюдаться INUS-условия, не оказывающиеся причинами, если, как в примере с пиццей и водой, у нас нет корректного набора переменных. Точность и полнота логических выводов всегда зависят от полноты данных.
Вероятности
Эта глава начиналась со строчки из рекламного объявления: «Получите образование, найдите работу и не заводите детей до брака – и 98 шансов из 100, что бедность вам не грозит!» Само утверждение – попытка вывести причинную зависимость: когда такие факторы, как высшее образование, работа и брак до рождения детей, считаются истинными, вероятность, что удастся избежать бедности, составляет 0,98. Эта статистика особо убедительна потому, что шансы очень близки к стопроцентным; и все же высокая вероятность не значит, что это соотношение каузально. Точно так же, как может иметь место сильная вероятностная зависимость, не носящая причинного характера, могут существовать и каузальные зависимости, когда причина снижает или не меняет вероятности наступления следствия вообще.
Так в чем же привлекательность вероятностных концепций причинности?
Как и в примере с радиоактивным распадом, одна из причин, по которой мы нуждаемся в вероятностных подходах (не требующих, чтобы причина всегда и безусловно производила следствие или каждый раз ему предшествовала), состоит в том, что некоторые отношения не детерминированы. В таких случаях при всем знании мы не можем быть убеждены, произойдет ли то или иное следствие. Здесь не только не будет закономерности в событиях, какую требуют все ранее описанные подходы, но также ни одна комбинация переменных не даст возможности ее установить.
Примеры индетерминизма часто встречаются в физике (например, в квантовой механике), а также в более приземленных ситуациях – скажем, при неисправности оборудования.
Но во многих других случаях, однако, вещи кажутся недетерминированными лишь в силу нехватки знаний – даже если их можно целиком спрогнозировать на основе полной информации. Не все, кто работает с асбестом, заболевают раком; лекарства дают побочный эффект только части пациентов; сходные условия не всегда приводят к образованию пузыря на фондовой бирже. Может, однако, случиться так, что, зная досконально действие лекарства или имея возможность пронаблюдать достаточно побочных эффектов и пациентов, у которых они обнаруживаются, можно выявить набор необходимых факторов.
Нам в основном приходится иметь дело не только с показателями наблюдений (нельзя заставить людей стать заядлыми курильщиками, чтобы посмотреть, кто из них заболеет раком), но еще и с неполными данными. Это означает, что мы упускаем некоторые переменные (вероятно, сведения по аэробной способности – лишь результаты оценки, а не измерения с помощью теста VO2 max[201] на «бегущей дорожке»), можем наблюдать данные только на ограниченном временном отрезке (отслеживаем последствия хирургической операции 1 год, а не 30 лет) или берем пробы в режиме, далеком от идеального (отмечаем обмен веществ в тканях мозга раз в час вместо режима ЭЭГ). Проблема может заключаться в затратности (в масштабных исследованиях делать тесты VO2 max неразумно с финансовой точки зрения, а также длительно по времени и потенциально небезопасно для больных людей), возможности сбора данных (редко есть шанс следить за человеком десятки лет) или технологических ограничениях (микродиализ[202] для измерения метаболизма – процесс медленный). Вероятностные подходы часто путают эти вероятности (одна – из-за недостатка знаний, другая – из-за природы самой зависимости), однако стоит помнить, что это разные вещи.
Один из главных мотивов использования вероятностных определений причинности – наше желание знать, служит ли нечто причиной и насколько важно это нечто. Иными словами, мы стремимся различать обычные и редкие побочные эффекты лекарственного средства или сформулировать политическую концепцию, которая вероятнее всего привела бы к росту рабочих мест. Один из методов, позволяющих квантифицировать степень влияния причины на следствие, – определить силу следствия, когда переменные непрерывны (например, как повышается цена акции после выпуска новостей), или вероятность некоего события, когда они дискретны (например, какова вероятность, что цена на акции пойдет вверх).
Но часто все, что удается вычитать в книгах на тему причинно-следственных взаимосвязей, это утверждение, что риск некоторого исхода увеличивается по некоторой причине. Вот несколько начальных строк из статей в научных изданиях:
Ученые утверждают: лечение бессонницы у людей, страдающих от депрессии, может вдвое повысить шансы на полное исцеление[203].
Как утверждает группа исследователей из Гарвардской школы здравоохранения (HSPH), несколько чашек кофе в день снижают риск суицида у взрослых примерно на 50 %[204].
Мужчины пожилого возраста чаще, чем молодые, становятся отцами детей, у которых впоследствии развиваются аутизм или шизофрения. Причина – случайные мутации, риск которых растет с приближением к концу возраста отцовства; об этом сообщили ученые, проведя первое исследование с целью квантификации этого эффекта, который усиливается год от года[205].
Множество других статей начинается с упоминания о снижении или повышении риска, при этом точные цифры роста или падения даются несколькими абзацами ниже. И даже в этом случае данные, приведенные во всех подобных примерах, относительны: удвоить шансы или снизить риск на 50 %. Конечно, фраза «удвоить шансы на некое событие» может прозвучать совсем по-другому, однако, когда речь заходит о двух событиях вместо одного, все гораздо менее убедительно. Скажем, повышение риска инсульта у человека, иногда употребляющего алкоголь, составит либо 0,0000001–0,0000002, либо 0,1–0,2. В обоих случаях шансы удваиваются, но в первом удвоению подлежит очень маленькое число, и результирующее число также остается крайне малым.
На рис. 5.3 это различие представлено наглядно. Для набора из 10 000 000 событий самая низкая степень вероятности составит всего 1, а потом 2. Таким образом, для каждого отдельного события на рисунке есть обозначающие их точки, в то время как каждая из остальных точек на рисунке обозначает 10 000 событий. Итак, при том же удвоении относительного риска можно иначе решить вопрос с курением, когда станут видны абсолютные значения.
Рис. 5.3. Каждая точка представляет 10 000 событий, кроме нижних двух картинок, где черные точки обозначают единичные события. Вероятность событий, представленных черными точками, удваивается от левых картинок к правым, однако необходимо также принимать во внимание общее количество событий
Эту идею степени влияния причины на следствие, или количества вероятности, очень важно вспомнить позднее, при рассмотрении проведения и оценки экспериментов и формулирования политических концепций. Кроме того, постарайтесь держать ее в уме, когда будете в следующий раз читать о новейшем научном открытии.
Особо важно знать размер выборки (велика ли численность исследуемого населения), поскольку без значительного количества наблюдений мы не сможем даже дифференцировать эти результаты[206]. Различие может объясняться естественными вариациями, помехами или погрешностями измерений. К примеру, в зависимости от индивидуальных факторов риска, риск субарахноидального кровоизлияния – редкий, но часто приводящий к смерти вид геморрагического инсульта – составляет всего 8 на 100 000 человеко-лет[207]. Это значит, что если отслеживать 100 000 человек в течение года или 10 000 человек в течение 10 лет, можно ожидать, что мы увидим 8 случаев инсульта. Поэтому гораздо менее вероятно наблюдать истинные вероятностные показатели на меньших выборках: в результате эта цифра может составить 8 или 0 событий, что приведет к некорректным заключениям о степени риска.
Подобно тому как в центре юмовского подхода к причинности лежит регулярная повторяемость событий, идея вероятностной причинности основана на том, что причина повышает вероятность наступления следствия.
Если одно событие не имеет причинно-следственной связи с другим, вероятность второго не должна изменяться после того, как станет известно о первом. К примеру, вероятность выпадения орла или решки при подбрасывании монетки составляет , при этом вероятность того или другого исхода не меняется после первого броска, поскольку все события независимые. То есть вероятность выпадения орлов четко равна вероятности выпадения решек, если при предыдущем броске выпала решка.
Эта концепция представлена на рис. 5.4 (a) в виде эйкосограммы (также ее называют мозаичной диаграммой или диаграммой Маримекко[208]). По оси Х указаны возможные исходы первого события (орлы или решки), по оси У – исходы второго события (также орлы или решки). Ширина столбцов отражает вероятность выпадения орла или решки при первом броске (если монетка сильно несимметричная, первый столбец будет очень узким), а высота серых столбцов показывает вероятность выпадения орла при втором броске (оставшаяся область обозначает вероятность выпадения решки).
Рис. 5.4. На диаграммах представлены условные вероятности. Как только вы выбираете событие в нижней части (например, К), вероятность второго события (не С) обозначается закрашенным столбцом. С маловероятно после К (маленький столбец), в то время как орел или решка с равной степенью вероятности выпадают после любого броска (столбцы одинаковых размеров)[209]
Так как вероятность любого исхода абсолютно одинакова, все сегменты равны[210]. С другой стороны, вероятность того, что конкретного человека изберут кандидатом в вице-президенты, выше или ниже в зависимости от того, кто будет претендовать на президентский пост: тут важны политические убеждения и альянсы, так что эти события зависимы.
На интуитивном уровне, если нечто влечет за собой следствие, после появления причины следствие должно произойти с большей вероятностью, чем обычно. То есть в местностях, где обитают малярийные комары, должно отмечаться больше случаев заболевания, так как комары – разносчики инфекции. Причина также может снизить вероятность следствия – если точнее, причина повышает вероятность отсутствия его наличия. Так, если калий успокаивает мышечные судороги, мы должны отмечать меньше подобных случаев после принятия препаратов калия. Этот случай показан на рис. 5.4 (б), когда вероятность потребления калия (К) ниже, чем непотребления, так что соответствующий столбец уже. Однако большая часть столбца закрашена, поскольку шанс отсутствия мышечных судорог (нет С) намного выше, чем шанс судорог при принятии калия. И наоборот, возможность начала судорог без добавления в организм калия намного выше.
Это простая идея повышения или снижения вероятностей способна привести одновременно как к ложным утверждениям о причинности (поскольку может показаться, что непричины усиливают вероятность следствий), так и к невозможности эту связь выявить (так как не каждая причина увеличивает вероятность следствия).
В главе 3 мы познакомились с корреляциями и порядком их возникновения. В некоторых ситуациях они оказываются результатом простого совпадения, в других же можно протестировать так много гипотез, что рано или поздно совершенно случайно проявится нечто значительное.
Еще может случиться так, что используемые переменные не будут точно представлять фактические причины. К примеру, о диете скажут, что она обеспечивает определенный уровень похудения, однако соответствующей переменной, вызывающей потерю веса, может стать следование любой диете, а не той конкретной, которую мы тестируем. Возможно также, если мы просто рассмотрим зависимость двух факторов, обнаружится множество аналогичных закономерностей вследствие неких структурных условий. В главе 3 мы видели выявление ложной корреляции между потреблением шоколада в стране и количеством Нобелевских лауреатов среди ее жителей. Возможно, повышенные объемы вина, сыра или кофе имели бы не менее сильные ассоциации с Нобелевками. Действительно, согласно одному исследованию, среди прочего наблюдалась взаимосвязь между числом Нобелевских премий и количеством магазинов IKEA[211]. Таким образом, потребление шоколада могло быть аналогом некоего индикатора населения, который повышает вероятность одновременного поедания этого продукта и получения Нобелевки, например благосостояния и ресурсов страны.
Именно на подобный тип общей причины нередко возлагают вину, когда одна переменная, кажется, делает другую более вероятной, но в действительности ее причиной не служит. К примеру, если рецессия приводит одновременно к снижению инфляции и безработице, можно решить, что каждый из этих факторов повышает шансы на проявление другого. Мы просто берем пары переменных и интересуемся, усиливает ли одна из них вероятность другой.
Есть и такая методика работы со смешиванием эффектов из-за общих причин (когда измеряются все переменные) – выяснить, можно ли с помощью одной переменной оправдать корреляции между другими. Это ключевой атрибут множества вероятностных подходов, разработанных философами (такими как Саппс (1970), Гуд (1961) и Рейхенбах (1956)), на котором построены вычислительные методы выведения причин по имеющимся данным.
Скажем, некое заболевание (D) вызывает утомляемость (F) и обычно лечится определенным лекарством (М). Идея в том, что смена препарата не приведет к улучшению состояния пациента (утомляемости), если проблема вызвана только болезнью и не решается лекарством. Если заболевание остается константой, другие переменные не дают никакой информации друг о друге. Концепция общей причины, которая подобным образом разделяет следствия, называется экранированием[212].
Обратимся к диаграмме на рис. 5.5 (а). Есть лекарство, и есть усталсть; похоже, первое повышает вероятность второй. Серый столбец выше для усталости, чем для неусталости, показывая, что вероятность выше для случая, когда лекарство истинно, чем ложно. Но как только мы разделим варианты, когда человек болен и когда нет (рис. 5.5 (б) и 5.5 (в)), вероятность усталости уравнивается, вне зависимости от значения препарата. Таким образом, лечение не меняет возможность усталости, как только мы получаем знание о болезни.
Рис. 5.5. Если не принимать во внимание состояние заболевания, кажется, что M и F коррелируют. Если, однако, учитывать этот фактор, корреляции нет (F равновероятен независимо от истинности М)
Подобный тип разделения также может иметь место в цепи событий. Скажем, болезнь приводит к назначению лекарства, и здесь оно действительно вызывает усталость как побочный эффект. Если отношения D M и M F истинны, мы также обнаружим, что болезнь повышает вероятность усталости. Однако часто требуется выявить самые непосредственные причинные взаимосвязи, чтобы осуществить более прямые вмешательства. Чтобы избежать появления симптома, нужно отменить лекарство или перейти на другое; но, если мы придем к ошибочному заключению, что как болезнь, так и лекарство провоцируют усталость, мы не сможем узнать, что смена препарата могла бы предотвратить возникновение симптома. И снова, если мы ставим условием М, вероятностное отношение между D и F исчезает.
Как обычно, ни один метод не совершенен, и успех зависит на самом деле от измерения общей причины. То есть, если рецессия приводит одновременно к снижению инфляции и безработице и мы не знаем, имеет ли место рецессия, нет возможности использовать условие экранирования, чтобы выяснить, не ложна ли видимая причинная зависимость между инфляцией и безработицей. Получается, реальные мы найдем взаимосвязи или ошибочные, целиком зависит от наличия верного набора переменных.
Эта проблема вновь выйдет на передний план, когда в главе 6 мы затронем вычислительные методы. Но, хотя на базе ряда сценариев мы и располагаем несколькими способами отыскать скрытую общую причину, это не решает проблему вычислительных методов в целом.
На этом, однако, история не заканчивается. Иногда просто нет единственной переменной для экранирования двух следствий. Скажем, Алиса и Боб любят занятия по машинному обучению[213] и предпочитают те, которые назначены на послеобеденное время. Тогда, взяв условием либо содержание курса, либо время, мы не сможем полностью экранировать такие переменные, как выбор занятий Алисой и Бобом. Если известно только время занятий, то запишется на них Боб или нет, действительно дает информацию о выборе Алисы, так как этот фактор становится косвенным индикатором содержания курса. Нет единственной переменной, экранирующей А и Б друг от друга.
И если мы добавим переменную, которая будет истинной, только если курс одновременно и начинается после полудня, и посвящен машинному обучению, этот фокус поможет. Но, чтобы понять необходимость этой более сложной переменной, нужно знать кое-что о проблеме и потенциальных причинных взаимосвязях, а это не всегда возможно.
Пока мы вообще не затрагивали временные паттерны (приняли как данность, что причина происходит до следствия). Однако иногда используется фактор, способный объяснить корреляцию, который мы обычно не включаем в свой анализ, – изменение взаимозависимости во времени.
Чтобы представить ситуацию, когда экранирование не срабатывает, вспомним примеры индетерминизма из начала этой главы. Если некое оборудование неисправно, это может помешать идеальному экранированию его эффектов. Чтобы это проиллюстрировать, часто используется пример с неисправным тумблером, одновременно включающим телевизор и лампу (он не всегда замыкает цепь). Если телевизор работает, горит и лампа, и наоборот, но, бывает, оба прибора не активированы. Для решения этой проблемы можно добавить четвертую переменную – замкнутую цепь; но, чтобы узнать о ее необходимости, нужно иметь некоторое понимание о структуре проблемы, а оно есть не всегда.
Один из вариантов – не рассматривать точную взаимосвязь, но изучить, будет ли возможная причина иметь большое значение для следствия, если другие факторы останутся неизменными. До сих пор мы анализировали все ситуации, при которых то, что нельзя считать причиной, может все-таки повышать вероятность следствия; но возможно также, что истинная причина не повысит эту вероятность. Один из очевидных примеров – это причина, предотвращающая следствие (например, вакцина, которая предупреждает болезнь). С такими случаями разобраться легко, поскольку мы можем либо переопределить факторы в терминах снижения вероятности, либо применить отрицание следствия как интересующий нас исход (то есть «неболезнь»). Но как насчет иных ситуаций, когда положительная причина снижает вероятность или вообще не оказывает никакого действия? Здесь ключевые факторы – это выборка, на основе которой берется информация, и степень детализации переменных.
Парадокс Симпсона
Представим, что вы пациент, которому надо выбрать одного из двух врачей. У доктора А (Алиса) смертность пациентов, проходивших лечение от определенной болезни, составляет 40 %, у доктора B (Бетти) – 10 %. Если исходить только из этой информации, легко выбрать Бетти; на самом деле у вас недостаточно данных, чтобы принять подобное решение.
Действительно, возможно, что для каждого отдельного пациента лечение у Алисы дает лучшие результаты, даже если кажется, что общий уровень смертности у нее выше.
Алиса и Бетти не выбирают пациентов случайным образом: видимо, их направляют другие врачи, или те приходят по объявлениям. Поэтому, если большой опыт Алисы привлекает к ней самые сложные и трудноизлечимые случаи, общий уровень смертности может показаться очень плохим, хотя как доктор она и лучше.
В этом примере интересно то, что мы не просто обнаруживаем ошибочную причинную зависимость, но и можем реально выявить зависимость, обратную истинной: что результаты Алисы хуже, хотя в действительности они лучше. Точно такой же сценарий может иметь место с медикаментами, если не анализировать данные выборочных экспериментов (когда пациенты распределяются по группам лечения случайным образом).
Главная проблема в том, что может быть смещение относительно того, кто какое лекарство принимает, а устранить его на деле получится только выборочным распределением пациентов по группам. К примеру, если больные с агрессивной формой рака получают лечение А, а с более легкими случаями – лечение В, несомненно, результаты А покажутся хуже, поскольку эта группа имеет более серьезные проблемы. Смещение выборки – одна из причин, по которой так сложно делать логические заключения на основе данных наблюдения. Можно обнаружить, что люди, активно занимающиеся спортом в пожилом возрасте, живут дольше тех, кто ведет малоподвижный образ жизни, – но, возможно, потому, что физически активные всю жизнь просто здоровее прочих.
Странный феномен, когда причинные взаимосвязи исчезают или обращаются вспять, известен как парадокс Симпсона[214], [215]. Симпсон описал математические свойства, которые должны быть присущи данным, чтобы такая ситуация смогла возникнуть. Он привел пример, когда лечение приносит пользу, если данные по пациентам разного пола рассматриваются отдельно, но кажется неэффективным для контингента в целом. Другие исследователи показали, как возникает еще более экстремальная ситуация, когда новое лечение на деле приводит к повышению смертности у населения в целом, хотя и мне, и еще кому-то оно помогло[216]. Это показано на рис. 5.6. Прочие известные примеры – процент поступивших в Беркли (когда показатель для женщин кажется ниже, поскольку они подают документы на факультеты с всоким конкурсом)[217] и количество смертных приговоров во Флориде (когда казалось, что раса подсудимого влияла на приговор, хотя в действительности на него влияла раса жертвы)[218].
Рис. 5.6. Иллюстрация парадокса Симпсона, где А лучше в каждой подгруппе, но В кажется лучше в комбинации
В каждом из примеров парадокса Симпсона можно объяснить сомнительную взаимосвязь с новой информацией – особенно если рассматривать подгруппы. В примере с докторами, изучив группы пациентов с одинаковым состоянием здоровья или уровнем риска, можно сделать вывод, что показатели Алисы лучше. В примере с процентом поступивших в Беркли можно провести стратификацию по факультетам, а в примере со смертными приговорами – по расовой принадлежности жертв. Это значит, что все дело в уровне детализации при изучении данных. Чтобы вывести на основе данных вероятностные зависимости, нужно знать, что наблюдаемые вероятности репрезентативны для зависимостей, лежащих в их основе. Если наша задача – осуществление политической программы, необходимо знать, что вероятности для одной группы населения применимы ко всей целевой группе.
Конечно, ключевая проблема – определить, когда и как подразделить имеющиеся данные, поскольку неверно, что очередное дробление решит вопрос. Можно иметь контринтуитивные результаты для отдельной подгруппы, которые не получить на агрегированных данных, и более мелкое деление снова изменит взаимосвязи. В примере с лекарством, лучше действующим на мужчин и женщин в индивидуальном порядке и хуже – на все население, вероятно, мы должны поверить, что лекарство вообще работает. Хотя подобная точка зрения немало дискутировалась, сам Симпсон считает, что такое лечение «вряд ли можно отвергать как бесполезное для всей человеческой расы, если оно приносит пользу мужчинам и женщинам»[219]. И все же он приводит пример, когда подобная интерпретация оказывается несостоятельной. Корректный набор переменных, используемых как условия, можно найти, однако для этого требуется, чтобы мы уже имели некоторое знание о причинно-следственной структуре. А это проблематично, если мы только приступаем к ее изучению[220].
Именно здесь кроется корень многих вопросов причинности. Мы просто не в состоянии полностью устранить потребность в базовом знании проблемы и обязаны использовать это знание, чтобы выбирать данные для анализа и интерпретировать результаты.
Контрфактуальное высказывание
«Если бы вы не шумели, когда я играл в боулинг, я не промахнулся бы». «Если бы на улице было жарче, я бежал бы медленнее».
В подобных случаях мы пытаемся выделить один ярко выраженный фактор, который приводит к одному исходу вместо другого. Часто говорим о причинности в терминах альтернативы уже случившемуся. Мы не можем ничего сказать наверняка: «Возможно, даже при идеальной погоде я растянул бы связки на пробежке или должен был остановиться и завязать шнурки на кроссовках».
Если исходить из предпосылки, что в случившемся сценарии все прочее оставалось бы неизменным, «я бежал бы быстрее, если бы погода была получше».
Такие высказывания указывают на определенную необходимость или значимость, а их не могут обеспечить закономерности. Если в случае с юмовской идеей регулярной повторяемости событий мы знаем только, что те или иные вещи часто происходят совместно, здесь пытаемся показать следующее: чтобы все произошло так, как произошло, нужна была определенная причина, и без этой причины все произошло бы иначе. Это называется контрфактуальным рассуждениеем. Фактически контрфактуальным называется высказывание следующего вида: «Если бы А было истинно, то и С было бы истинно». Например, если бы я нанес крем от загара, избежал бы ожога.
Интересно, что Юм положил начало как закономерному, так и контрфактуальному подходу к причинности. Он писал, что причина есть «объект, за которым следует другой объект, и когда за всеми объектами, подобными первому, следуют объекты, подобные второму» (определение закономерности), и далее: «Другими словами, без первого объекта никогда не существовал бы второй» (определение контрфактуальности)[221].
Может показаться, что он верит, будто это всего лишь два способа сказать одно и то же. На деле, однако, эти определения породили два отдельных направления в области причинности.
Контрфактуальный подход (вдохновил его Юм, а формальное определение дал Дэвид Льюис (1973)) предполагает: чтобы С стало причиной Е, две вещи должны быть истинными: если бы С не произошло, Е не случилось бы, и если случилось С, то должно случиться и Е. То есть если бы я нанес крем от загара, не обгорел бы на солнце, а если бы не нанес, не смог бы избежать воздействия солнечных лучей. Такая формулировка охватывает одновременно и необходимость, и достаточность. Существуют также вероятностные контрфактуальные подходы, но мы не станем в них вдаваться[222].
Вспомним пример с хакерским марафоном. Может случиться так, что каждый раз, когда программисты выпивают много кофе, на следующий день они ощущают сильную усталость. Возможно, они пьют только кофе, но в больших объемах всегда, засиживаясь допоздна. И тем не менее, используя только эту регулярную повторяемость, мы обнаружим, что кофе и есть причина усталости. Но, если бы программисты не пили кофе, они все равно на следующий день валились бы с ног (они же не спали всю ночь, плюс отсутствие кофеина). Таким образом, потребление кофе не может быть причиной усталости – если проанализировать этот случай с помощью контрфактуальных высказываний.
В теории такой подход помогает различать факторы, случающиеся совместно по чистому совпадению и потому, что между ними есть реальная причинная зависимость.
Теперь спросите: откуда мы можем знать, что произошло бы?
Это одна из коренных сложностей построения юридических рассуждений (к этой теме мы еще вернемся): можем ли мы знать наверняка, что вы не были бы вынуждены резко тормозить, если бы автомобиль перед вами не занесло, и в результате столкновение не произошло бы? Возможно, ехавший за вами водитель отвлекся или был нетрезв, поэтому в любом случае он ударил бы вашу машину.
Контрфактуальные высказывания относятся именно к таким единичным событиям, а не к обобщенным свойствам (подробнее о них в главе 8). Один из способов превратить такие случаи в объект, подлежащий формальной оценке, – соотнести их с моделью.
То есть, если мы сможем представить систему в виде набора уравнений, получим возможность проверить: останется ли следствие истинным, если окажется, что причина была ложной. К примеру, если яд всегда смертелен, то смерть истинна, если истинен яд. Конечно, смерть может наступить от многих возможных причин, поэтому для них нужно также установить набор значений. Тогда мы сможем увидеть, что произойдет при изменении значения яда. Если мы припишем ему значение «ложно», будут ли другие переменные достаточны, чтобы значение смерти осталось истинным? Эта идея лежит в основе моделей структурных уравнений, где каждая переменная – это функция от некоторого набора других переменных системы[223].
Однако контрфактуальный подход не свободен от проблем. Возьмем дело Распутина. Как гласит легенда, он съел пирожные с отравленным вином (содержащегося в нем цианистого калия хватило бы, чтобы убить пятерых человек), но все же остался жив. Потом он получил выстрел в спину – и снова не погиб; в него выстрелили еще раз. В конце концов его связали и бросили в ледяную воду. Он пережил и это! В итоге Распутин все же умер – захлебнулся. Что стало причиной смерти? Можно ли утверждать наверняка, что он бы умер, не будь отравлен? Могло случиться так, что яд подействовал не сразу или он ввел Распутина в коматозное состояние, и тот просто не мог выплыть. Точно такую же роль могли сыграть выстрелы (то есть другим способом способствовать смерти).
Подобные ситуации с несколькими причинами, любая из которых могла вызвать следствие, особенно сложны для контрфактуальных рассуждений. Это примеры множественности равнозначных причин, или симметричная форма так называемой избыточной причинности. Среди ее образцов – момент, когда в арестанта выпускают обоймы несколько членов расстрельной команды или когда пациент принял два лекарства, вызывающие одинаковые побочные эффекты. В обоих случаях, если одной из индивидуальных причин не было (один из солдат не стрелял, пациент принял одно из лекарств), следствие все равно случается. Следствие не зависит контрфактуально от каждой из причин.
Теперь сделаем условие менее жестким и скажем, что следствие случилось бы, но несколько иное. Возможно, побочные эффекты начались бы позже или, к примеру, не оказались бы столь сильными[224].
При множественности равнозначных проблематично не найти вообще никаких причин, но чисто теоретически мы никак не можем выделить одну особую. И кажется логичным, что каждая отдельная причина вносит в следствие свой вклад.
Возьмем ситуацию, когда есть две причины, но только одна из них активна в каждый конкретный момент времени, а другая представляет собой что-то вроде резерва, который активируется, если не срабатывает первая: к примеру, если каждый солдат будет стрелять, только если предыдущий залп не убил арестанта. В биологии часто встречаются подобные типы резервных механизмов: например, два гена дают одинаковый фенотип, но один из них к тому же побуждает другой к действию. То есть ген А подавляет ген B, и ген B активен, только когда неактивен ген A. И опять-таки фенотип не зависит от А, поскольку, если А неактивен, B активен и создает фенотип. Этот случай гораздо более проблематичен, чем предыдущий, поскольку мы можем интуитивно выбрать один фактор в качестве активатора следствия, хотя с помощью контрфактуального метода его нельзя обнаружить. Такой тип проблемы, когда есть две или более возможные причины для следствия, но реальна только одна, называется вытеснением.
Часто различают так называемые раннее и позднее вытеснения. При раннем вытеснении только один каузальный процесс доходит до завершения, в то время как другой – который был бы активен в отсутствие первого – подавляется. Именно это происходит в примере с резервным геном. Позднее вытеснение – ситуация, когда имеют место обе причины, но только одна ответственна за наступление следствия. Пример – расстрельная команда выполняет свою работу, но одна пуля настигает цель чуть раньше других и убивает арестанта до того, как в него попадают остальные.
Есть и другие ситуации со специфическими формулировками причинности в терминах контрфактуальности, в частности, когда каузальность рассматривается в цепочках контрфактуальных зависимостей. В случае с цепочкой контрфактуальной причинной зависимости говорится, что первый элемент цепи есть причина последнего.
К примеру, в эпизоде сериала «Как я встретил вашу маму»[225] два персонажа спорят, кто виноват, что они опоздали на самолет. Робин винит Барни, потому что Тед, прыгая через турникет, чтобы встретиться с Барни в метро, получил штраф, и судебное заседание было назначено как раз на утро в день вылета. Тед, однако, позднее решает, что виновата Робин, потому что именно из-за нее Барни пришлось бежать марафон (поэтому ему понадобилась помощь в метро), и образовалась сложная цепочка разнообразных событий, включая сломанную ногу Маршалла (в чем была виновна Робин). Робин, в свою очередь, обвиняет Лили: из-за того что Лили долго ждала в очереди на распродаже свадебных платьев, Робин заснула у нее дома, поэтому Маршалл заметался и в результате сломал ногу. История заканчивается выводом Теда: во всем виноват он, потому что нашел редкую счастливую монетку и они с Робин использовали деньги от ее продажи, чтобы купить хот-доги через улицу от магазина одежды. В сериале все эти высказывания контрфактуальны: если бы Теду не нужно было идти в суд, он не пропустил бы свой рейс; если бы Маршалл бежал марафон, Барни не понадобилась бы помощь; если бы Лили не пошла в магазин одежды, Маршалл не сломал бы ногу; если бы Тед не подобрал монетку, они не узнали бы о распродаже[226].
Различные теории каузальности расходятся в том, что в подобных ситуациях считать истинной причиной. Некоторые базируются на поиске самого раннего фактора, запустившего цепочку событий, которые привели к следствию, другие – последней по времени причины. Одна из проблем состоит в том, что мы можем выявлять события, все более и более удаленные от фактического следствия.
Но еще проблематичнее ситуация, когда нечто препятствует одному проявлению следствия, но вызывает другое его проявление, создавая видимую цепочку зависимости. К примеру, добрый самаритянин спасает жизнь человеку, который падает на рельсы метро перед приближающимся поездом. Этот человек, однако, позже все равно погибает, прыгая с парашютом. Он не мог бы заниматься парашютным спортом, если бы его не спасли; выходит, что смерть контрфактуально зависит от прыжков с парашютом, а те – от факта спасения. Таким образом, добрый самаритянин стал причиной его смерти.
В главе 8 мы рассмотрим, как это решается в юридических случаях. Как бы то ни было, если спасенный человек затем садится пьяным за руль и сбивает пешехода, мы не станем возлагать вину на спасителя, даже если его действия сделали реальным позднейший инцидент. Здесь, конечно, возможна причинно-следственная связь, но этого недостаточно, чтобы возложить юридическую ответственность: ее компонентом считается предсказуемость последствий, а здесь таковой не наблюдается.
Пределы наблюдений
Вернемся к статистическому примеру в начале этой главы, где утверждалось, что определенные факторы на 98 % спасают от бедности. К этому моменту вы, надеюсь, уже осознали, как сложно вывести из этой статистики причинную зависимость. Если мы располагаем только данными наблюдения, то не можем быть уверены, что нет никаких общих неявных причин, ответственных за видимые каузальные взаимосвязи. Например, мы способны обнаружить корреляцию между детской любовью к видеоиграм со сценами насилия и превращением в насильника во взрослом возрасте. Но любовь к подобным играм может зависеть исключительно от окружающих условий и генетических факторов. Точно так же, когда мы имеем возможность только наблюдать, но не вмешиваться, стоит учитывать вероятность смещения выборки. Скажем, люди, занимающиеся спортом, имеют усиленную толерантность к боли. Это ничего не говорит о том, действительно ли спорт повышает болевой порог или правда ли, что люди с высоким болевым порогом любят физические упражнения, поскольку легче выносят дискомфорт.
И все же наблюдения дают точку отсчета для последующих экспериментов или обращения к базовому знанию механизма действия (то есть к выяснению, как именно причина вызывает следствие).
6. Вычисления. Как автомаизировать поиск причин
Какие лекарства, принятые вместе, вызывают побочные эффекты?
Выборочные испытания лекарственных препаратов мало скажут об этом, поскольку, как правило, исследователи стараются не давать участникам несколько лекарств сразу. Чтобы спрогнозировать некоторые взаимодействия, можно использовать моделирование, но для этого требуется внушительное базовое знание. Можно протестировать некоторые пары медикаментов экспериментально, но с учетом затрат времени и средств это реально только для небольшого набора комбинаций. Хуже того, из миллионов доступных пар всего несколько способны интенсивно взаимодействовать и лишь у определенных групп населения.
Однако, после того как лекарство выведено на рынок, пациенты, фармацевтические компании и медицинские учреждения доводят подозрительные случаи до Управления по контролю за качеством пищевых продуктов и лекарственных препаратов (Food and Drug Administration, FDA), а там их вводят в базу данных[227]. И если вы начинаете принимать лекарство от аллергии, а через несколько дней получаете сердечный приступ, то вы или ваш лечащий врач смело можете подавать соответствующее заявление. Следует знать, что такие заявления не верифицируются (не проверяются). Может быть, сердечный приступ у человека в действительности произошел из-за отрыва тромба, а недавний репортаж в новостях о том, как лекарства провоцируют сердечные приступы, придал объяснению правдоподобность.
Во многих ситуациях данные содержат мнимые причинные зависимости. Возможно, к сердечному приступу привели какие-то другие факторы в жизни пациента (например, невыявленный диабет); сведения могли быть неверны (например, загрязненный образец для анализа или неверная постановка диагноза); имела место некорректная последовательность событий (например, лабораторные исследования обнаружили повышенное содержание сахара в крови, но показатель повысился еще до принятия лекарства). Кроме того, многие реальные неблагоприятные события остаются незарегистрированными, если никто не додумался связать их с приемом препарата или если пациент не обращается за врачебной помощью и сам о факте не сообщает.
Но, даже если некоторые заявления и некорректны, такие данные помогают формулировать гипотезы для проверки. Если мы решили экспериментально подтвердить результаты – на пациентах, которым прописана комбинация лекарственных средств или каждое из них по отдельности, – это может привести к запоздалому выявлению взаимосвязи и, соответственно, риску для большего числа пациентов. Но, если вместо этого использовать другой набор наблюдательных данных – из больниц, – мы выясним в точности, что происходит, когда нуждающиеся в лечении принимают лекарства одновременно.
Именно это и сделали исследователи из Стэнфорда[228]. Взяв сведения по неблагоприятным событиям из базы данных FDA, они обнаружили, что определенный препарат для понижения холестерина в крови и антидепрессант (а именно правастатин и пароксетин) способны при одновременном приеме повышать сахар в крови. Затем, используя больничные карты, ученые сравнили результаты лабораторных тестов пациентов, принимавших лекарства вместе или по отдельности, и выяснили, что сахар в крови повысился гораздо сильнее при совместном приеме препаратов.
Мы не можем знать наверняка, что больные пили предписанные им лекарства; или, возможно, те, кто принимал комбинацию препаратов, чем-то отличались от других. Для подобного вида данных есть немало ограничений, но результаты были подтверждены на основании сведений, полученных из трех разных больниц и после испытаний на мышах[229].
В этом исследовании ученые не отталкивались от гипотезы о возможном взаимодействии медикаментов, а вывели гипотезу на основе данных. Напротив, все работы, которые мы обсуждали до сих пор, предусматривали анализ конкретных каузальных утверждений: к примеру, требовалось определить, действительно ли избыточное потребление сахара провоцирует диабет.
Но если мы не имеем понятия, что вызывает успешные взаимодействия, почему растут повторные поступления пациентов в больницы или что влияет на посещаемость сайтов, то что и когда мы можем узнать из баз данных, таких как обмен сообщениями на сайтах свиданий, клинические медицинские карты или поисковые запросы в Сети?
С помощью комбинации вычислительных возможностей и методов эффективного обнаружения причин на основе данных мы можем перейти от оценки одной причины к интеллектуальному анализу данных, чтобы вскрыть многие каузальные отношения одновременно. Методы автоматизации также помогают выявлять более сложные взаимодействия, чем те, которые человек способен наблюдать непосредственно. К примеру, нам удастся обнаружить последовательность этапов (и каждый включает множество необходимых компонентов), которая приводит к восстановлению сознания у пациентов, перенесших инсульт.
В этой главе мы исследуем методы перехода от данных к причинам. Первое, что нужно обсудить, – вопрос о том, какие сведения пригодны для каузального осмысления. Не каждый набор данных позволяет делать корректные умозаключения, поэтому мы рассмотрим, какие необходимы допущения (чтобы быть уверенными в достоверности результатов) и к каким выводам можно прийти, если допущения не выполняются.
Известно множество методов причинного осмысления, но мы ограничимся двумя основными категориями: теми, в задачу которых входит поиск модели, объясняющей данные (и, в конечном счете, одновременное изучение всех заключенных в ней причинных взаимосвязей), и теми, которые фокусируются на оценке силы каждой индивидуальной взаимосвязи. Главное, что нужно осознать, – нет варианта, который в любой ситуации окажется лучше всех. Хотя в вычислительных методах уже произошел крупный прорыв, эта область по-прежнему открыта для исследований, а проблема абсолютно точного причинного осмысления в отсутствие базового знания для всех случаев без исключения остается нерешенной.
Допущения
Прежде чем переходить к методам причинного осмысления, нужно дать некоторые вводные сведения. Под термином «причинное осмысление» я имею в виду следующее. Набор измеримых переменных (например, исторические цены на акции) закладывается в компьютерную программу. На основе обработанной информации делается вывод, какие переменные оказались причиной других (к примеру, рост цен на акцию А вызывает рост цен на акцию B). Это может означать выявление силы взаимоотношений в каждой паре переменных или выяснение модели их взаимодействия. Данные могут быть временной последовательностью событий (к примеру, дневные изменения цен на акции) или взятыми на конкретный момент. Во втором случае вариация берется в пределах неких выборок вместо изучения временных изменений. Один из примеров такого рода данных – одномоментное исследование группы, а не экспертное отслеживание отдельных участников в течение долгого времени.
Допущения для различных методов слегка варьируются по критерию используемых данных, однако некоторые свойства оказываются общими практически для всех методов и влияют на любые заключения.
Вероятно, самое важное и универсальное допущение звучит так: все общие причины переменных, зависимости между которыми мы рассматриваем, измеримы. Это также называют причинной достаточностью в методах графических моделей (к ним мы вскоре перейдем).
Если мы, имея набор переменных, хотим найти между ними каузальные зависимости, то должны быть уверены, что уже измерили все общие причины этих переменных. Если истинно утверждение, что кофеин приводит к недосыпанию и повышает давление – и что это единственная взаимосвязь между сном и сердечным ритмом, – то, не измерив потребления кофеина, мы можем сделать некорректные выводы при выявлении отношений между его следствиями. Причины, отсутствующие в наборе данных, называются скрытыми или латентными переменными. Неизмеренные причины двух или более переменных, способных привести к ложным умозаключениям, именуются скрытыми общими причинами или латентными искажающими факторами, а возникающие вследствие этого проблемы называются искажением (что чаще встречается в информационных технологиях и философской литературе) и смещением из-за пропущенных переменных (что более присуще статистике и экономике). Это одно из ключевых ограничений исследований наблюдением, а также вводных данных в вычислительных методах, поскольку приводит как к выявлению ложных взаимосвязей, так и к переоценке силы причин.
Немного изменим этот пример. Кофе напрямую влияет на сон – а теперь он будет влиять на сон и через фактор частоты сердечных сокращений (ЧСС), как на рис. 6.1. Даже если ЧСС служит причиной недосыпа, мы видим, что этот фактор более/менее значим, чем если бы мы не измеряли потребление кофе. То есть, поскольку кофеин вызывает сердцебиение, высокий показатель последнего может дать нам некую информацию о статусе тонизирующего напитка (присутствие/отсутствие). В главе 7 мы увидим, как экспериментальными методами посредством рандомизации[230] можно решать эту проблему.
Рис. 6.1. Кофеин – общая причина учащения пульса и недосыпания, однако ЧСС также напрямую влияет на сон
Хотя практически любой метод, основанный на данных наблюдения, допускает, что нет никаких скрытых общих причин, на практике редко можно быть уверенным в этом. Заметим, однако: мы не обязаны допускать, что измерена каждая причина – только общие.
На рис. 6.2 (а) показано, что кофеин изменяет как качество сна, так и сердечный ритм; алкоголь вызывает аналогичный эффект. Не располагая данными по потреблению алкоголя, мы не сумеем выявить эту причину изменений сна, однако в результате не будут сделаны некорректные выводы об их взаимоотношениях. Аналогично, если кофе воздействует на сон посредством промежуточной переменной, отношения будут примерно такими: кофеин вызывает повышенное сердцебиение, а оно провоцирует недосып (рис. 6.2 (б)), и если при этом мы не измеряем сердцебиение, то просто найдем более неявную причину, а не некорректную структуру. Таким образом, необязательно наблюдать каждое индивидуальное звено в каузальной цепи.
Рис. 6.2. Если алкоголь (слева) и сердцебиение (справа) не измерены, это не ведет к искажению связи между кофеином и сном
Некоторые вычислительные методы исходят из допущения, что все общие причины измерены, и определяют, в каких случаях может существовать невыявленная причина, или иногда помогают обнаружить саму причину. Однако это, как правило, возможно только при очень жестких условиях и затруднительно при наличии комплексных временных рядов[231]. Но как быть, если мы не знаем, что все общие причины измерены, и не в состоянии применить эти методы для выяснения причин?
В методах графических моделей, о которых мы поговорим далее, доступно только одно: найти все возможные модели, соответствующие данным, включая те, которые имеют скрытые переменные.
К примеру, если мы найдем видимую причинную зависимость между сном и сердцебиением и при этом будем знать, что могут существовать неизмеренные причины обоих факторов, то одной из возможных моделей будет скрытая переменная, которая вызывает оба наблюдаемых фактора. Преимущество в том, что иногда возникают некие общие для всех моделей взаимосвязи, объясняющие имеющиеся данные. Тогда, даже когда есть множество возможных структур, нетрудно вывести некие заключения относительно потенциальных корреляций.
Во всех случаях, однако, уверенность в выводах о каузальных взаимосвязях должна быть пропорциональна убежденности, что нет никакой потенциально неизмеренной причины, а заключение, сделанное на основе данных наблюдения, может стать точкой отсчета для будущих экспериментов, которые подтвердят его или опровергнут.
Помимо уверенности, что мы располагаем верным набором переменных, необходимо также знать, что наблюдаемые события отражают истинное поведение системы. По существу, если нет сведений, что наличие тревожной сигнализации становится причиной ограблений, нужно верить, что – при наших данных – ограбления зависят от отсутствия системы сигнализации.
Мы уже изучили несколько ситуаций, когда сведения не были репрезентативными: 1) анализ данных в ограниченном диапазоне не позволил выявить корреляции между интенсивностью учебы и экзаменационными баллами (глава 3); 2) парадокс Симпсона стал причиной исчезновения или обращения вспять причинно-следственных связей между лекарствами и исходом заболеваний в зависимости от того, брались данные агрегированно или изучались отдельно для мужчин и женщин (глава 5).
Также мы видели пример, как можно нивелировать взаимозависимости, чтобы выявлять причинности без корреляций. В главе 3 мы наблюдали две цепочки между занятиями бегом и потерей веса, когда бег давал положительный эффект и отрицательный, поскольку занятия спортом вызывали повышенный аппетит. При неудачном распределении это значит, что мы можем вообще не обнаружить никакой взаимосвязи между пробежками и потерей веса. Поскольку осмысление причинности зависит от наблюдения реальных зависимостей, мы, как правило, вынуждены делать допущение, что такого типа нивелирования нет. Подобное допущение часто называют верностью (речь о видах ассоциации), поскольку данные, не отражающие истинную структуру, на которой все построено, в некотором смысле ей «неверны».
Кое-кто утверждает, что такой тип нарушения связи редок[232], но на деле некоторые системы – к примеру, биологические – структурированы так, что практически гарантируют нарушение. Когда множественные гены продуцируют фенотип, даже если мы возьмем за основу неактивный ген, фенотип по-прежнему будет присутствовать, что приведет к видимой зависимости между причиной и следствием. Многие системы, вынужденные поддерживать равновесие, включают подобного рода резервные причины.
И все же нам даже не нужна точная нивелировка или вообще какая-либо зависимость, чтобы нарушить допущения о верности. Это потому, что на практике большинство вычислительных методов требует выбирать статистический предел, на основании которого зависимость будет принята или отвергнута (здесь используются p-значения или другие критерии). Вероятность следствия не должна быть в точности равна его вероятности под условием причины – просто достаточно близка, чтобы результат оставался в пределах допустимого. Например, вероятность потери веса после пробежки может не равняться вероятности потери веса вообще, без бега, однако может привести к нарушению допущения о верности, если отличие будет незначительным[233].
Еще один вариант нерепрезентативности распределения, касающегося истинного набора зависимостей, – смещение выборки. Скажем, есть данные из больницы, куда включены диагнозы и результаты лабораторных испытаний. Однако один из тестов крайне дорогой, поэтому врачи просят сделать его только в том случае, если у пациента необычная картина болезни и другим способом диагноз поставить нельзя. В большинстве случаев тест дает положительный результат. Из этих наблюдений, однако, нельзя узнать истинную вероятность такого исхода, потому что тест заказывают только при высоких шансах на положительный ответ. По результатам медицинских проверок мы, как правило, видим лишь ограниченный диапазон данных – например, когда измерения делаются только у самых больных пациентов (как инвазивный мониторинг в отделении интенсивной терапии). Диапазон наблюдаемых значений включает заболевших, состояние которых достаточно плохое для проведения подобного мониторинга. Ситуация проблематичная, поскольку это значит, что, если мы выявим причинную зависимость для такой ограниченной группы, она может не быть истинной для населения в целом. Аналогично можно не распознать истинную зависимость из-за отсутствия в выборке вариации.
Это называется проблемой упущенных данных. К искажению могут приводить упущенные переменные, но и упущенные измерения действуют аналогично, формируя нерепрезентативные распределения относительно истинного базового распределения. Упущенные значения, как правило, не результат случайного их удаления из набора данных, скорее, они зависят от других измеренных и неизмеренных переменных.
К примеру, в больнице для проведения медицинской процедуры у пациента нужно отключить несколько мониторов (что приведет к пробелу в регистрации сведений), или данные не зафиксируются из-за сбоя аппаратуры. Возможно, сахар в крови будет замеряться с меньшими интервалами, если этот показатель выходит за пределы нормы, поэтому большие пробелы в измерениях не окажутся независимыми от фактических значений, а существующие значения могут отклоняться вплоть до экстремумов. Данные, упущенные из-за скрытой причины, способны вести к искажениям, в то время как сбой аппаратуры может означать, что и другие близкие измерения также ложны (и могут искажать результаты).
В действительности мы только допускаем, что распределения отражают истинную структуру, поскольку размер выборки становится достаточно большим. Если я звоню другу и в этот момент раздается звонок в дверь, трудно сказать, повторится ли снова эта ситуация. Но что если это случается 5 или 15 раз? В общем, мы допускаем, что по мере увеличения массива данных мы все ближе подходим к наблюдению истинного распределения событий. Если бросить монетку всего несколько раз, можно не увидеть равного распределения орлов и решек; но по мере того, как число бросков будет стремиться к бесконечности, распределение приблизится к соотношению 50/50. Здесь увеличение массива данных означает снижение вероятности необычной цепочки событий, которая не будет отражать истинные базовые вероятности (такие как последовательность бросков игральных костей, когда выпадают одни шестерки).
Мы делаем аналогичное допущение для причинного осмысления: у нас достаточно данных, и мы можем усмотреть реальную вероятность (а не аномалию) того, что следствие наступает после причины. Нетрудно возразить, что для некоторых систем, например нестационарных, даже бесконечно большой набор данных может не удовлетворять этому допущению, и стоит исходить из предположения, что со временем отношения останутся стабильными. Вспомним: термин «нестационарные» означает, что свойства (например, средняя дневная прибыль от ценной бумаги) со временем меняются. На рис. 6.3 скидки (временные ряды обозначены пунктиром) и покупки горячего шоколада (сплошные линии) фактически не коррелируют по составным временным рядам, однако сильно взаимосвязаны в период, показанный серым цветом (который обозначает зимний сезон).
Рис. 6.3. Зависимость между двумя переменными со временем меняется, и они связаны только в период, обозначенный серым
Итак, если бы мы использовали все данные, то не выяснили бы, что скидки ведут к росту продаж горячего шоколада. Но, если бы воспользовались только сведениями по зимнему сезону, могли бы найти сильную зависимость. Стоит отметить, что увеличение объема данных не решает проблему – делать это нужно другими способами, о которых мы говорили в главе 4[234].
Задача большинства методов, основанных на логических выводах, – найти зависимости между переменными. Если вы располагаете данными по финансовым рынкам, переменными будут отдельные ценные бумаги. В политологии ими могут быть дневные пожертвования в фонд политической кампании или количество телефонных звонков.
Мы можем либо начать с набора уже измеренных факторов, либо провести некоторые измерения, и обычно мы считаем каждый измеренный фактор переменной. Однако есть некоторая неопределенность: нужно не только измерить правильные вещи, но и быть уверенными в их верном описании.
Помимо простого решения, включить в массив некие данные или нет, придется сделать множество выборов относительно организации самой информации. В рамках некоторых исследований обычное ожирение и патологическое (морбидное) могут входить в одну категорию понятий (и мы просто фиксируем, истинны эти состояния или нет для каждого человека). Но в исследованиях, посвященных лечению пациентов с ожирением, различие может оказаться критическим[235].
Измерение веса дает набор численных значений, которые заносятся на карту категорий. Возможно, самое важное здесь не вес, а то, меняется ли он, и если да, как быстро. Тогда вместо использования первичных данных о весе можно вычислить дневные или недельные отличия. Каково бы ни было решение, оно изменит результаты, поскольку они всегда относительны с точки зрения набора переменных. Если удалить некоторые переменные, может оказаться, что другие причины приобретут видимую значимость (например, снятие резервной причины может придать оставшейся больше видимой силы), а если добавить, то значимость других может снизиться (например, дополнительная общая причина может удалить ошибочную зависимость между следствиями такой причины).
Вернемся к примеру из начала главы, когда два медикамента по отдельности не повышали содержание сахара в крови, но иногда, принятые вместе, оказывали значительное воздействие на этот показатель. Вывод о причинной зависимости между отдельными переменными и разнообразными физиологическими измерениями, к примеру глюкозы, может помешать выявлению связи, но, если взять пару переменных вместе, удастся обнаружить неблагоприятное следствие. В этом случае правильная переменная – наличие двух медикаментов. Ее определение может быть проблематичным, но это единственная причина, по которой можно упустить из виду важные логические выводы, сделанные на основе определенного набора данных.
Графические модели
Нередко, пытаясь описать причинные взаимосвязи кому-то другому или понять, как вещи работают вместе, мы рисуем картинки. Такие изображения можно соотнести с вероятностными теориями причинности, которые разрабатывают философы. Взглянем на рисунок ниже, где показано, как вероятность одной переменной зависит от другой.
Прежде всего видно, что между рекламными объявлениями и покупательским поведением есть взаимосвязь. Мы знаем, что эта взаимосвязь действует в одном направлении – реклама влияет на покупки, а не наоборот.
А теперь добавим переменную.
Если мы захотим предсказать, будет ли совершена покупка, что нам требуется? Способ взаимосвязи переменных говорит: все еще необходимо знать лишь о том, видел ли некто рекламу. Визуально погода стоит справа особняком, а отсутствие ориентированного ребра (стрелки) от погоды к покупке означает, что этот фактор нельзя использовать для воздействия или предсказания предполагаемого следствия.
Идея о том, что для прогнозирования переменной нужно знать только о прямых ее причинах, называется причинным условием Маркова[236]. Говоря технически, переменная не зависит от своих «непотомков» («потомки» – это следствия, следствия следствий и т. д.) при условии наличия их причин[237]. Здесь ребра идут от причины к следствию, поэтому прямые причины – те, что связаны со следствием стрелкой.