Путеводитель по лжи Левитин Дэниел
Противоположное утверждение — вид необоснованного дедуктивного рассуждения, имеющего следующую форму:
Если А, то B
Не A
Следовательно, не B
Разделение на группы — разделение серии наблюдений на более мелкие группы. Это допустимо, когда мы имеем дело с разнородными данными и когда большая группа состоит из объектов, отличающихся только по одному важному показателю. Однако разделение на группы может применяться в жульнических целях, чтобы создать много маленьких групп, которые не сильно отличаются по изучаемой переменной.
Распространенность — число существующих случаев (например, заболевания).
Силлогизм — тип логического утверждения, в котором выводы должны обязательно следовать из посылки.
Среднее — суммарный показатель, характеризующий серию наблюдений. «Среднее» — нетехнический термин, часто под ним понимают среднее арифметическое, медиану или моду.
Среднее арифметическое — один из показателей среднего (центральная тенденция целой серии наблюдений). Его можно высчитать, суммировав все наблюдения и поделив на их количество. Два других типа среднего — это медиана и мода. Например, для (1, 1, 2, 4, 5, 5) среднее арифметическое равно (1 + 1 + 2 + 4 + 5 + 5) / 6 = 3. Обратите внимание, что, в отличие от моды, среднее арифметическое не обязательно находится среди наблюденных значений.
Точные цифры показывают, с точностью до какого десятичного разряда проводили измерение. Например, в числе 909 нет знаков после запятой, это результат измерения с точностью до целых. В числе 909,35 — два знака после запятой, это результат измерения с точностью до сотых. Точные цифры не всегда верные: второе число точнее первого, но не вернее его, если настоящее значение 909,00.
Усеченные оси используются в графиках, в которых шкалы на осях начинаются не с самых низких возможных значений. Иногда это может быть полезно: подробнее изображается та часть графика, где фиксируются результаты наблюдений. Но если использовать эту технику с целью манипуляции, то можно сильно исказить реальность. График, приведенный в качестве примера в этом разделе (см. Диаграмма рассеяния), эффективно использует две усеченные оси и не искажает данных. График, приведенный в части 1, данные искажает, истинные значения представлены на переделанном графике ниже.
Условная вероятность — вероятность, что какое-то событие произойдет при условии, что произойдет или уже произошло другое событие. Например, вероятность того, что сегодня пойдет дождь, при условии, что дождь шел вчера. Слова «при условии» обозначаются вертикальной чертой: |.
Фрейминг — способ, которым сообщают о статистических данных. Например, предоставленный контекст, группа сравнения или объединение выборок могут повлиять на то, как человек интерпретирует информацию. Сравнение общего числа авиакатастроф за 2016 год с показателями за 1936-й может быть неверным, потому что по сравнению с 1936-м в 2016-м было намного больше перелетов, — поэтому такие показатели, как количество авиакатастроф на 100 тысяч перелетов или количество авиакатастроф на 100 тысяч преодоленных километров, предоставляют более точную информацию. Нужно всегда найти лучший фрейм для статистического показателя — это значит наиболее подходящий и информативный. В этом смысле показатели в виде относительных частот обычно оказываются лучше, чем в виде общего количества.
Экологическая ошибка — ошибка в рассуждениях, которая случается, когда делают выводы о человеке, основываясь на совокупных данных (например, на среднем внутри класса).
Экстраполяция — процесс угадывания или выведения заключения о том, какие значения могут принимать величины за пределами интервала наблюденных значений.
БЛАГОДАРНОСТИ
Вдохновение для написания я почерпнул у Даррелла Хаффа в книге How to Lie with Statistics, которую прочитал несколько раз, с каждым разом все больше и больше понимая ее ценность. Я был большим фанатом книги Джоэла Беста Lies and Statistics, а также Чарльза Уилана и его Naked Statistics{73}. Я обязан всем троим юмором, мудростью и озарением. И, надеюсь, у всех тех, кто хочет научиться мыслить критически, моя книга займет достойное место на полке рядом с трудами этих авторов.
Мой агент, Сара Челфант из агентства Wylie Agency, просто мечта: дружелюбная, внимательная, неутомимая, всегда готовая оказать поддержку. Я чувствую свою избранность, потому что имел честь работать с ней и ее коллегами из TWA: Ребеккой Нэйджел, Стефани Дербишир, Альбой Циглер-Бэйли и Селией Кокорис.
Я очень благодарен всем, кто трудится в издательстве Dutton/Penguin Random House. Стивен Морроу работал в качестве редактора над четырьмя моими книгами и сделал каждую из них намного лучше. Он был очень хорошим наставником, я очень ценю его поддержку. Благодарю Адама О’Брайена, ЛиЭнн Пембертон, а также Сьюзен Шварц. Снимаю шляпу перед Беном Севиром, Амандой Уокер и Кристин Болл — они проделывают огромную работу, чтобы книги нашли своих читателей. Бекки Мейнз — больше, чем просто редактор, готовящий рукопись к печати. Мне очень понравились широта ее взглядов и глубина ее знаний, а также пояснения, которая она делала.
Выражаю признательность всем, кто участвовал в обсуждении, делился комментариями к моим черновикам, — вы все мне очень помогли: Джоуи Остервейл, Хизер Бортфельд, Лью Голдберг и Джеффри Моджил. За помощь со специфическими пассажами в книге я в неоплатном долгу перед Дэвидом Эйдельманом, Чарльзом Фуллером, Чарльзом Гейлом, Скоттом Графтоном, Прабхат Джа, Джеффри Кимболлом, Хоуи Клейном, Джозефом Лоренсом, Гретхен Либ, Майком Макгуайром, Региной Нуццо, Джимом О’Доннеллом, Джеймсом Рэнди, Джаспером Райном, Джоном Тирни и теми моими многочисленными коллегам из Американской статистической ассоциации, которые помогали с редактурой и вычиткой гранок. Особенно благодарю Тимоти Армистеда, Эдварда К. Ченга, Грегга Гаскона, Эдварда Грейсли, Кристал С. Лангле, Стэна Лазика, Доминика Лусинчи, Венди Мирвалдис, Дэвида П. Николса, Морриса Олицки и Карлу Зейлемакер. Мои студенты в Университете Макгилл, которые занимаются на моих семинарах по проведению независимых исследований, помогли мне с примерами и сделали мое мышление более ясным. Карл-Филип Зеймор на протяжении работы над четырьмя книгами помогал мне с цифрами, подбадривал, а также решал технические проблемы самого разного рода. Линдсей Флеминг, ассистент офиса, помогала мне планировать мое время и не терять концентрацию, а также выполняла множество самых разных поручений: проверяла примечания в конце книги, список терминов и факты, вычитывала гранки и делала много из того, что требовалось для написания книги. (Спасибо также Элиоту, Грейс, Луа и Кеннис Флеминг за то, что потратили на меня свое время.)
МАКСИМАЛЬНО ПОЛЕЗНЫЕ КНИГИ
Если у вас есть замечания и комментарии к содержанию, переводу, редактуре и корректуре, то просим написать на [email protected], вы поможете нам исправить недочеты и стать лучше.
Заходите в гости:
Для корпоративных клиентов:
НАД КНИГОЙ РАБОТАЛИ
Главный редактор Артем Степанов
Ответственный редактор Светлана Мотылькова
Арт-директор Алексей Богомолов
Литературный редактор Юлия Слуцкина
Дизайнер Наталия Байдужа
Верстка Екатерина Матусовская
Корректоры Надежда Болотина, Антон Снятковский
ООО «Манн, Иванов и Фербер»
Электронная версия книги подготовлена компанией Webkniga.ru, 2018
1
Фандрайзер (fundraiser, англ.) — тот, кто предоставляет услуги по привлечению ресурсов самостоятельно или по контракту. Здесь и далее, если не указано иное, прим. ред.
2
Изложение логически эквивалентной информации различными способами.
3
На момент издания книги почти 65 млрд. Прим. науч. ред.
4
В США финансовый год — период, на который устанавливается бюджет, — длится с 1 октября по 30 сентября. Прим. науч. ред.
5
SAT Reasoning Test (Scholastic Aptitude Test и Scholastic Assessment Test, дословно «Академический оценочный тест»).
6
Это не всегда так. Чтобы из равенства корреляции нулю сделать вывод об отсутствии связи между величинами, нужно проверить выполнение дополнительных условий. Достаточно, например, чтобы величины были распределены нормально. Прим. науч. ред.
7
Нет, нельзя оценить. Высокая корреляция не говорит о причинно-следственной связи, и результат может объясняться совсем другими факторами, не учтенными в исследовании. Например, наблюдается высокая корреляция между размером обуви и скоростью чтения школьников. Чем больше размер обуви, тем быстрее школьник читает, и наоборот. Корреляция есть, а причинно-следственной связи, конечно же, нет. Здесь играет роль совсем другой фактор — возраст. Чем старше школьник, тем больше у него ботинки и тем лучше он читает.
Корреляция между расходами на школьника и баллами за тесты может объясняться, например, работой администрации школы. Чем лучше она работает, тем больше средств привлекает и одновременно больше контролирует работу учителей, которая и обеспечивает высокие баллы.
Об этом еще будет рассказано в разделе «Отображение на графике несущественных данных». Прим. науч. ред.
8
После этого, следовательно, по причине этого (лат.).
9
Вместе с этим, следовательно, по причине этого (лат.).
10
Рэнделл Манро (Randall Munroe, р. 1984) — художник, программист. Работал в НАСА, занимался проблемами робототехники. Начатый в качестве хобби комикс xkcd — в настоящий момент его основное дело.
11
C-SPAN — сеть американского кабельного телевидения, освещающая слушания правительства США и служащая для связи с общественностью. В сеть входит 3 канала — C-SPAN, C-SPAN2, C-SPAN3.
12
t-критерий Стьюдента — общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t- критерия связаны с проверкой равенства средних значений в двух выборках.
13
Критерий хи-квадрат — любая статистическая проверка гипотезы, в которой выборочное распределение критерия имеет распределение хи-квадрат при условии верности нулевой гипотезы.
14
Регрессионный анализ — статистический метод исследования влияния одной или нескольких независимых переменных х1, х2 … хp на зависимую переменную Y.
15
Метод главных компонент (principal component analysis, PCA) — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации.
16
Batting average (средний коэффициент результативности отбивания) — число, которое выражает достижения игрока в бэттинге (отбивании). Его получают путем деления числа отбитых игроком подач на то, сколько раз он выступал как бэттер.
17
Шкала Глисона (сумма Глисона) используется для гистологической оценки дифференцировки рака простаты (малые значения шкалы соответствуют высокодифференцированным формам, а высокие — низкодифференцированным). Высокие значения по шкале Глисона связывают с плохим прогнозом исхода заболевания.
18
Издана на русском языке: Хокинг С. Краткая история времени. СПб.: Амфора, 2010.
19
В Гидрометцентре России имеют в виду совсем иное, когда дают вероятностный прогноз. На сайте http://meteoinfo.ru/forecasts-limits об этом рассказывается в разделе «Борьба с неопределенностью». Допустим, компьютерная программа по известным метеорологическим данным за понедельник дает некоторый вполне определенный прогноз на среду. Попробуем чуть-чуть «пошевелить» начальные понедельничные данные — вводить в программу немного другую температуру или немного другую влажность и т. п. Каждый раз программа будет выдавать новый прогноз на среду. Если 30 % этих прогнозов предсказывают дождь, считают, что вероятность дождя в среду 30 %. Такой подход используют потому, что прогноз очень неустойчиво зависит от начальных данных — даже взмах крыла бабочки может привести к неожиданным изменениям. Поэтому метеорологи стараются учесть неизбежные небольшие погрешности в исходных данных. Прим. науч. ред.
20
Амос Тверски (Amos Tversky, 1937–1996) — пионер когнитивной науки, в течение долгого времени соавтор Дэниела Канемана и ключевая фигура в открытии систематических когнитивных искажений в оценке риска и потенциальной выгоды.
21
Дэниел Канеман (Daniel Kahneman, р. 1934) — израильско-американский психолог, один из основоположников психологической экономической теории и теории поведенческих финансов, в которых объединены экономика и когнитивистика для объяснения иррациональности отношения человека к риску в принятии решений и в управлении своим поведением.
22
Система уравнений в дифференциальной или интегральной форме, описывающих электромагнитное поле и его связь с электрическими зарядами и токами в вакууме и сплошных средах.
23
Например, вы живете на улице 40 лет Октября, 40-летия Октября или Сорокалетия Октября? Прим. науч. ред.
24
Фильм режиссера Адама Маккея, в российском прокате «Игра на понижение» (2015).
25
Режиссер фильма — Дэвис Гуггенхайм, автор сценария — Альберт Гор, в российском прокате «Неудобная правда» (2006).
26
Джош Биллингс (Josh Billings, настоящее имя Генри Уилер Шоу (Henry Wheeler Shaw), 1818–1885). Был, возможно, самым известным писателем-сатириком в Соединенных Штатах во второй половине XIX столетия после Марка Твена.
27
Уолтер Фредерик «Фриц» Мондейл (Walter Frederick «Fritz» Mondale, р. 1928) — вице-президент США в 1977–1981 годах в администрации Джимми Картера, от Демократической партии.
28
Уильям «Уилл» Пенн Эдер Роджерс (William «Will» Penn Adair Rogers, 1879–1935) — американский ковбой, комик, актер и журналист.
29
Джон Эдгар Гувер (John Edgar Hoover, 1895–1972) — американский государственный деятель, занимавший пост директора Федерального бюро расследований на протяжении почти полувека, с 1924 года до своей смерти в 1972 году.
30
Награда Центра Кеннеди (Kennedy Center Honors) — награда, вручающаяся ежегодно за вклад в развитие национальной культуры Америки.
31
Музыкальная награда, которой каждый год награждается полноформатный альбом, выпущенный канадским исполнителем, за художественные достоинства, вне зависимости от жанра, объема продаж и лейбла.
32
Основная музыкальная премия Канады, ежегодно вручаемая с 1970 года, канадский аналог «Грэмми».
33
Одна из самых престижных литературных наград в США; учреждена в 1950 году группой издателей. В 1989 году вручение премии было передано Национальной книжной ассоциации (National Book Foundation), которая и управляет ею до сегодняшнего дня.
34
Первая детская литературная премия в мире; учреждена библиотекарями США и вручается с 1922 года писателям США за выдающийся вклад в американскую детскую литературу.
35
Сериал 1990 года, в российском прокате — «Закон и порядок».
36
Сериал 1969 года, в российском прокате — «Доктор Маркус Уэлби».
37
Сериал 1963 года, в российском прокате — «Главный госпиталь».
38
Сериал 1970 года, в российском прокате — «Все мои дети».
39
Аврам Ноам Хомски (Avram Noam Chomsky, р. 1928) — американский лингвист, политический публицист, философ и теоретик. Профессор лингвистики Массачусетского технологического института, автор классификации формальных языков, называемой иерархией Хомски.
40
Пусть покупатель остерегается — схема продаж, предполагающая ответственность покупателя за качество товаров, их назначение, соответствие целям и т. д. (Бизнес: Оксфордский толковый словарь. М., 1995). Прим. перев.
41
Позднее автор расскажет о том, что обратное утверждение нельзя считать обоснованным, но здесь он делает такое утверждение. Действительно, если материалы не вычитываются и не проверяются, то не заслуживают доверия. Однако обратное рассуждение не проходит. Если материалы не вызывают доверия, это не значит, что их не вычитывали и не проверяли. Северная Корея называет себя демократической республикой. Статьи в больших газетах там, конечно же, тщательно вычитываются, и не это отличает ее от других стран, объявляющих себя демократическими. Прим. науч. ред.
42
«Рейтинг Пиноккио» — принятая в США единица измерения лжи, названная в честь литературного героя, который, как известно, любил приврать.
43
По имени отца Пиноккио. Прим. перев.
44
Томас Роберт Мальтус (Thomas Robert Malthus, 1766–1834) — английский священник и ученый, демограф и экономист, автор теории, согласно которой неконтролируемый рост народонаселения должен привести к голоду на Земле.
45
Джеймс Рэнди (James Randi, настоящее имя Рэндалл Джеймс Хэмилтон Цвинге, Randall James Hamilton Zwinge, р. 1928) — канадско-американский иллюзионист и научный скептик, разоблачитель паранормальных явлений и псевдонаучных теорий, один из основателей Комитета по научному расследованию заявлений о паранормальных явлениях и основатель Образовательного фонда Джеймса Рэнди, известный участник движения «Брайтс», объединяющего сторонников натуралистического мировоззрения, свободного от религии, мистицизма и других элементов сверхъестественного.
46
Издана на русском языке: Гладуэлл М. Давид и Голиаф. Как аутсайдеры побеждают фаворитов. М.: Альпина Паблишер, 2014.
47
На самом деле вероятность того, что из 10 бросаний решка выпадет ровно 5 раз, равна приблизительно 0,25, а вероятность того, что из 1000 бросаний решка выпадет ровно 500 раз, примерно в 10 раз меньше. Прим. науч. ред.
48
Дэмиен Томпсон (Damian Thompson, р. 1962) — журналист, издатель и автор.
49
Любительский 26-секундный документальный кинофильм, снятый Абрахамом Запрудером (Abraham Zapruder) в Далласе в день убийства Джона Кеннеди 22 ноября 1963 года. Запрудер вышел на Дили-Плаза с кинокамерой, чтобы снять проезд президента США по Элм-стрит, и таким образом заснял убийство.
50
Херальдо Ривера (Geraldo Rivera, р. 1943) — американский адвокат, журналист, писатель, репортер и телеведущий. В 1988 году Ривера выдал в эфир несколько специальных репортажей, посвященных эпидемии сатанистских ритуалов. Он утверждал, что в США более миллиона сатанистов и большинство из них хорошо организованы и глубоко законспирированы. Однако утверждения Риверы о преступной деятельности сатанистов остались без подтверждения.
51
Пол Словик (Paul Slovic, р. 1938) — профессор психологии в Орегонском университете.
52
Хан Соло — один из главных героев киносаги «Звездные войны». Его сыграл Харрисон Форд. Прим. перев.
53
Английское слово argument имеет несколько значений: 1) довод, доказательство, аргумент; 2) спор, дискуссия. Прим. перев.
54
Стефани Сенефф (Stephanie Seneff) — научный сотрудник Массачусетского технологического института, широко известная своими исследованиями болезни Альцгеймера, сердечно-сосудистых заболеваний и аутизма.
55
Неселективный системный гербицид, использующийся для борьбы с сорняками, особенно многолетними. Занимает среди гербицидов первое место в мире по производству; действующее вещество средств, выпускающихся под торговыми названиями «Раундап», «Глифор», «Торнадо» и «Ураган».
56
Метаболический путь, промежуточный метаболит которого — шикимовая кислота (шикимат).
57
Малобюджетная коммерческая кинокартина, не пользующаяся большой популярностью (а часто и не рассчитанная на успех), в которой не снимались звезды и которая не отличается художественными достоинствами. Первоначально так называли фильмы, демонстрировавшиеся в кинотеатрах вторым номером на распространенных тогда сдвоенных киносеансах после крупнобюджетной, популярной картины категории А.
58
Эдмон Локар (Edmond Locard, 1877–1966) — пионер судебной медицины, который стал известен как «французский Шерлок Холмс».
59
Шедоу (от англ. shadow) — тень. Прим. перев.
60
Билл Кейсинг (Bill Kaysing, 1922–2005) — американский писатель, получивший известность благодаря книге We Never Went to the Moon («Мы никогда не были на Луне»), в которой утверждает, что шесть посадок «Аполлонов» на Луну в период с 1969 по 1972 год были мистификацией.
61
Rocketdyne — компания в США, которая производит жидкостные ракетные двигатели, основана в 2005 году.
62
В конце книги есть примечания и ссылки на источники, использованные автором. Утверждение, о котором говорит автор, в указанном им же источнике звучит иначе. Там оценивают не шансы зарождения жизни, а шансы того, что 300 молекул случайно могли соединиться в макромолекулу белка. Шансы эти оцениваются не как много миллиардов к одному, а как один из 10390. Прим. науч. ред.
63
TED (Technology Entertainment Design — технологии, развлечения, дизайн) — частный некоммерческий фонд в США, проводящий ежегодные конференции по науке, искусству, дизайну, политике, бизнесу и другим темам.
64
Гленн Фолкенстейн (Glenn Jacob Falkenstein, 1932–2010) — всемирно известный иллюзионист и менталист.
65
Иглу представляет собой куполообразную постройку из уплотненных ветром снежных или ледяных блоков. Эффект заключается в том, чтобы вход в иглу был ниже уровня пола, — это обеспечивает отток из постройки тяжелого углекислого газа и приток взамен более легкого кислорода, а также не позволяет уходить более легкому теплому воздуху.
66
Бенджамин Цандер (Benjamin Zander, р. 1939) — американский дирижер из Великобритании, музыкальный руководитель Бостонского молодежного филармонического оркестра, преподаватель Консерватории Новой Англии, музыковед, общественный деятель.
67
Нима Аркани-Хамед (Nima Arkani-Hamed, р. 1972) — канадский и американский физик-теоретик. Специалист в ряде областей: физика элементарных частиц, теория струн, космология.
68
Первая строка таблицы относится к гипотезе «подсудимый виновен», а вторая — к гипотезе «подсудимый невиновен». Прим. науч. ред.
69
Точнее было назвать корреляцией статистическую связь между двумя переменными, а количественное ее выражение — коэффициентом корреляции. Прим. науч. ред.
70
Это слишком сильное утверждение. Чтобы сделать подобный вывод, надо проверить некоторые дополнительные условия. Следует еще учитывать, что существуют разные показатели корреляции — точно так же, как существуют разные показатели средних, о чем рассказано в этой книге. Прим. науч. ред.
71
Издана на русском языке: Хафф Д. Как лгать при помощи статистики. М.: Альпина Паблишер, 2015.
72
Мысленный эксперимент, предложенный в 1814 году французским математиком Пьером-Симоном Лапласом, а также главный персонаж этого эксперимента — вымышленное разумное существо, способное, восприняв в любой момент положение и скорость каждой частицы во Вселенной, узнавать ее эволюцию как в будущем, так и в прошлом. Лаплас придумал это существо для наглядной демонстрации степени нашей неосведомленности и необходимости в статистическом описании некоторых реальных процессов в окружающем мире.
73
Издана на русском языке: Уилан Ч. Голая статистика. Самая интересная книга о самой скучной науке. М.: Манн, Иванов и Фербер, 2016.