Вся правда о лекарствах. Мировой заговор фармкомпаний Голдакр Бен
Наконец, все эти факты нагнетают еще большую тревогу, если посмотреть на то, какие именно исследования останавливались раньше срока, кто их останавливал и для чего используются их результаты в настоящий момент.
В 2008 году четверо итальянских ученых свели вместе все рандомизированные исследования по проверке противораковых препаратов, которые были опубликованы в предыдущие 11 лет и были остановлены ради блага пациентов.15 Больше половины были опубликованы в течение трех прошедших лет, и это лишний раз свидетельствует о том, что данный вопрос становится все более актуальным. Отрасль разработки противораковых препаратов — быстро развивающая сфера медицины, которая постоянно находится на виду. Здесь время — деньги, а новые лекарства могут принести прибыль в кратчайшее время. Результаты 86 % исследований, остановленных раньше срока, использовались при обосновании подачи заявки на лицензию для выпуска новых препаратов на рынок.
Было бы ошибкой думать, что какой-то из описанных выше случаев представляет собой пример нарушения простых правил, которые должны бездумно выполняться. Исследование может прекратиться раньше по глупым, необоснованным причинам, однако его могут остановить до срока и по вполне объективным обстоятельствам. Подобным же образом может произойти обратное: иногда исследование может быть продлено обоснованно, но иногда продление исследования или включение в него результатов последующих периодов могут разбавить значимые данные и сделать их менее заметными в общей массе. Салметерол — ингаляторный препарат, используемый для лечения астмы и эмфиземы легких. То, что описано далее16 — если вы сможете понять все технические подробности до конца, — может испугать многих людей, поэтому помните, что это не руководство и здесь не приводится конкретных рекомендаций относительно того, какое лекарство хорошее, а какое плохое. Мы выявляем необъективные методы, которые иногда применяются компаниями при исследованиях всех типов лекарств.
Салметерол — бронхолитическое средство. Принцип его действия основан на расширении воздухоносных путей, благодаря чему астматику становится легче дышать. В 1996 году то тут, то там начали появляться сообщения о том, что салметерол иногда начинает оказывать противоположное действие, вызывая так называемый «парадоксальный бронхоспазм», и только ухудшает самочувствие пациентов. Критики-дилетанты часто игнорируют такие сообщения, так как, по их мнению, они не имеют отношения к науке, но они поступают неправильно. Вовсе не означает, что сообщения о таких случаях не имеют никакой ценности, так как их возникновение часто свидетельствует о первых признаках появления проблемы (или неожиданно выявленной эффективности).
Производитель салметерола, компания GSK, решила расследовать ранние отчеты о негативном действии препарата и организовала рандомизированные исследования. В них состояние пациентов, пользовавшихся аэрозолем салметерола, сравнивалось с самочувствием пациентов, в ингаляторах которых было лекарство-плацебо, то есть без активных веществ. Первичная конечная точка исследования была предварительно определена как «смерть от остановки дыхания и опасные для жизни состояния». Вторичная конечная точка исследования — такие случаи, как смерть от астмы (подгруппа смертей от остановки дыхания), смерть по любым причинам и смерть от астмы и опасные для жизни состояния, — опять все собрано в одну кучу.
Для исследования предполагалось набрать 60000 больных и понаблюдать за ними в течение 28 недель. Исследователи должны были встречаться с пациентами через каждые 4 недели, чтобы узнать о динамике и проблемах. На протяжении 6 месяцев этого 28-недельного периода исследователей попросили докладывать о любых серьезных отрицательных явлениях у больных, которые были им известны, однако они не искали такие явления специально.
Потом случилась темная история, о которой в подробностях рассказали на страницах журнала Lancet несколькими годами позднее Питер Лурие и Сидни Вольф, изучив документы Управления по контролю за качеством пищевых продуктов и лекарственных веществ. В сентябре 2002 года внутренний Комитет по контролю за исследованиями устроил заседание, на котором просмотрел результаты по всем 26000 пациентам, обследованным в ходе проверки. Судя по конечной первичной точке — «смерть от остановки дыхания и опасные для жизни состояния», — салметерол был хуже плацебо, хотя разница была не очень статистически значимой. То же самое можно было сказать и о «смертях от астмы». Комитет уведомил GSK о следующем: вы можете проверить правильность результатов на еще 10000 пациентах, чтобы подтвердить догадку, или завершить исследования с «дальнейшей публикацией результатов в кратчайшие сроки». GSK выбрала последнее и представила внутренний отчет об анализе данных на одной из научных конференций, заявив, что он «незавершенный и неокончательный». В Управлении по контролю за качеством пищевых продуктов и лекарственных веществ забеспокоились и решили внести изменения в текст на этикетке лекарства, где теперь должно было содержаться упоминание о том, что препарат вызывает «небольшое, но значительное повышение количества случаев смерти от астмы».
С этого момента начинаются интересные вещи. GSK выслала статистику по исследованию в Управление, однако предоставленные расчеты были произведены не при помощи метода, указанного в плане исследования, предоставленного до начала работ, который предполагал, что общее количество случаев этих неблагоприятных событий должно учитываться за 28-недельный период исследований, когда такие события тщательно отслеживались, что вполне логично. Вместо этого GSK выслала цифры за весь 12-месячный период: и за 28 недель, когда неблагоприятные эффекты тщательно отслеживались, и за 6 месяцев после окончания исследования, когда поиск неблагоприятных событий активно не велся, поэтому они реже фиксировались в отчете. Это означает, что большое количество неблагоприятных состояний, имевших место в течение 28-недельного периода исследований, понизилось за счет данных более позднего периода, в результате чего проблема стала выглядеть гораздо менее значимой.
Если вы посмотрите на таблицу, приведенную в статье из журнала Lancet, вы увидите, как уловка GSK отразилась на данных. Не расстраивайтесь, если поймете не все. В таблице есть и простая, и сложная для понимания информация. «Относительный риск» описывает, насколько чаще у пациента возникло бы какое-либо событие (например, смерть), если бы он находился в группе, принимавшей салметерол, в сравнении с группой, которая получала плацебо. Так, значение относительного риска, равное 1,31, означает, что вероятность наступления этого события (например, смерти) на 31 % выше.
Цифры в скобках означают 95 %-й доверительный интервал. Если цифра за скобками, обозначающая относительный риск, это наша точечная оценка для измерения разницы в риске между двумя группами (салметерол и плацебо), то 95 %-й доверительный интервал говорит нам о том, насколько можно быть уверенным в этом результате. Статистики будут выстраиваться в очередь, чтобы дать мне пинка, если я все упрощаю, но по сути, если вы проводите тот же эксперимент, на тех же пациентах, в той же стране сотни раз, то все равно каждый раз будете получать немного разные результаты просто из-за действия фактора случайности. Но при совпадении в 95 случаях из 100 истинный относительный риск будет лежать где-то между двумя противоположными точками в 95 %-м доверительном интервале. Если вы знаете лучший способ объяснить это в трех словах, то мой адрес электронной почты вы найдете в конце книги.
GSK не уведомила Управление, какой именно набор результатов был передан. Только в 2004 году в госведомстве поинтересовались промежутком времени, за который были предоставлены результаты, и в фармацевтической компании ответили: за 12 месяцев. В Управлении остались недовольны ответом, однако это недовольство было выражено в вежливой форме: «Сотрудники нашего отдела предполагали, что будут высланы только данные за период 28 недель, так как именно 28-недельный период представляет интерес с точки зрения клинических испытаний». В госведомстве потребовали предоставить данные за период 28 недель и сказали, что вся информация, которую намереваются внести в инструкцию к лекарству, будет составлена на основе этих данных. При их изучении, как видите, картина эффективности лекарства становится куда более мрачной. Прошло два года после окончания испытаний, прежде чем их результаты были опубликованы в научных изданиях и изучены врачами. Также понадобилось много времени, чтобы наконец внести изменения в инструкцию к лекарству, где пациентам объяснялись результаты исследования.
Как подчеркнули Лурие и Вольф, из этой истории можно извлечь два интересных урока. Во-первых, у компании была возможность помешать распространению информации о негативных результатах и не дать дойти ей до пациентов и врачей, несмотря на то что производитель был хорошо осведомлен, что препарат был популярен и широко использовался на протяжении долгого периода времени (с подобным мы уже сталкивались ранее). И во-вторых, мы бы никогда не узнали обо всех этих событиях, если бы о деятельности Экспертной комиссии Управления по контролю за качеством пищевых продуктов и лекарственных веществ не было хотя бы частично известно публике. Когда за проблемой следит много глаз, легче заметить скрытые подтасовки в данных. И с этим мы уже раньше сталкивались.
GSK написала письмо в журнал Lancet о том, что данные за 12 месяцев были единственными данными, проанализированными Комитетом по контролю за исследованиями, который является независимым от компании органом (исследования проводила КИО).17 В нем говорилось, что о рисках сообщалось незамедлительно, а врачам, выписывавшим салметерол, высылались письма в январе 2003 года, когда исследования были официально остановлены. Соответствующее информационное сообщение появилось на сайтах GSK и Управления по контролю за качеством пищевых продуктов и лекарственных веществ, где говорилось о том, что препарат был проблемным лекарством.
Исследование малого масштаба может быть проведено, если предполагается, что проверяемое лекарство спасает жизни пациентов при состояниях, ведущих к неминуемой смерти. Однако для обнаружения незначительных различий между двумя препаратами нужно провести более масштабное исследование. И потребуется провести уж совсем большую проверку, чтобы убедиться, что два лекарства одинаково эффективны.
Большинство людей думает, что знают точно одну вещь об исследовании: большое количество участников обеспечивает более надежные показатели. Это правда, однако количество участников не единственный значимый фактор. Польза от многочисленности в том, что при большой выборке уравновешиваются случайные колебания в спектре параметров испытуемых. Если ученый проводит небольшое исследование чрезвычайно действенного препарата для улучшения умственной концентрации в двух группах по 10 человек в каждой и если хотя бы один человек из одной группы погуляет на вечеринке за день до проведения теста на концентрацию, то его плохие показатели испортят все высокие результаты остальных участников. Если в исследовании участвует больше людей, такого рода отклонения уравновешиваются за счет большого количества проверяемых.
Стоит помнить, что иногда малое исследование может быть оправданным, так как размер группы участников зависит от множества факторов. Например, если ученый имеет дело с болезнью, вызывающей у человека смерть в течение суток, а у него есть лекарство, которое, по его словам, может излечить эту болезнь немедленно, не нужно набирать много людей, чтобы показать действенность препарата. Если же различия, которые вы пытаетесь обнаружить между двумя группами, принимающими разные средства, очень тонкие, тогда вам нужно больше участников, чтобы определить эту незначительную разницу по сравнению с естественным фоном каждодневных непредвиденных изменений в состоянии всех индивидов из вашего исследования.
Иногда можно увидеть публикации о проведении подозрительно большого числа малых исследований, организованных для проверки только одного лекарства. Когда такое происходит, резонно предположить, что это своего рода маркетинговое мероприятие, устроенное с целью публикации серии статей, а не истинные научные изыскания. Вскоре вы познакомитесь с еще несколькими маркетинговыми приемами в разделе «Исследования с целью продвижения лекарства».
Во всем этом скрыта еще и очень интересная методологическая проблема. Когда вы планируете провести исследование для определения различий в показателях двух групп пациентов, принимающих различные лекарства, вы делаете так называемый расчет мощностей. С его помощью можно сказать, сколько пациентов вам понадобится для проверки, если вероятность обнаружить 20 %-ю разницу в количестве летальных исходов у пациентов из разных групп при данной ожидаемой частоте смертей у ваших участников составит 80 %. Если исследование проведено и не обнаружено никакой разницы в количестве смертей в группах пациентов, принимавших разные препараты, это значит, что вы не нашли фактов, подтверждающих преимущества одного лечения перед другим.
Это не то же самое, что показать равноценность двух разных препаратов друг другу. Если вы хотите показать, что два лечения эквивалентны, тогда по ряду сложных технических причин (мне нужно где-то провести границу) вам нужно гораздо большее число участников.
Люди об этом часто забывают. Например, исследование INSIGHT было организовано, чтобы проверить, действительно ли нифедипин лучше, чем коамилозид, при лечении высокого кровяного давления. Никаких фактов, подтверждающих это, найдено не было. В то же время в научной статье утверждалось, будто бы эти два лекарства идентичны друг другу, хотя на самом деле это было неправдой.18 Десятки врачей и ученых прислали письма с указанием на ошибку.
Состав крови мгновенно реагирует на прием дозы лекарства, а проведение анализа крови — обычная и несложная процедура. Однако пациентов больше интересует избавление от боли и страданий, чем колонки цифр на листке из лаборатории с результатами анализа.
Мы говорили уже об этом в предыдущей главе, но нужно снова и снова повторять это, так как в наших клинических знаниях есть еще очень много пробелов — и их количество нельзя преувеличить — из-за неоправданной, слепой веры в суррогатные критерии эффективности. Было проведено множество исследований для сравнения статинов с плацебо, которые показали, что первые могут достаточно успешно использоваться для предотвращения смертельных случаев. Во время других исследований один статин сравнивался с другим, однако оценка обоих препаратов производилась на основе суррогатных критериев клинической эффективности. Никто еще никогда не сравнивал статины друг с другом по критерию, какой из них лучше спасает от смерти. Это поистине непростительный промах, принимая во внимание то, что десятки миллионов людей по всему миру принимали эти препараты на протяжении многих лет. Если даже один из них предотвращает инфаркты всего лишь на 2 % эффективнее, чем другие, то получается, каждый день сотни людей умирают зря из-за нашего незнания. А этих смертей можно было бы избежать. Десятки миллионов пациентов подвергаются ненужному риску, потому что принимают лекарства, которые не сравнивались должным образом между собой. При этом по каждому из этих пациентов можно получить ценные данные, которые могут быть использованы для формирования новых знаний о том, какое лекарство в целом лучше, при условии проведения систематических рандомизированных исследований, направленных на изучение действия препарата на основные точки клинической эффективности. Обо всем этом вы узнаете больше в следующей главе, где мы будем обсуждать потребность в проведении больших простых исследований, потому что данная проблема не относится к научным. Пациенты лишаются жизни из-за нашего некритичного принятия данных исследований, во время которых не измерялись долгосрочные или основные критерии клинической эффективности.
Иногда использование неверного способа компоновки данных для получения итогового эффекта от лечения может привести к искажению результатов. Например, просто сдвинув пороговые отметки вправо, можно превратить незначительный положительный эффект от лекарства в значимый, завышая его эффективность. А при группировке нескольких положительных свойств препарата, воздействующих на разные параметры организма, в одно для получения «совокупного результата» можно разбавить данные по вредным эффектам или сделать так, чтобы ненужные свойства лекарства, воздействующие на параметры организма, не представляющие интереса, создали впечатление, будто наблюдается улучшение по целому ряду точек клинической эффективности.
Даже если вы собираете абсолютно истинные итоговые данные по основной точке клинической эффективности лекарства, то неправильно выбранный способ, при помощи которого вы сводите эти данные в течение исследования, может исказить общую картину. Приведу сначала несколько простых примеров, как это делается, а затем несколько более сложных.
Самый грубый пример: авторы многих статей (слава богу, все это уже в прошлом) использовали метод фиксации худшего зарегистрированного значения побочных эффектов.19 Это может привести к большим искажениям данных, так как при таком методе принимается во внимание только один лишь худший побочный эффект, который наблюдался когда-либо у пациента на протяжении всего исследования, а не сумма всех значений побочных эффектов, зарегистрированных в течение всего процесса. На графиках ниже вы можете увидеть, почему это так важно. Лекарство, представленное верхним графиком, выглядит таким же хорошим, как и лекарство внизу, благодаря использованному методу учета наихудшего значения из всех побочных эффектов, хотя лекарство внизу гораздо лучше, с точки зрения тяжести побочных эффектов.
Другой способ сведения результатов, который искажает общую картину, состоит в следующем: исследователь назначает пороговый критерий эффективности, после чего можно сделать вид, будто незначительное улучшение свидетельствует о значительной пользе от применения данного лекарства, в то время как в реальности ее может не быть вообще. Например, 10 %-е уменьшение интенсивности симптомов у больных может быть расценено как отличный результат, хотя пациенты все так же остаются немощными.20 Это в особенности искажает истинную картину, когда при лечении одним лекарством достигается значительное улучшение в состоянии пациента, при условии если средство вообще работает, а при применении другого лекарства наблюдается лишь скромный эффект, если оно работает вообще, но оба преодолевают произвольно установленный и скромный порог в 10 % в группах с одинаковым количеством пациентов: неожиданно более скромный препарат начинает казаться таким же действенным, как и лучшее лекарство в данном классе.
Также можно сводить вместе сразу несколько различных эффектов лекарства, чтобы получить один «суммарный эффект».21 Часто такое допускается, однако иногда данный подход может завышать положительные свойства лекарства. Например, в целом сердечные приступы происходят сравнительно редко, что справедливо и в том случае, если речь идет о большинстве исследований, при которых тестируются лекарства для лечения сердечно-сосудистых заболеваний. По этой причине такие исследования часто проводятся с большим количеством участников, чтобы иметь возможность определить разницу в частоте случаев сердечных приступов у пациентов двух групп. Из-за этого обычно все важные результаты воздействия лекарства «от сердечно-сосудистых заболеваний» группируются друг с другом. В этой «суммарной группе» объединяются смертельные случаи, сердечные приступы и грудная жаба (грудная жаба, или стенокардия, если вы не знаете, это боль в груди из-за проблем с сердцем. Она вызывает беспокойство, но не настолько сильное, как сердечный приступ и смерть). Значительное улучшение параметров по всем этим трем пунктам вместе может создать впечатление, что лекарство — прорыв и панацея от сердечных приступов и смерти, пока вы не взглянете на необработанные данные и не увидите, что на протяжении исследования сердечных приступов и летальных исходов почти не регистрировалось, а значит, на самом деле все улучшения параметров касаются лишь стенокардии.
Один из наиболее значимых суммарных эффектов был взят из знаменитого британского исследования UKPDS, во время которого изучалось, влияет ли как-нибудь интенсивный контроль уровня сахара в крови у диабетиков на реальные показатели организма. Сообщалось о трех ожидаемых результатах лечения: положительного эффекта от лекарства на первые два (смерть и смерть от диабета) зафиксировано не было, однако отмечалось 12 %-е увеличение суммарной эффективности препарата. Его совокупный эффект складывался из множества различных факторов:
• Неожиданная смерть;
• Смерть от высокого или низкого уровня сахара в крови;
• Сердечный приступ без смерти;
• Стенокардия;
• Сердечная недостаточность;
• Инсульт;
• Почечная недостаточность;
• Ампутация;
• Кровоизлияние в среднюю камеру глаза;
• Поражение глазных артерий вследствие диабета, требующее лечения лазером;
• Слепота на один глаз;
• Катаракты, требующие удаления.
Как видим, перед нами довольно длинный список, и 12 %-е снижение по всем его пунктам, конечно, выглядит как «результаты, производящие впечатление на пациента», как мы говорим в бизнесе (РПВП, если вам так больше нравится). Однако большинство улучшений в этом совокупном эффекте относится к людям, которым было проведено успешное лечение лазером в связи с повреждением глазных артерий. Это прекрасно, но едва ли эту болезнь можно назвать самой важной из всего списка. Такой результат возник, главным образом, благодаря своеобразной обработке данных, но его нельзя назвать конкретным реальным результатом. Если вас интересует действительный эффект, то можно сказать следующее: в количестве людей, жалующихся на потерю зрения, не было никаких изменений, но в любом случае понятно, что сокращение числа поражений глаз — менее важный результат, чем понижение числа сердечных приступов, смертей, инсультов или ампутаций. Сходным образом исследование обнаружило, что лекарство оказывает полезное воздействие на некоторые маркеры крови, предполагающие наличие проблем с почками, но фактического влияния на динамику развития самих почечных болезней в конечной стадии зафиксировано не было.
Все это интересно только потому, что исследование UKPDS имело немного легендарную репутацию среди врачей, поскольку выявило положительное воздействие препарата на многие точки клинической эффективности, начиная с интенсивного контроля уровня сахара в крови у диабетиков. Как возникло это широко распространившееся суеверие? Одна из групп предприимчивых исследователей решила найти все 35 обзорных работ по диабету, в которых цитировалось исследование UKPDS, и посмотреть, что было написано в них.22 В 28 работах говорилось, что исследование подтвердило наличие полезного совокупного эффекта, но только в одном упоминалось, что большинство отдельных эффектов относилось к улучшениям, касающимся наиболее обычных параметров, и только в шести было упомянуто об обнаружении отсутствия влияния на количество смертей, то есть на конечную точку клинической эффективности, которая имеет наибольшее значение при лечении больного. В ходе исследования выяснилось, что мы живем в мрачной реальности: слухи, упрощенные данные и выдаваемые за действительные желаемые результаты — все это с легкостью кочует из одной научной работы в другую, как и непроверенная и несоответствующая действительности информация со скоростью эпидемии распространяется по интернет-форумам, где обсуждаются вопросы по самым разным темам.
Иногда пациенты выбывают из процесса исследования вообще. Часто это происходит потому, что им не понравился прописанный препарат. Однако при анализе данных, собранных с двух групп, принимавших участие в исследовании, нужно убедиться в том, что были приняты в расчет все пациенты, которым было назначено лечение. В противном случае полезные свойства лекарства будут завышены.
Анализировать пациентов по лекарству, которое они принимали, а не по лечению, которое было им назначено на стадии рандомизации исследования, — одна из классических ошибок на стадии анализа данных, которая может чудовищно извратить все результаты. С первого взгляда все выглядит достаточно логично: если 30 % пациентов выбыли из процесса и не принимали ваши новые таблетки, они не испытывали на себе никаких положительных эффектов лекарства и не должны включаться в группу, которой был назначен проверяемый препарат.
Но как только вы начинаете задумываться о том, почему люди выбыли из исследования, проблемы этого метода начинают становиться очевидными. Может быть, пациенты прекратили принимать таблетки, потому что они вызывали ужасные побочные эффекты. Может быть, они прекратили прием, так как посчитали препарат недейственным и просто избавились от него. Может быть, больные не стали продолжать назначенный им курс и приходить на консультации, потому что умерли из-за вашего лекарства. Рассматривать пациентов только с позиции лекарства, которое они принимали, значит проводить анализ «по плану». Как показала практика, такой метод значительно завышает полезные свойства лекарств, поэтому не должен использоваться.
Если при проведении итоговых расчетов вы будете относить всех пациентов, которым было прописано ваше лечение (включая выбывших), к группе, принимавшей препарат, то такой метод будет называться «анализом общей выборки пациентов, начавших проходить лечение». Такой анализ и более консервативный, и имеет гораздо больше смысла, с точки зрения философии. Вы собираетесь использовать результаты вашего лечения для обоснования вашего решения, чтобы предложить какому-либо пациенту принять эти таблетки, а не насильно затолкать их людям в горло. Поэтому необходимо, чтобы результаты были взяты из анализа, при котором люди оценивались по критерию, что им было прописано врачом, а не по тому, что они в действительности принимали.
Мне посчастливилось оценивать 60 экзаменационных работ — настоящий день сурка, если такой бывает, — в которых пятую часть оценки нужно было заработать путем объяснения метода анализа общей выборки пациентов, начавших проходить лечение. В этом анализе вся суть доказательной медицины, ее программа, поэтому очень странно до сих пор видеть, как проводятся бесконечные анализы «по протоколу», в соответствии с планом исследования, результаты которых заносятся в выпускаемые фармацевтическими компаниями отчеты. В одном систематическом обзоре были сначала изучены все отчеты об исследованиях, поданные компаниями в государственный орган по контролю за распространением лекарств в Швеции, а затем опубликованные научные работы, относящиеся к тем же исследованиям (если таковые были).23 Все поданные в ведомство документы, за исключением одного, включали как результаты анализа, проведенного с учетом всех пациентов, начавших проходить лечение, так и данные анализа «по протоколу», в соответствии с планом исследования, потому что органы по контролю за распространением лекарств, при всех их огрехах и одержимости секретностью, ведут контроль за методологией немного строже, чем многие научные журналы. Все научные работы, кроме двух, сообщали только об анализе, проведенном «по протоколу» (в соответствии с планом исследования), который завышает полезные свойства лекарства. Именно эту версию читали врачи. В следующем разделе мы рассмотрим еще один пример, как научные журналы вносят свою лепту в завышение результатов. Несмотря на декларируемые ими задачи, что они де являются стражами, следящими за публикацией результатов качественно проведенных исследований, часто такие издания не выполняют свою работу должным образом.
Если во время проведения исследования измеряется несколько точек клинической эффективности, но автор расценивает улучшение в любой из них как положительный результат, то такие результаты недействительны. Наши тесты, необходимые, чтобы решить, является ли результат статистически значимым, предполагают, что исследователь измеряет только один параметр, одну точку клинической эффективности. Измеряя десяток параметров (точек клинической эффективности), ученый создает ситуацию, когда у него появляются десятки шансов получить положительный результат вместо одного, но при этом не декларирует это открыто. Получается, что в таком случае исследование является нечестным по своей структуре, и во время его проведения можно будет с большей вероятностью получить положительные результаты, чем они будут проявляться в действительности.
Представьте, что мы играем в кости и договариваемся, пусть даже в одностороннем порядке, о простой вещи: если я выбрасываю две шестерки, вы даете мне 10 фунтов. Я бросаю кубик, и выпадает две тройки, но я все равно требую выплатить мне 10 фунтов, заявляя, что именно об этом мы договорились изначально и что вы должны были мне дать 10 фунтов за выброс двух троек. Вы платите, и все довольны. По такому сценарию ведется сегодня игра в сфере клинических научных исследований. Такая практика, когда люди производят так сказать замену одних изначально установленных точек клинической эффективности на другие, является обычной и общепринятой. А нам, пациентам, приходится мириться с ней.
До проведения клинического исследования нужно написать его план. Это документ, в котором описывается то, что вы собираетесь сделать: сколько участников вы собираетесь набрать, где и как вы будете это сделать, какой препарат будет назначен каждой группе и какие точки клинической эффективности вы будете измерять. В исследовании нужно будет измерять все параметры как возможные точки клинической эффективности: вероятно, будет даже несколько различных шкал оценок для измерения боли, или депрессии, или чего-либо другого, что заинтересует вас (качество жизни или мобильность, которую вы измеряете при помощи какой-нибудь анкеты, смерть по разным причинам, смерть по каждой из ряда представленных причин и прочие параметры).
Все это делается до начала исследования для того, чтобы избежать одной простой проблемы: если вы измеряете много параметров, некоторые из них будут более привлекательными и статистически значимыми просто благодаря возникновению естественных случайных вариаций в данных исследования. Помните, что вы имеете дело с живыми людьми, проживающими в материальном мире, и их болевой порог, глубина депрессии, степень мобильности, качество жизни и т. д. будут разными от человека к человеку по ряду причин, и многие из них не будут иметь ничего общего с вмешательством, последствия от которого вы проверяете в ходе вашего исследования.
Если вы честный исследователь, вы будете использовать статистические тесты специально для выявления истинных полезных свойств лекарства, которое вы проверяете. Вы будете пытаться отличить эти реальные изменения от обычных случайных изменений в фоновых данных, которые вы увидите в результатах ваших пациентов при проведении различных тестов. Больше чем что бы то ни было вы захотите избежать получения ложноположительных результатов.
Традиционная пропорция статистической значимости совпадений 1 к 20. Грубо говоря, объясняя эту формулу простыми словами, если вы проведете одно и то же исследование много раз, используя те же методы, с теми же участниками из той же группы населения, то вы получите такие же положительные результаты, которые наблюдались в одном из 20 исследований, просто по случайности, даже если лекарство не оказывало совсем никакого полезного эффекта. Если вы будете зачерпывать двумя стаканчиками из одной бадьи с красными и белыми шариками, то и дело, чисто случайно, в одном стаканчике будет оказываться необычно мало красных шариков, а в другом — необычно много красных шариков. То же самое происходит и при измерении параметров здоровья пациентов: будут встречаться некоторые случайные вариации, и иногда все будет выглядеть так, как будто одно лекарство лучше другого, с точки зрения улучшения параметров организма, но на самом деле такое улучшение будет случайным. Статистические тесты разработаны для того, чтобы не дать этим самым случайным колебаниям параметров организма сбить нас с толку.
Поэтому сейчас давайте представим, что вы проводите исследование, при котором измеряете 10 разных независимых точек клинической эффективности. Если мы установим пропорцию статистической значимости как 1 к 20, тогда даже если ваше лекарство вообще не будет оказывать никакого полезного эффекта, в одном исследовании у вас все равно будет вероятность в пределах 40 % найти положительное действие лекарства по крайней мере на одну из точек клинической эффективности просто из-за случайных колебаний в ваших данных. Если вы предварительно не укажете, какие из параметров являются конечными точками эффективности, установленными изначально для исследования, то вы схитрите, а получив положительный результат по любой из 10 выбранных точек, вы объявите о позитивном результате вашего исследования.
Можете ли вы сразу открыто заявить о том, что делаете: «Эй, мы измерили 10 точек эффективности, и по одной из них наблюдается улучшение показателей, поэтому наше лекарство классное»? Да, наверное, так можно сделать, и в определенных обстоятельствах это сработает, потому что многие чтецы научных статей с удовольствием проглотят такую наживку и переключат внимание с одних точек клинической эффективности на другие. Однако большинство заметит вашу уловку. Им захочется увидеть отчет с результатами по изначально намеченным точкам клинической эффективности. Они-то знают, что, если измерять 10 параметров сразу, один из них уж точно будет выглядеть привлекательным просто по счастливой случайности.
Проблема состоит в том, что, даже если люди и знают, что вы должны устанавливать конечную точку клинической эффективности перед началом исследования, эти точки часто оказываются разными в плане исследования и в научной статье: они меняются после того, как проводящие исследование люди просмотрели результаты. Даже вы, случайный читатель, нашедший эту книгу на скамейке в метро, а не профессор статистики или врач, и то поймете, что это настоящее безумие. Если конечная точка клинической эффективности, упоминаемая в законченной статье, отличается от конечной точки клинической эффективности, намеченной до начала исследований, тогда создается совершенно абсурдная ситуация: весь смысл конечной точки клинической эффективности в том, что она назначается до того, как начинаются исследования. Однако люди меняют конечные точки клинической эффективности, и это не просто случайная проблема. На самом деле, это почти что обычное дело, нормальная практика среди исследователей.
В 2009 году группа исследователей собрала все работы, которые только могла найти, посвященные различным случаям использования лекарства под названием габапентин.24 Затем они посмотрели на данные тех исследований, по которым им удалось получить внутренние документы, где была указана первоначальная конечная точка клинической эффективности для каждого. Конечно, материалы половины всех исследований вообще не публиковались (возмущений по этому поводу не должно быть меньше с каждым новым случаем). Были опубликованы результаты по 12 исследованиям, и ученые проверили, действительно ли конечная точка клинической эффективности, упомянутая в научной статье, совпадала с той, которая декларировалась как таковая во внутренних документах до начала исследований.
Данные, которые были найдены, представляли собой настоящий хаос. Из 21 первичной конечной точки клинической эффективности, предварительно указанной в планах исследования, о которых следовало сообщить, было упомянуто только 11. О шести точках клинической эффективности, установленных первоначально, не упоминается нигде ни в какой форме, а еще четыре хоть и были включены в отчет, но упоминались в таком контексте, как будто они были вторичными точками клинической эффективности. Можно посмотреть на все с другого конца телескопа: в 12 опубликованных статьях об исследованиях сообщалось о 28 конечных точках клинической эффективности, но половина из них были новыми и никогда в действительности не были заявлены изначально как такие точки. Это было просто смешно. Никаких отговорок ни для исследователей, изменивших одни точки на другие, ни для работников научных журналов, которые не потрудились проверить информацию, быть не может. Однако были проверены исследования и отчеты о них только по одному лекарству. Можно ли назвать все произошедшее странной случайностью?
Нет. В 2004 году несколько исследователей опубликовали работу, в которой были изучены все области медицины. Были отобраны все исследования, одобренные комитетами по этике двух городов в течение двух лет, после чего опубликованные работы были проанализировали.25 Почти половина всех конечных точек клинической эффективности в отчетах была указана неправильно. Почти в двух третях опубликованных работ была изменена по крайней мере одна конечная точка клинической эффективности, и это было сделано совсем не случайно: как и можно было догадаться, о положительных результатах сообщали должным образом в два раза чаще, а искажений в них не наблюдалось. Другие исследования, авторы которых изучали изменение конечных точек клинической эффективности в отчетах, имели сходные результаты.
Чтобы прояснить ситуацию до конца, следует сказать о следующем. Если вы меняете изначально установленную конечную точку клинической эффективности без предоставления вразумительного объяснения, зачем вы это сделали, тогда вы просто нарушаете правила проведения исследований. Ваше исследование пристрастно, хаотично и представляет собой настоящую профанацию. Для всех исследований нужно установить одно универсальное правило: в отчете всех исследований изначально указанная конечная точка клинической эффективности должна оставаться неизменной и в конце исследования. За этим должны следить редакторы журналов, и так нужно было сделать еще на заре проведения клинических исследований. Сложного здесь ничего нет, однако все мы почему-то не соблюдаем такое простое, очевидное и самое главное требование. И так дела обстоят во всем мире.
Последним случаем, показывающим, к чему приводит на практике такое отношение к конечным точкам клинической эффективности, является история с пароксетином и исследованием, проведенным с участием детей. Хочу вам напомнить, что, когда над какой-нибудь компанией нависает потенциальная угроза проведения некоего судебного разбирательства, часто в руки исследователей попадают документы, которые в другой ситуации никогда не были бы показаны им. В результате у них появляется возможность выявить проблемы и несоответствия, что в обычной ситуации было бы невозможно. Такие документы в большинстве своем должны быть достоянием общественности, но их почему-то скрывают от глаз широкой публики. В этом отношении пароксетину повезло ничуть не больше, чем остальным лекарствам (как мы увидели из описанного выше исследования, перемена конечных точек клинической эффективности происходит везде и всюду). Я лишь просто описываю случай, по которому у нас есть больше всего информации.
В 2008 году группа исследователей решила изучить документы, доступ к которым был открыт после судебного процесса по одному из случаев рассмотрения пароксетина, и проверить, в какой форме были представлены опубликованные результаты клинического исследования («исследование 239»).26 В конце 2007 года систематические обзоры, посвященные этой работе, отзывались о ней так, будто это исследование принесло положительные результаты. Во всяком случае, во всех публикациях они назывались успешными. Но в действительности это было неправдой: в оригинальных протоколах были указаны две конечные точки клинической эффективности и шесть вторичных точек. В конце исследования разницы между пароксетином и плацебо при сравнении результатов этих точек отмечено не было. Помимо этого были измерены дополнительно еще 19 точек клинической эффективности, таким образом, их общее количество составило 27. Из них положительные результаты наблюдались только по четырем. Они и вошли в отчет, где информация преподносилась так, как будто бы они и были основными точками клинической эффективности.
Хотелось бы думать, что искажение данных в отчетности «исследования 239» всего лишь частный случай, исключение из правил и досадное недоразумение, которое не имеет ничего общего с остальными исследованиями. Грустно признавать, но исследователи очень часто поступают подобным образом, как в случае, описанном выше.
Эта практика так широко распространена, что работы здесь — непочатый край, если, конечно, найдутся достаточно смелые ученые для того, чтобы заняться реализацией такого грандиозного проекта. Кто-то ведь должен найти все исследования с измененными основными конечными точками клинической эффективности. Кто-то же должен потребовать предоставить доступ к изначальным, необработанным данным и в далекой перспективе провести их правильный анализ, специально для горе-исследователей, подделывающих результаты. Если вы решитесь на это и опубликуете ваши работы, они немедленно превратятся в справочник по этим исследованиям, потому что в них будут грамотно указаны предварительно установленные конечные точки клинической эффективности. Публикации оригинальных исследователей станут всего лишь сборниками ненужных и не имеющих отношения к науке цифр.
Я уверен, что они будут только рады, если вы окажете им посильную помощь.
Если лекарство не проявило себя с положительной стороны на протяжении всего исследования, можно сгруппировать данные по какому-либо признаку различными способами, чтобы посмотреть, оказалось ли оно эффективным в какой-либо подгруппе. Возможно, препарат идеально работает при приеме пациентами мужского пола китайского происхождения, которые принадлежат к возрастной группе между 56 и 71 годами. Это так же глупо, как играть в «орел — решка» по правилу «два из трех и три из пяти». Однако такие способы применяются исследователями повсюду.
Снова и снова нам приходится возвращаться к одному и тому же принципу этой главы: если вы увеличиваете свои шансы нахождения положительного результата, но используете статистические тесты, которые предполагают получение лишь одного параметра, тогда вы сильно повышаете вероятность нахождения нужных вам данных. Ведь если бросать монетку достаточно долго, то можно в конечном счете выбросить орел или решку четыре раза подряд.
Новый способ увеличить вероятность получения нужного результата — провести анализ подгрупп данных. Уловка заключается в следующем: вы закончили ваше исследование и получили отрицательный результат. Разницы между двумя группами не было никакой: пациенты, принимавшие плацебо, чувствовали себя точно так же, как и те, кто принимал ваш препарат. Ваше лекарство не работает. Это плохая новость. Но затем вы копнули поглубже, провели ряд анализов и обнаружили, что лекарство отлично сработало на группе некурящих мужчин испанского происхождения возрастом от 55 до 70 лет. Если вам непонятно, почему нельзя использовать такой способ при анализе, нужно вернуться к уже прочитанному и подумать о случайной вариации данных, имеющихся в любом исследовании. Предположим, ваше лекарство должно предотвращать летальные исходы у всех участников на протяжении всего исследования. Мы знаем, что смерть может наступить по ряду причин и часто довольно неожиданно, и ее, к сожалению, можно предсказать лишь частично на основе имеющейся в наличии информации о здоровье человека. Вы надеетесь, что после проведения исследования ваше лекарство будет способно предотвратить некоторые из этих случайных, непредвиденных смертей (хотя, конечно, не все, потому что ни одно лекарство не может уберечь от смерти по всем причинам!) и что вы сможете заметить это изменение в частоте смертей, если в исследовании принимает участие достаточно большое количество людей.
Но если посмотреть на результаты после завершения исследования и составить группу из умерших пациентов или из тех, кто выжил, вы не сможете сделать вид, что и та и другая не были сформированы произвольно.
Если вы до сих пор не поняли, почему этот способ нечестный, представьте себе рождественский пудинг с монетами, распределенными в его толще в произвольном порядке. Если вы хотите узнать, сколько в нем всего монет, то отрезаете наугад любой кусочек (одну десятую пудинга), считаете монеты, умножаете на десять и получаете общее число монет. Это исследование, в котором вы выбрали образец, не зная точно, где и сколько монет находилось. Если бы вы просветили пудинг рентгеновскими лучами, то увидели бы, что в нем есть такие места, где монет больше просто из-за их случайного скопления. И при умении хорошо управляться ножом можно было бы вырезать нужный кусок пудинга с наибольшим количеством монет, чем было в первоначальном образце. Если вы помножите количество монет в этом куске на десять, то получится, будто бы в пудинге намного больше монет, чем на самом деле. Однако это типичное мошенничество. Монеты все равно распределены в пудинге по случайному принципу. Кусок с наибольшим количеством монет, который вы вырезали после просвечивания пудинга рентгеном, не является репрезентативным и не дает достоверной информации о том, что на самом деле находится внутри него.
И несмотря на это такой способ оптимистичного анализа кочует из одной бизнес-презентации в другую, из одной компании в другую, и так день ото дня, год от года. «Вы видите, что в целом не наблюдается положительной динамики, — может сказать некий исследователь. — Но интересно, что благодаря нашей рекламной компании объемы продаж дешевых ноутбуков в регионе Богнора значительно возросли». Если раньше нельзя было сказать, что центр продаж в Богноре как-то отличается от других магазинов компании и нет причины полагать, что и компьютеры там отличаются от остальных ваших продуктов, тогда это самый сомнительный и неверный аргумент, выбранный из всех.
В более общих терминах можно было бы сказать: если вы уже видели ваши результаты, вы не можете искать в них вашу гипотезу. Гипотеза должна появляться до того, как вы увидели результаты, которые ее проверяют. Так что анализ данных по подгруппам — довольно толковый метод, но при условии, если его проведение было предусмотрено до начала исследования (или при условии, что вы учли в вашем анализе количество выполненных подгрупповых анализов). Иначе это просто еще один способ увеличить ваши шансы на нахождение спорных, ложнопозитивных результатов. Однако такие увертки очень популярны у исследователей, и редко кто из них устоит перед соблазном прибегнуть к подгрупповому анализу, так как результаты получаются исключительно привлекательными.
Корни этой проблемы находятся так глубоко, что она стала предметом целого ряда нарочито издевательских работ, проведенных исследователями-методологами, стремящимися ткнуть носом слишком оптимистичных исследователей, которые не видят изъянов в том, что они делают, в их собственные ошибки. Тридцать лет назад, Ли и его коллеги опубликовали классическую поучительную работу на эту тему в журнале «Circulation».27 Они набрали 1073 пациента с коронарной болезнью сердца и назначили им в произвольном порядке препарат 1 и препарат 2. Оба лекарства были фикцией, так как ученые не проводили настоящее исследование, а всего лишь делали вид. Однако исследователи собирали действительные данные по этим пациентам, чтобы посмотреть, что можно обнаружить в случайном, беспорядочном наборе параметров.
Они не были разочарованы. В целом, как и можно было ожидать, не было никакой разницы в динамике сердечно-сосудистых болезней у пациентов обеих групп, так как всем им давали одинаковые таблетки. Однако в выделенной подгруппе, состоящей из 397 пациентов (для них было характерно трехсосудистое поражение или ненормальное сокращение левого желудочка), показатель выживаемость среди тех, кого «лечили» препаратом 1, значительно отличался от того же показателя тех, кто принимал препарат 2, просто по случайному совпадению. Так что, оказывается, можно продемонстрировать эффективность препарата при помощи подгруппного анализа данных даже при ненастоящем лечении, так как и для первой, и для второй группы пациентов не делалось абсолютно ничего.
Можно найти ложные эффекты от лекарства в подгруппах в настоящих исследованиях, если сделать достаточно большое число хитрых анализов.28 Исследователи, занимавшиеся оценкой эффективности хирургической процедуры под названием эндартерэктомия, решили шутки ради проверить, до каких пределов можно дойти, разделяя пациентов по разным возможным подгруппам и анализируя результаты в пределах каждой из них. Сначала они обнаружили, что успешное проведение хирургического вмешательства зависело от того, в какой день недели родился пациент (см. таблицу ниже).29 Разумеется, если врач при принятии клинических решений основывается на этой информации, то его можно смело назвать дураком. Была заметна также прекрасная, почти линейная зависимость между месяцем рождения пациента и клиническим результатом: у пациентов, родившихся в мае и июне, наблюдался огромный положительный эффект, а затем, по мере смены месяцев, положительное воздействие все больше снижалось до марта, после чего операция становилась просто опасной. Если бы данные относились к такой биологически правдоподобной переменной, как возраст, этот результат в данной подгруппе было бы очень трудно игнорировать.
Наконец, при проведении исследования ISIS-2 сравнивался полезный эффект, оказываемый аспирином или плацебо на пациентов, которые предположительно недавно пережили сердечный приступ. Обнаружилось, что аспирин улучшал ряд показателей, однако исследователи смеха ради решили сделать подгруппный анализ. В ходе его выяснилось, что, хоть в целом аспирин и был эффективным, он не оказывал влияния на пациентов, родившихся под знаками Весов и Девы. Еще раз повторимся: если группировать данные различными способами, можно просто произвольно формировать какие угодно подгруппы с любыми, даже самыми нелепыми показателями.
Так значит ли это, что родившимся под знаками Весов и Девы пациентам не нужно давать лекарств? Вы конечно скажете «нет» и будете правы. Вы окажетесь гораздо мудрее всех тех медиков, кто прибегал к подгруппному анализу. Исследование CCGS обнаружило, что аспирин был эффективен при предотвращении инсультов и смертельных случаев у мужчин, но не у женщин,30 в результате женщин в течение почти 10 лет лишали необходимого лечения, пока дальнейшие исследования и обзоры не показали, что аспирин положительно действует и на их организм.
Эффект от каротидной эндартерэктомии у пациентов с 70 % симптоматическим стенозом при европейском исследовании операции 126 в зависимости от дня недели, в который родился пациент
Это один из множества подгруппных анализов. По их вине в медицинскую литературу попадают неверные данные и часто некорректно выявляются подгруппы людей, которым не становится лучше от лечения, считающегося эффективным. Так, например, мы думали, что тамоксифен, лекарство для блокирования гормонов, не подходил для лечения рака груди у женщин, если они были моложе 50 лет (мы были не правы). Мы думали, что тромболитики были неэффективными и даже вредными при лечении сердечных приступов у людей, которые уже имели его в анамнезе (мы ошибались). Мы думали, что лекарство под названием АКФ-ингибиторы прекращало понижать количество смертельных случаев у пациентов с сердечной недостаточностью, если они также принимали аспирин (мы заблуждались). Интересно и необычно то, что ни один из этих результатов не был получен в результате жадности до денег исследователей. Людьми двигали амбиции, возможно, стремление получить новые результаты. Сыграло свою роль и незнание рисков при проведении подгруппного анализа, и игнорирование фактора случайности.
Другой способ фальсификации данных: взять какую-либо группу исследований, выбрать подходящие фрагменты с описанием действия препарата и заставить его выглядеть более эффективным, чем он есть на самом деле. Если сделать это с одним исследованием одного лекарства, то уловка тут же будет раскрыта. Однако такую операцию можно совершить в рамках целой программы клинических исследований и создать путаницу, в которой никто не сможет разобраться.
Мы уже видели, что положительные результаты исследований публикуются чаще и распространяются интенсивнее, чем отрицательные, и это может сбивать с толку. По сути проблема состоит в следующем: когда мы делаем систематический обзор только по исследованиям, по которым опубликовали результаты, мы видим только ту выборку, которая содержит больше положительных результатов. В нашу папку для отбора работ, по которым будет сделан обзор, попадают только лучшие из них. Однако глупо думать, что все проводимые исследования приносят только положительные результаты.
Эта же самая проблема — каким образом отбираются образцы исследований — может быть представлена другим, более интересным способом, который лучше всего показать на примере.
Бевацизумаб — дорогое противораковое средство. Выручка от его продажи в 2010 году составила 2,7 млрд долларов, однако препарат не такой уж и действенный. Если зайти на сайт ClinicalTrials.gov, в журнале регистрации исследований (где также не все в порядке) можно найти около 1000 исследований этого лекарства, использовавшегося против множества типов рака: от рака почки и легкого до рака груди и толстой кишки. Его пробовали применять против всего.
Грустно признавать, но много результатов этих исследований пропало без вести. В 2010 году два исследователя из Греции решили отследить судьбу всех исследований, которые им только удалось обнаружить.31 Они искали только большие исследования «Этапа 3», в которых бевацизумаб сравнивался с плацебо, и нашли 26 законченных работ. Из них девять были опубликованы (с данными, стоившими внимания, по 7234 пациентам), и по трем имелись результаты, о которых сообщали на конференции (данные, стоившие внимания, по 4669 пациентам). Однако данные по еще 14 исследованиям, где участвовали в общей сложности 10724 пациента, остались неопубликованными.
Специалисты, не обнародовавшие результаты своих работ, заслуживают порицания, однако самое интересное состоит не в этом.
Они свели все результаты вместе, и в целом все выглядело так, будто бы независимо от вида рака препарат оказывает крайне ограниченное действие, незначительно влияет на выживаемость раковых больных и в общем действует одинаково на любую опухоль (хотя нужно добавить, что все сказанное справедливо до того, как вы примете в расчет побочные эффекты и другие весомые факторы). Это тоже не очень интересно. Помните, мы пытаемся уйти от мысли, что отдельные данные по лекарству заслуживают внимания и публикации, и сконцентрироваться на решении комплексных вопросов, поскольку это может повлиять на каждое лекарство и каждую болезнь.
Вот это и есть самый интересный аспект. С июня 2009 года по март 2010 года было опубликовано шесть различных систематических обзоров и мета-анализов по бевацизумабу, каждый по разному типу рака, в каждом по несколько исследований, посвященных изучению данного конкретного типа поражения.
Теперь ответим на следующий вопрос: если в одном из мета-анализов сообщается о положительном действии лекарства на одну из форм рака, можно ли назвать это действительным эффектом? Или же имел место подгруппный анализ, при котором у исследователя появляются дополнительные возможности получить положительный результат, независимо от истинного эффекта лекарства, благодаря случайности,как если бы мы бросали кубики снова и снова, пока не выпадут две шестерки? Есть подозрение, что именно так и обстоит дело. Я думаю, что речь идет именно о подгруппном анализе. Точно так же думают и Джон Иоаннидис и Фотини Карасса, те два исследователя, которые сводили данные вместе. Ни в одном из отдельных мета-анализов не был принят в расчет тот факт, что исследования являлись частью более обширной программы, во время которой проверки проводились одна за другой буквально с пулеметной скоростью. В определенный момент нескольким исследованиям было суждено принести похожие результаты. Иоаннидис и Карасса утверждали, что нам нужно анализировать все программы клинических исследований целиком, а не отдельные исследования или их группу, а также учитывать количество исследований, проведенных с лекарством по каждой болезни. Я думаю, они, вероятно, правы, однако это сложный случай. Как вы понимаете, ловушки расставлены повсюду.
Иногда клинические исследования вовсе не являются таковыми по сути. Они могут организовываться в качестве интенсивного маркетингового проекта, призванного заставить как можно больше врачей прописывать какой-либо препарат как можно чаще. В таких «исследованиях» принимают участие небольшое количество пациентов из множества разных клиник.
Предположим, вы хотите узнать, работает ли ваш новый обезболивающий препарат, который уже подтвердил свою эффективность при проверке на идеальных пациентах в процессе строгих исследований и при обычном клиническом использовании. Боль — довольно распространенный симптом, поэтому наиболее очевидный и практический подход — использовать в качестве исследовательских центров несколько местных клиник и набрать побольше пациентов из каждой. При проведении исследования такой подход принесет ряд преимуществ: можно быстро и дешево обучить тех немногих врачей, что участвуют в мероприятии; административные расходы будут ниже; к тому же вы можете контролировать стандарты данных должным образом, то есть у вас будет больше шансов получить качественные данные и надежные ответы.
Исследования ADVANTAGE на препарате «Виокс» проводились совсем по-другому. Было набрано более 5000 пациентов, однако план и программа мероприятия подразумевали, что каждый врач должен лечить только одну определенную группу больных. Это означало, что для проведения исследований требовалось много врачей, и к окончанию тестирования их количество достигло 600. Однако компания Mersk не имела ничего против, так как целью исследования было не узнать, насколько хорош препарат, а прорекламировать его как можно большему числу врачей, ознакомить медиков с процедурой назначения лекарства и заставить их рассказать о «Виоксе» своим друзьям и коллегам.
Подноготная исследований с целью продвижения лекарств обсуждается в медицинской литературе на протяжении многих лет, однако делается это очень осторожно, с ощущением нависшего над автором дамоклова меча в виде обвинения в клевете. А все потому, что, даже если число мест проведения исследования слишком велико, по мнению стороннего наблюдателя, нельзя быть абсолютно уверенным в том, что какое-то исследование организовано специально для продвижения препарата, если только вы не застали представителей компании за обсуждением этого факта.
В 2008 году были выпущены новые документы во время другого судебного разбирательства по «Виоксу», в ходе которого было доказано именно это.32 Хотя исследование ADVANTAGE преподносилось пациентам и врачам как изыскательное, в действительности же при ознакомлении с внутренними документами компании становилось ясно, что с самого начала его замышляли как маркетинговое мероприятие. Например, в одной служебной записке, озаглавленной «Описание и обоснование», которая была выпущена для внутреннего использования, говорится, что исследование было «разработано и проведено в духе маркетинговых принципов Merck». А таковыми являлись в порядке очередности: воздействие на выборочную группу критичных клиентов (врачей), демонстрация полезных свойств лекарства врачам, объединение исследовательской и маркетинговой команд, отслеживание количества выписываемых рецептов на «Виокс» докторами после окончания исследования. Данные полностью обрабатывались сотрудниками отдела маркетинга компании Merck. Главный автор научной статьи, где рассказывалось о результатах исследования, позднее сообщил изданию New York Times, что он не принимал участия ни в сборе, ни в анализе данных.
Исследования для продвижения препаратов поднимают несколько серьезных вопросов. Начать хотя бы с того, что цель каждого исследования скрыта от участвующих в нем пациентов и врачей, а также от комитетов по этике, дающих разрешение на участие пациентов в проверке лекарства. Передовая статья в журнале, напечатанная вместе с работой, в которой изобличались цели исследования, была такой осуждающей, насколько это позволительно быть статье в научном печатном издании.
[Эти документы] <…> говорят нам, что обман — ключевой элемент удачно проведенного исследования для продвижения препарата… Институтские наблюдательные советы по этике, чья цель — защищать людей, участвующих в исследованиях, вряд ли допустили бы пациентов до участия в таком мероприятии, во время которого их здоровье подвергается существенному риску и которое организовано только для того, чтобы заставить врачей как можно чаще прописывать лекарство. Если бы о целях исследования было известно заранее, мало кто из клинических исследователей стал бы принимать участие в нем. Мало кто из врачей осознанно решился бы провести набор пациентов для участия в опасном для их здоровья эксперименте только для того, чтобы обеспечить компании преимущество на рынке, и мало кто из больных согласился бы на такое. Исследования с целью продвижения лекарств могут проводиться, только если компания не раскрывает своих истинных намерений тем, кто может помешать выполнению задуманного.33
Таким образом, подобного рода исследования сбивают пациентов с толку. Мне как медику стыдно за таких недалеких, заносчивых, недальновидных врачей, когда представляешь их за кружкой пива в пабе, как они сидят и хвастаются своим коллегам: «У нас хорошие результаты по „Виоксу“. Я говорил тебе, что участвую в этом исследовании? Мы там грандиозной работой занимаемся».
Однако есть гораздо более конкретные опасения, касающиеся проведения этих исследований. Ведь в результате на свет появляется много данных плохого качества, так как цель таких исследований — продвижение лекарства на рынке, а не поиск ответов на значимые клинические вопросы. Сбор данных с малых групп пациентов, находящихся в разных клиниках, приводит к риску возникновения разного рода ненужных проблем: низкий контроль качества за информацией или менее качественное обучение исследовательского персонала, повышенный риск совершения нарушений или ошибок ввиду некомпетентности и т. д.
Такое заключение было сделано после проведения другого исследования для продвижения под названием STEPS. Во время него эпилептикам в местных неврологических клиниках давали лекарство под названием «Нейронтин». Истинная цель исследования была выявлена, когда во время судебного процесса обнародовали внутренние документы компании (еще раз повторю, что именно поэтому фармацевтические компании готовы пойти на любые трудности, лишь бы уладить дело конфиденциально и обойтись без суда).34 Как можно было ожидать, в этих документах исследование называется маркетинговым предприятием. В одной служебной записке говорится: «STEPS — это наилучший инструмент, который у нас есть в отношении „Нейронтина“, и мы должны использовать его всюду, где только возможно». Чтобы быть до конца ясным, поясним, что автор приведенной выше цитаты не подразумевает использование результатов исследования для продвижения лекарства на рынке. Ведь эта служебная записка была выпущена в то время, когда исследование еще только проводилось.
В связи с этим снова встают те же самые вопросы этики при проведении подобного рода исследований, так как докторов и пациентов опять обманули. Однако также вызывает сомнение и качество данных. Врачи, участвовавшие в процессе в качестве исследователей, были плохо подготовлены, имели мало опыта в проведении исследований или вообще его не имели, а перед началом исследования экзаменов на допуск сотрудников к работе не проводилось. Каждый врач в среднем смог уговорить около четырех пациентов участвовать в проверке. Медиков тщательно контролировали, но не ученые, а торговые представители, которые напрямую участвовали в сборе данных, заполнении исследовательских форм и которые даже вручали подарки в качестве награды за хорошую промоутерскую деятельность во время сбора данных.
Это особенно тревожит, если вспомнить о том, что «Нейронтин» совсем не безупречный препарат. Из 2759 пациентов у 73 наблюдались тяжелые неблагоприятные реакции, 997 пациентов испытывали побочные эффекты, а 11 умерли (хотя, как вы узнаете, мы не можем быть уверенными, что эти смерти были связаны с приемом препарата). Для «Виокса», препарата из исследования ADVANTAGE, организованного для продвижения лекарства, ситуация сложилась еще хуже. Он был в конечном счете убран с рынка, так как повышал риск возникновения сердечного приступа у принимавших его людей. Мы провели качественное изучение, чтобы определить присутствие эффекта от лекарства или наличие серьезных проблем. Нужно сказать, что, если бы во время исследования медики уделяли больше внимания фактическим результатам действия лекарства, это помогло бы выявить риски гораздо раньше и сократить вред, причиняемый здоровью пациентов.
Выявление исследований, направленных только на продвижение препарата, даже сегодня представляет собой тяжкий труд, и это в некотором роде опасное занятие. Подозрения особенно велики, когда публикуют результаты нового исследования по недавно появившемуся на рынке лекарству, в которых указывается, что количество мест, где набирали пациентов, очень велико и только небольшое число больных набрали из одного места. Это очень необычно.
Но при отсутствии каких-либо документальных доказательств, что эти исследования были спроектированы с целью проведения интенсивного маркетинга, мало кто из ученых осмелится заявить об этом открыто.
В конце вашего исследования, если его результаты не очень впечатляющи, вы можете улучшить их, изменив способ представления данных. Если же у вас вообще нет положительных результатов, вы можете просто их придумать.
Временами делать это очень сложно. Но есть один легкий способ, как улучшить неудовлетворительные данные исследования: преподносить их в форме относительного снижения риска. Хороший пример — история со статинами. На основе свидетельств и фактов, имеющихся в наличии на сегодняшний момент, все выглядит так, будто статины, по грубым прикидкам, снижают вероятность сердечного приступа вдвое на данный период, независимо от того, насколько высок был риск в прошлом. Если у пациента высокий риск наступления сердечного приступа — у него высокий уровень холестерина, избыточный вес, он курит и т. д., — тогда статин понижает ежегодный высокий риск наступления сердечного приступа вдвое. Однако если риск инфаркта невелик, статин также снижает его вдвое, что означает незначительное снижение при незначительном риске. Если вам будет проще понять все на конкретном примере, то я могу его привести. Представьте, что ваши шансы умереть от падения метеорита на голову значительно уменьшаются, если вы носите мотоциклетный шлем каждый день, однако метеориты не так часто падают людям на голову.
Стоит заметить, что есть несколько различных способов выразить в цифрах уменьшение риска и каждый будет влиять на наше восприятие по-своему, даже если оба способа точно описывают одно и то же явление. Например, ваши шансы получить инфаркт в следующем году высоки: 40 человек из 1000 таких же, как вы, станут жертвами сердечного приступа. Или, если вам так больше нравится, 4 % из них. Предположим, этих людей лечат статинами, и риск инфаркта у них понижается, так что сердечный приступ будет только у 20 человек из них, то есть у 2 %. Мы можем сказать, что наблюдается снижение риска инфаркта на 50 %, потому что он сократился с 4 % до 2 %. Такой способ представления информации о рисках называется «относительным снижением риска». Звучит красиво, тем более что за словами стоят большие цифры. Но мы также можем выразить то же самое изменение как абсолютное снижение риска, в котором отражено снижение с 4 % до 2 %. Разница в 2 % означает «2 %-е снижение риска возникновения сердечного приступа». Звучит менее впечатляюще, но все сказано правильно.
Теперь скажем, что ваши шансы пережить инфаркт в следующем году невелики (вероятно, вы уже поняли, к чему я клоню, но я все же закончу начатую мысль). Давайте скажем, что 4 человека из 1000 таких, как вы, станут жертвами сердечного приступа в следующем году, но если все они принимают статины, тогда это трагическое событие случится в жизни только двух из них. Относительное снижение риска все равно составит 50 %. А если выразить то же самое через абсолютное снижение риска, то получится снижение на 0,2 %, что звучит более скромно.
В медицине есть много специалистов, которые занимают решением вопросов, в какой форме лучше представлять такие риски и результаты. Много их работает в сфере, которая называется «совместным принятием решений».35 Они разработали множество различных методов измерения эффективности лечения, чтобы помочь врачам и пациентам точно понять, какой будет результат при приеме разных типов препаратов, когда, например, предстоит выбрать тип химиотерапии после удаления опухоли молочной железы. Преимущество этих методов состоит в том, что они приближают врача к той роли, которую ему предстоит играть в будущем: роли личного консультанта, человека, который знает, как найти подтверждающие действенность лечения факты, и может толково рассказать обо всех рисках, но который также понимает интересы и приоритеты пациентов. Намерены ли они выжить любой ценой или же предпочитают не страдать от побочных эффектов?
Исследования показали, что, если вы представляете положительный эффект от приема лекарства как относительное снижение риска, люди чаще всего принимают положительное решение о медицинском вмешательстве. В одном исследовании были изучены 470 пациентов, которым в приемной врача предоставили описание некой болезни, а затем рассказали о действии на нее двух различных препаратов.36 В действительности оба лекарства были одним и тем же средством с одинаковым эффектом, однако риски выражались двумя разными способами. Более половины пациентов выбрали препарат, преимущества от которого были выражены в форме относительного снижения рисков, и только один из шести выбрал тот препарат, свойства которого описывались в форме абсолютного снижения рисков. Остальные пациенты отказались сделать выбор.
Было бы ошибкой думать, что для каждого пациента выдумывается свой уникальный подход для манипулирования при помощи цифр, отражающих риски и полезные свойства лекарства. Такие же результаты получали снова и снова в экспериментах по изучению логики принятия решений врачами при выписывании лекарств,37 и даже органами здравоохранения при закупке медикаментов,38 хотя уж там точно должны были работать искушенные в математике врачи и менеджеры, способные грамотно соизмерить опасность рисков и полезный эффект от лекарств.
В связи с этим тревожно видеть, как при сообщении о скромных положительных свойствах новых лекарств компании представляют данные в виде относительного снижения риска. Так делают и в популярных СМИ, и в изданиях для специалистов. Снова хочется рассказать об еще одном случае со статинами, о том, как освещалось исследование «Юпитер».
Во время этого исследования изучались полезные свойства существующего лекарства, розувастатина, предназначенного для людей, у которых наблюдался низкий риск возникновения сердечного приступа. В Великобритании большинство называло его «чудо-лекарством» (газета «Daily Express», да благословит ее Господь, решила, что речь идет о совершенно новом препарате,39 в то время как на самом деле речь шла о применении старого лекарства, которое назначалось в течение многих лет больным с умеренным и высоким риском возникновения инфаркта, но теперь его стали прописывать и тем, у кого такой риск был низким). Все газеты сообщали об эффективности препарата в форме относительного снижения риска: «Количество сердечных приступов уменьшилось на 54 %, количество инсультов — на 48 %, а необходимость проведения ангиопластики или шунтирования — на 46 % у пациентов, принимавших „Крестор“, по сравнению с группами, где пациенты принимали плацебо или неактивные лекарства», — сообщала «Daily Mail». В «Guardian» писали: «Исследователи обнаружили, что в группе, принимавшей препарат, риск возникновения сердечного приступа был ниже на 54 %, а инсульта — на 48 %».40
Все цифры были абсолютно точными, но как вы уже знаете, при их представлении в форме относительного снижения риска завышается эффективность лекарства. Если представить те же самые результаты того же самого исследования в форме абсолютного снижения риска, они будут выглядеть менее впечатляющими. При приеме плацебо риск сердечного приступа составлял 0,37 событий на 100 человек в год. Если пациенты принимали розувастатин, риск снижался до 0,17 событий на 100 человек в год. При этом препарат нужно принимать по одной таблетке каждый день, а он может вызывать побочные эффекты.
Многие исследователи думают, что лучший способ сообщить о рисках — указать «число больных, которых необходимо лечить». Это очень конкретный метод, при котором рассчитывается, скольким людям нужно принять лекарство, чтобы эффект проявился у одного из них. В газете, где сообщали о результатах исследования, данные «Юпитера» не представлялись как «количество людей, которых нужно лечить», но в этой группе с низким риском, я полагаю, таблетку должны были принять несколько сот людей, чтобы был предотвращен один сердечный приступ. Если вы хотите принимать розувастатин каждый день, зная, что существует всего лишь потенциальная возможность получения положительного эффекта от лекарства, тогда это целиком и полностью ваше дело. Я не знаю, какое решение принял бы я, ведь каждый человек по-своему неповторим и уникален, как можно заключить из того факта, что одни люди, у которых риск наступления сердечного приступа был низким, решали принимать статин, а другие отказывались от него. Меня беспокоит лишь то, чтобы в газетах, в пресс-релизах и в оригинальных статьях в научных журналах о результатах сообщалось в ясной, доступной форме.
Давайте рассмотрим еще один, последний пример. Если результаты вашего исследования неудовлетворительны, у вас есть еще один шанс. Вы можете представить их таким образом, как будто они положительные, независимо от того, что было найдено на самом деле.
Группа исследователей из Оксфорда и Парижа решила систематически изучить этот вопрос в 2009 году.41 Они взяли каждое опубликованное в течение одного месяца исследование с негативными результатами в прямом смысле этого слова, то есть такое исследование, в плане которого стояло выявить эффективность лекарства по какой-то конечной точке клинической эффективности, но воздействия зафиксировано не было. Затем ученые просмотрели отчеты в научных журналах по 72 исследованиям, ища факты искажения данных: попытки представить негативные результаты в позитивном свете или отвлечь читателя от того факта, что основные результаты исследования были негативными.
Сначала они изучали лидер-абзацы, в которых излагается краткое резюме научной статьи. Лидер-абзацы размещаются на первой странице перед самой статьей, и их просматривают чаще всего либо потому, что люди слишком заняты, чтобы читать всю работу, либо потому, что у них нет доступа к ней без оплаченной подписки (само по себе уже возмутительно). Обычно, пробежавшись глазами по абзацу, вы ожидаете встретить фразы типа «эффективность препарата» — «сокращение количества сердечных приступов в 0,85 раз у пациентов, принимающих наше супер-лекарство от сердца», а также статистическую значимость результата. Однако из 72 исследований, в которых были получены отрицательные результаты по основным точкам клинической эффективности, только в 9 работах такие цифры приводились в лидер-абзаце правильно, а по 28 работам в лидер-абзацах вообще не приводилось никаких цифр по основным точкам клинической эффективности. Отрицательные результаты были просто спрятаны подальше от людских глаз.
Дальше было еще хуже: только по 16 исследованиям об отрицательных результатах сообщалось должным образом хотя бы в самой статье.
Так что же произошло с отчетами об исследованиях? Данные просто извратили. Иногда исследователи находят другие положительные результаты в таблицах и делают вид, что именно их они и намеревались получить (с этой уловкой мы уже знакомы: «перемена конечных точек клинической эффективности»). Иногда они проводят искаженный подгрупповой анализ, с которым мы также уже знакомы. Иногда они утверждают, будто выяснили, что их препарат оказался ничуть не хуже другого лекарства, в то время как в действительности такая проверка требует большей выборки людей, потому что можно случайно упустить истинное различие. Иногда такие исследователи нагло и беспардонно талдычат о том, как хорошо прошла проверка препарата, несмотря на факты.
Эта работа не единственная. В 2009 году другая группа изучила работы, в которых сообщалось о проведении исследований с целью проверки эффективности глазных капель с простагландином для лечения глаукомы42 (как всегда, специфическое состояние и лекарство не имеют друг к другу отношения; это важный принцип). Они нашли в общей сложности 39 исследований, из которых подавляющее большинство — 29 — спонсировалось фармацевтическими компаниями. Выводы были ужасающими: в 18 из 29 профинансированных производителями лекарств исследований в лидер-абзаце приводился вывод, который шел вразрез с основными результатами. Все исследования, не финансировавшиеся производителями лекарств, таким недостатком не страдали.
Все это возмутительно. Однако это стало возможным благодаря изъянам в системе информирования в научной медицине. Если не заставлять исследователей сообщать о конечных точках клинической эффективности в своих работах, если допускать, чтобы они каждый раз меняли точки, хорошо зная, что это искажает статистику, то это неизменно будет приводить к грубому извращению результатов исследования. Если планы проведения исследований ясно и четко не соотносятся с информацией, представленной в статьях, что позволяет проверять и сопоставлять одно с другим с целью выявления подмены одних точек клинической эффективности другими, это приводит к искажению результатов. Если редакторы и эксперты не требуют предоставления предварительных планов проведения исследований вместе с научными работами и не сравнивают их друг с другом, они допускают искажение результатов. Если они не контролируют содержание лидер-абзацев, они сотрудничают с фальсификаторами фактов, вносят разлад в работу врачей. В результате таких подлогов доктора принимают решения о лечении больных, основываясь на догадках и допущениях, а не на проверенных фактах, и поэтому тоже вредят здоровью пациентов.
Многие из тех, кто читает медицинскую литературу, неосознанно предполагают, что такие предосторожности предпринимаются всеми редакторами журналов, и такое заблуждение, пожалуй, представляет самую большую проблему. Однако такие люди ошибаются. Закон не требует от редакторов выполнять все то, о чем мы говорили. Каждый может игнорировать факты и не делать очевидных вещей. Поэтому так часто нелицеприятные факты беззаботно и легко перевираются журналистами, политиками, различными шарлатанами.
Наконец, и это беспокоит больше всего, факты искажения были замечены и в систематических обзорах и мета-анализах, которые справедливо считаются наиболее надежными способами доказательств. В одном исследовании сравнили обзоры, выполненные при финансировании фармацевтических компаний, с независимыми обзорами Cochrane Collaboration.43 В письменных заключениях обзоров, спонсированных производителями лекарств, рекомендовалось использовать исследуемый препарат без всяких оговорок, в то время как ни в одном мета-анализе Cochrane Collaboration призывов к применению лекарства не делалось. Несоответствие просто громадное, так как разница наблюдалась не в числовых результатах по эффектам лекарства, а только в описательной части.
Отсутствие скептического настроя при выполнении обзоров, спонсированных фармацевтическими компаниями, также подтверждалось и отношением к методическим недочетам, которые имели место при проведении исследований, охваченных обзором. В большинстве своем о недостатках методологии просто не сообщалось. Составители обзоров Cochrane гораздо чаще уделяли внимание проверке объективности авторов к выполняемой работе. Во время исследований, проведенных при финансировании фармацевтических компаний, все недостатки методологии скрывались. Данный факт также можно назвать лишним напоминанием о том, что результаты научной работы более важны, чем пустые разглагольствования в разделе обсуждений. Также хочется напомнить о том, что результаты необъективных исследований, проведенных при финансировании производителей лекарств, проникают глубоко в мир науки.
Глава 5
Клинические исследования: больше и проще
Итак, мы выявили, что в медицине существуют некоторые действительно серьезные проблемы. Мы сталкиваемся с ненадлежаще разработанными исследованиями, страдающими всевозможными фатальными ошибками: они проводятся на нетипичных пациентах, они слишком краткие, они «теряются», если результаты нелестные, их анализируют по-глупому, а часто они вообще не выполняются, просто из-за дороговизны или из-за недостатка стимулов. Эти проблемы пугают своей обыденностью: они касаются как исследований для выпуска лекарств на рынок, так и исследований, проводимых после этого. А именно их результаты являются руководством для доктора и пациента при принятии решений по лечению. Складывается впечатление, что некоторые люди смотрят на исследование как на игру, основной идеей которой является скорее выйти сухим из воды, сделав нечто беззаконное, чем провести честные испытания лекарств, которыми мы пользуемся.
В наши дни эта неприятная ситуация стала настоящей проблемой. Мы понятия не имеем, какое лечение самых основных заболеваний, встречающихся у наших пациентов, является наилучшим, и, как следствие, люди страдают и умирают, хотя могли бы жить. Пациенты, люди в целом и даже многие врачи находятся в неведении относительно этой страшной реальности, но в медицинской литературе этот вопрос поднимают снова и снова.
Примерно около 10 лет назад в выпуске «Британского медицинского журнала», посвященном медицине будущего, описывали ошеломительный размах нашего невежества. Мы до сих пор не знаем, пояснялось там, какое лечение является лучшим для пациента, который только что перенес апоплексический удар. Но в журнале также приводилось обезоруживающе простое наблюдение: апоплексические удары настолько часты, что если взять каждого пациента в мире, впервые перенесшего апоплексический удар и включить его в случайное испытание по сравнению лучшего курса лечения, мы в течение 24 часов наберем достаточно пациентов, чтобы ответить на этот вопрос. И произойдут изменения в лучшую сторону: многие исходы апоплексического удара, например летальный, прояснятся в течение месяцев, иногда недель. Если бы мы сегодня начали проводить это испытание и проанализировали результаты по мере их поступления, можно было бы скорректировать лечение быстрее, чем вырастет подсолнух.
Манифест, выраженный в этой работе, очень прост: когда бы у нас ни появилась изначальная неуверенность в том, какое лечение является лучшим, нам следует провести рандомизированное исследование; в медицину все время нужно вносить правки, собирая дополнительную информацию и совершенствуя наше вмешательство не только в виде исключения, но во всех возможных случаях.
Существуют технические и культурные барьеры для выполнения таких вещей, но они преодолимы, и мы можем их пройти, рассмотрев приведенный ниже проект исследования. В проекте рандомизированные исследования вводятся в повседневную работу врачей общей практики.1 Эти испытания настолько дешевые и незаметные, что их можно проводить в любых случаях возникновения изначальной неуверенности, а все результаты собираются автоматически, почти бесплатно, из записей пациентов, сделанных на компьютере.
Чтобы проект этих исследований был более конкретным, давайте взглянем на пилотное испытание, где сравниваются друг с другом два статина, с целью определить, какой из них лучше предотвращает сердечный приступ и летальный исход. Это как раз то самое испытание, которое вы, по наивности, можете считать уже проведенным; но как мы увидели в предыдущей главе, данные по статинам не до конца проанализированы, даже несмотря на то, что это одни из самых часто выписываемых лекарств в мире (конечно, поэтому мы возвращаемся к ним в этой книге). Люди провели испытания, сравнивая каждый статин с плацебо, что является никудышным сравнением, и выявили, что статины спасают жизнь. Также люди провели испытания, сравнивая один статин с другим, что является здравым сравнением; но во всех этих испытаниях используют холестерол в качестве суррогата результата, что крайне неинформативно. Мы видели в исследовании роль антигипертензивной и гиполипидемической терапии в профилактике сердечных приступов (ALLHAT), например, что два лекарства могут аналогичным образом снижать кровяное давление, но предотвращать сердечные приступы они будут очень поразному. Настолько по-разному, фактически, что большое количество пациентов в течение многих лет умирало зря до проведения испытания ALLHAT, просто потому что этим людям прописывали менее эффективное лекарство (которое, по совпадению, было более новым и дорогим).
Итак, нам нужны практические испытания, чтобы увидеть, какой статин, при обычных дозах, лучше всего спасает жизнь; и я бы сказал, что эти испытания следует провести срочно. Наиболее широко в Великобритании применяются аторвастатин и симвастатин, поскольку оба они не запатентованные и, следовательно, дешевые. Если окажется, что один из них всего на 2 % лучше другого при предотвращении сердечных приступов, эти знание поможет спасти большое количество жизней во всем мире, поскольку сердечные приступы очень распространены и статины широко применяются. Отсутствие ответа на этот вопрос ежедневно будет стоить нам множества жизней. Десятки миллионов людей во всем мире принимают эти лекарства прямо сейчас. Все они подвергаются неоправданному риску, порожденному тем, что лекарства не сравнивались друг с другом надлежащим образом, хотя каждый из пациентов способен предоставить информацию, которую можно использовать для сбора знаний о том, какое лекарство лучше использовать.
Наше крупное прагматическое исследование очень простое. Все в клиниках врачей общей практики компьютеризовано, начиная с назначения на прием и заканчивая примечаниями к прописанным рецептам, как вы, наверное, уже знаете из собственного опыта посещения врача. Каждый раз, когда врач общей практики видит пациента и собирается прописать ему статин, обычно он кликает на клавишу «прописать», переходит на страницу выбора лекарства и распечатывает назначенный рецепт. Для нашего испытания врачам общей практики добавляем еще одну страницу. «Подожди, — может сказать врач. — Мы не знаем, какой из этих двух статинов самый лучший».
«Вместо того чтобы выбирать, — может ответить страница (я перефразирую), — нажми эту красную кнопку, чтобы случайным методом назначить своему пациенту тот или другой статин, введи данные в наше испытание, и тебе никогда больше не придется об этом думать».
Последняя часть последнего предложения крайне важна. В настоящее время испытания являются масштабным и дорогим административным мероприятием. Многие из исследователей борются за то, чтобы завербовать достаточное количество пациентов, а еще большее количество борется за то, чтобы завербовать действующих врачей, поскольку никому не хочется заполнять карточки пациентов, назначать пациентам дополнительные приемы, проводить дополнительные замеры и т. д. В наших испытаниях нет ничего подобного. Данные по пациентам отслеживают: их уровень холестерола, сердечные приступы, таинственные своеобразные побочные эффекты, апоплексические удары, эпилептические припадки, смерть. Все эти данные автоматически взяты из электронной медицинской карточки, никто палец о палец не ударил, чтобы их достать.
У этих простых испытаний есть один недостаток, который вы, вероятно, могли уже определить, а именно то, что они не «слепые», поэтому пациенты знают названия лекарств, которые они приняли. В некоторых исследованиях это является проблемой: если вы полагаете, что вам дали очень эффективное лекарство, или если вы полагаете, что вам дали никуда не годное лекарство, сила ваших убеждений и ожидания могут оказать влияние на ваше здоровье. Этот феномен известен как эффект плацебо. Если вы сравниваете обезболивающее с таблеткой-пустышкой, пациент, знающий, что ему дали таблетку-пустышку в качестве обезболивающего, вероятно, будет раздражен и почувствует еще большую боль. Но очень трудно поверить в то, что у пациентов есть твердые убеждения об относительных плюсах аторвастатина и симвастатина и что эти убеждения повлияют на смертность от сердечно-сосудистых заболеваний через пять лет. В исследовании мы пришли к компромиссу идеального и практичного, тщательно рассмотрев воздействие любых методологических дефектов на результаты.
Итак, наряду с этим недостатком, следует улучить момент и отметить, сколько серьезных проблем, связанных с испытаниями, может быть снято благодаря плану наших простых испытаний по электронным медицинским карточкам. Оставив положение о том, что все будет проанализировано надлежащим образом, без сомнительных уловок, упомянутых в предыдущей главе, напомним о существовании других, более специфических преимуществ. Прежде всего, как нам известно, испытания часто проводятся на непредставительных «идеальных пациентах» и со странными параметрами. Но пациенты в наших простых прагматических испытаниях являются реальными пациентами. Они как раз те самые люди, которым врачи общей практики прописывают статины. Во-вторых, из-за того, что испытания дорогие, они часто бывают небольшими. Наше прагматическое испытание, между тем, очень дешево, потому что почти вся работа проводится с использованием существующих данных — запуск первого испытания стоит 500000 фунтов, и сюда включается построение платформы, которую можно использовать для проведения любого испытания, которое вам потребуется в будущем. Это исключительно дешево для мира исследований. В-третьих, испытания часто бывают сжатыми и являются несостоятельными для фактических результатов: наше простое испытание может длиться вечно, и мы можем собрать дополнительную информацию и отслеживать, был ли у людей сердечный приступ или апоплексический удар и наступил ли летальный исход. Это может длиться десятилетия почти бесплатно с помощью отслеживания состояния пациентов через электронные медицинские карты, которые ведутся врачами в любом случае.
Все это возможно в нашей стране благодаря Базе данных семейных врачей Великобритании, которая ведется много лет. Там хранятся анонимные медицинские документы нескольких миллионов пациентов. База уже широко используется для мониторинга различных исследований по побочным действиям, о которых я говорил ранее: фактически, этой базой сейчас владеет и руководит государственная служба по надзору в сфере здравоохранения. На сегодняшний день, однако, ее используют скорее для эмпирического исследования, чем для рандомизированных испытаний: отслеживаются назначения лекарств и медицинские условия, однако проводится общий анализ, в надежде, что можно будет выделить детали. Это может оказаться полезным при сборе нужной информации о нескольких лекарствах, но также эта информация может сбить вас с толку, особенно когда вы пытаетесь сравнивать преимущества различных методов лечения.
Причина в том, что, как правило, люди, которым назначили одно лечение, отличаются от тех, которым назначили другое лечение, даже если вы думаете, что это одна и та же категория. Могут существовать странные, непредсказуемые причины, по которым некоторым пациентам выписывают одно лекарство, а некоторым — другое. И очень трудно вычленить эти причины или объяснить их по факту, когда вы уже проанализировали собранные вами в повседневной медицинской практике данные.
Например, есть больше вероятности, что людям, проживающим в дорогих кварталах, выпишут более дорогое из двух аналогичных лекарств, потому что их бюджет не такой скудный и дорогой препарат чаще встречается в продаже. В таком случае, даже если дорогое лекарство ничуть не эффективнее более дешевой альтернативы, оно будет выглядеть как лучшее в данных условиях, поскольку богатые люди, в целом, более здоровые. Этот эффект иногда создает видимость, что лекарства более действенные, чем они есть на самом деле. Многие люди имеют небольшую проблему с почками, например, и не считают ее такой уж важной на фоне остальных проблем со здоровьем; однако их врач, располагающий анализом крови, понимает, что почки таких пациентов не очищают кровь так же эффективно, как у самых здоровых людей. Когда эти пациенты будут лечиться от депрессии, скажем, или от гипертензии, вероятно, им выпишут более щадящее лекарство, просто чтобы подстраховаться по поводу небольших проблем с почками. В таком случае, лекарство будет выглядеть гораздо менее эффективным, чем оно есть на самом деле, когда вы будете рассматривать результаты пациентов, потому что люди, принимавшие его, были больны в гораздо большей степени с самого начала: пациентам с незначительными проблемами почек было предписано лекарство, которое считалось самым безопасным.
Даже когда вы знаете, что такие вещи происходят, тяжело учесть их в своем анализе; но часто появляются гремлины, разрушающие ваши открытия, а вы даже не осознаете, что они есть. Иногда это приводит к серьезным проблемам: заместительная гормональная терапия — один из памятных случаев заблуждения людей, поверивших в «данные наблюдений» вместо того, чтобы провести испытание.
ЗГТ — приемлемо безопасный и эффективный краткосрочный метод снижения неприятных симптомов, которые испытывают некоторые женщины во время менопаузы. Но также такие препараты прописывали гораздо более широко пациентам, некоторые из которых принимали их много лет беспрерывно, по причинам, граничащим с эстетикой: считалось, что ЗГТ — способ обмануть время и сохранить молодость тела, что в какой-то степени было желательно для многих женщин. Но это не единственная причина, по которой врачи прописывали долгосрочный прием этих лекарств. Просмотрев карточки женщин преклонного возраста, исследователи пришли к успокаивающему выводу: женщины, которым проводилась ЗГТ в течение многих лет, живут дольше и состояние их здоровья лучше. Это была очень радостная новость, и она в еще большей степени способствовала оправданию долгосрочного предписания ЗГТ. Никто никогда не проводил рандомизированное исследование, в котором бы женщинам назначалось ЗГТ или обычное лечение без ЗГТ. Вместо этого результаты «эмпирических» исследований просто приняли за чистую монету.
Когда, наконец, было проведено испытание, оно преподнесло нам неприятный сюрприз. ЗГТ не просто не защищает вас, а, фактически, увеличивает ваши шансы на приобретение серьезных проблем с сердцем. Эта терапия казалась полезной только потому, что, в целом, женщины, запрашивающие ЗГТ у своих врачей, были богатыми, жизнерадостными, активными и обладали прочими качествами, которые, как мы уже знаем, ассоциируются с долголетием. Мы не сравнивали подобное с подобным, и из-за того, что мы отнеслись к данным наблюдений не критически и не организовали рандомизированного исследования, женщинам продолжали прописывать лечение, подвергающее их риску. Даже если мы примем, что некоторые женщины могли рискнуть жизнью ради прочих благ долгосрочного приема ЗГТ, все женщины были лишены этого выбора из-за того, что мы не смогли провести достоверное тестирование.
Именно поэтому нам требуется проводить рандомизированные исследования во всех случаях, когда мы не уверены в том, какое лекарство лучше всего подходит пациентам: поскольку, если мы хотим сделать справедливое сравнение двух лечений, нам нужно быть уверенными в абсолютной идентичности людей, которым оно прописано. Но случайное назначение одного из двух лечений реальным пациентам, даже когда вы понятия не имеете, какое из них лучше, привлекает всевозможное негативное внимание.
Лучше всего это проиллюстрировано невероятным парадоксом, который в настоящее время присутствует в управлении повседневной врачебной практикой. Когда принятие решения по лечению не является очевидным, из двух возможных методов доктор может выбрать один произвольно, подчиняясь мимолетному порыву. Когда вы это делаете, гарантий безопасности не существует из-за откровенно низкой планки, установленной Генеральным медицинским советом для всей медицины. Если, однако, вы решаете случайным выбором назначить вашим пациентам то или иное лечение, в той же самой ситуации, где никто понятия не имеет, какой лечение является лучшим, вы внезапно сталкиваетесь с бюрократическими проблемами. Врач, пытающийся получить новые знания, улучшить лечение и уменьшить страдания без дополнительного риска для пациента, привлекает гораздо больше внимания со стороны государственных органов; но, помимо прочего, этот врач обречен на горы бумажной работы, которая до такой степени замедляет процесс, что исследование просто перестает быть практичным. И поэтому страдают пациенты — за отсутствием очевидности.
Вред, причиняемый этими несоразмерными задержками и препятствиями, хорошо проиллюстрирован в двух исследованиях, оба проводились в отделениях реанимации и интенсивной терапии в Великобритании. В течение многих лет было общепринятым применять при лечении пациентов с черепно-мозговой травмой стероиды. В принципе, в этом есть здравый смысл: после черепно-мозговой травмы возникает отек, и, поскольку черепная коробка имеет ограниченный объем, в данном случае он приведет к сдавливанию мозга. Известно, что стероиды уменьшают отек, и поэтому мы вводим их в коленный сустав и т. д.: итак, введение стероидов людям с черепно-мозговыми травмами, теоретически, предотвращает сдавливание мозга. Некоторые врачи прописывали стероиды из этих убеждений, а некоторые нет. Никто не знал, кто был прав. Люди из обоих лагерей были убеждены, что их оппоненты не в своем уме.
Для того чтобы избавиться от неопределенности, было разработано исследование под названием ТРАВМА. Предполагалось пациентов с серьезными черепно-мозговыми травмами, находящихся без сознания, методом случайной выборки разделить на тех, кому будут вводить стероиды, и тех, кого будут лечить без применения стероидов.2 Это вызвало огромные трудности с комитетами по этике, которым не понравилась идея случайного отбора пациентов, находящихся без сознания, даже несмотря на то, что им прописывалось одно из двух лечений, широко распространенных в Великобритании, где никто не имел представления, какое из них лучше. Никто ничего не терял, приняв участие в исследовании, но ежедневное откладывание этого испытания наносило вред будущим пациентам.
Когда, наконец, исследование было одобрено и проведено, выяснилось, что стероиды нанесли вред большому количеству пациентов: четвертая часть людей с серьезными черепно-мозговыми травмами умерла, независимо от того, как их лечили, но на каждую сотню людей, которых лечили стероидами, пришлось на две с половиной смерти больше. Отсрочка в выявлении этого факта вела к ненужной и предотвращаемой смерти очень большого количества людей, и у авторов исследования есть очень четкое представление о том, кто должен нести ответственность за это: «Смертельные исходы, показанные нами, можно было предотвратить десятилетия назад, если бы общество, озабоченное этикой исследования, взяло на себя ответственность в обеспечении четкого доказательства того, что его предписания принесут больше пользы, чем вреда».
Но этим вредительство не ограничилось. Многие исследовательские центры настаивали на отсрочке испытаний, чтобы получить письменное согласие родственников пациента, находящегося без сознания. Это письменное разрешение не было бы необходимым при лечении стероидами, если бы терапия была назначена врачом, приверженцем этого метода; точно так же вам не потребовалось бы письменное разрешение не использовать стероиды, если бы лечение проводил врач, противник этого метода. Этот вопрос встал только потому, что пациенты для получения того или иного лечения распределялись методом случайной выборки, а комитеты по этике решили создать гораздо больше препон, даже несмотря на то, что пациентам предписывалось именно то, что они получили бы в любом случае. В медицинских центрах, где местные управленцы настаивали на согласии семьи на случайный выбор, задержка лечения стероидами в среднем была на 1,2 часа. С моей точки зрения, необходимость в такой задержке отсутствовала: но в конкретно данном случае она не принесла вреда, поскольку стероиды не спасают жизнь (фактически, как мы сейчас это знаем, они убивают людей).
В других исследованиях такая отсрочка будет стоить жизни. Например, испытание ТРАВМА-2 было последующим мероприятием исследования, проводимого в отделениях реанимации и интенсивной терапии той же самой командой. В исследовании изучали вероятность снижения смертности травмированных пациентов с сильным кровотечением при приеме лекарства под называнием транексамовая кислота, которое улучшает свертываемость крови. Поскольку кровотечение у этих пациентов смертельно опасно, существует определенная срочность в их лечении. Конечно, всем пациентам была оказана стандартная помощь; единственным дополнением в рамках испытания было случайно выбранное предписание, принимать или не принимать транексамовую кислоту помимо стандартного лечения.
Испытание показало, что транексамовая кислота чрезвычайно полезна и спасает жизни. И вновь на некоторых площадках произошли задержки, пока пытались связаться с родственниками и получить у них разрешение на рандомизацию. Часовая задержка при приеме транексамовой кислоты снижает эффективность помощи с 63 % до 49 %, поэтому пациентам, участвующим в испытании, был нанесен непосредственный вред из-за необходимости получения разрешения на случайный выбор из двух методов, тогда как, в любом случае, никто не знал, какой из них лучше. И пациенты по всей Великобритании обязательно получат один из двух вариантов лечения, почти полностью основанного на произвольном выборе.
И снова это нечто, что я бы назвал несоответствующим, и «несоответствующее» — самое подходящее слово. Жизненно важно защищать права пациентов, чтобы они не подвергались опасному лечению во имя исследования. Там, где в испытаниях изучается воздействие новых экспериментальных лекарств, усиленный контроль со стороны регулирующих органов будет абсолютно правильным, и очень ценной будет информация, ясно и в обязательном порядке переданная пациенту: я бы даже не мечтал предложить что-нибудь другое. Но когда кто-либо включен в испытание, в котором сравниваются два актуальных на сегодняшний день метода лечения, и оба они считаются в равной степени безопасными и эффективными, где рандомизация не добавляет дополнительного риска, ситуация крайне отличается.
Именно таковой является ситуация для сравнительного исследования двух статинов в клиниках врачей общей практики в Великобритании: в заведенном порядке пациентам дают аторвастатин или симвастатин. Ни один живущий ныне врач не знает, что лучше, поскольку нет данных сравнения этих двух лекарств по реальным результатам, таким как сердечный приступ и смерть. Когда врачи без каких-либо оснований делают произвольный «выбор», какое из лекарств прописать, никто не заинтересован в том, чтобы это урегулировать. Итак, не существует специального процесса и нет формы, которую нужно будет заполнить при объяснении того, что выбор безоснователен. Мне кажется, что такой доктор, беззаботно прописывающий те или иные препараты, не предпринимающий никакой попытки понять, какое лечение самое лучшее, совершает своего рода этическое преступление по той простой причине, что сохраняет наше невежество. Такой доктор подвергает большое количество будущих пациентов во всем мире риску, которого можно избежать, и обманывает своих нынешних пациентов в том, что касается знания преимуществ и побочных эффектов лечения, которое он назначает. Но подобная деятельность врачей не контролируется специальной комиссией по этике.
В то же время, когда пациенту случайным выбором назначают тот или иной статин в нашем испытании, внезапно это становится большой этической проблемой: пациент должен в течение двадцати минут заполнять страницы формуляров, подтверждая, что он понимает все риски лечения, которое ему прописано, и что он согласен принимать участие в испытании. Пациентам приходится это делать, даже несмотря на то, что никаких дополнительных рисков в ходе испытания не появляется, даже несмотря на то, что им в любом случае прописали бы тот или иной статин; даже несмотря на то, что испытание не требует никакого дополнительного времени; и даже несмотря на то, что медицинские карточки уже имеются в исследовательской базе данных врачей общей практики, и, таким образом, они отслеживаются для эмпирических исследований независимо от участия в испытании. Эти два статина уже используются миллионами людей во всем мире, и они показали себя как безопасные и эффективные: единственным вопросом испытания является то, какой лучше. Если между ними существует фактическая разница, огромное количество людей умирает без надобности, в то время как мы об этом не знаем.
Двадцатиминутная задержка, вызванная необходимостью подписания формы о согласии на участие в исследовании, представляет интересную проблему, поскольку не является простым неудобством. Прежде всего, в ней могут даже не затрагиваться проблемы этики, о которых беспокоятся сотрудники комитетов: эти комитеты и эксперты любят всем говорить, что их ограничения являются необходимостью, но они были не в состоянии совместно провести исследование, демонстрирующее ценность вмешательств, которые они навязывают исследователям, и, в некоторых случаях, мы предполагаем, что их вмешательство может привести к противоположному эффекту. Кроме того, проведенное исследование показывает, что пациенты помнят больше информации, в целом, из кратких форм о согласии на участие в эксперименте, чем из тех, на заполнение которых было потрачено двадцать минут.
Но более того, двадцатиминутный процесс получения согласия на прием лекарства, которое вам в любом случае пропишут, ставит под угрозу всю цель исследования, которой является попытка рандомизировать пациентов как можно незаметнее и ненавязчивее в рамках рутинного медицинского ухода. Это даже не просто замедляет и удорожает простые прагматические испытания; это делает их менее репрезентативными в стандартной практике. Когда вы вводите двадцатиминутный процесс получения согласия на прием статина, который пациент будет принимать в любом случае, отобранные для эксперимента врачи и пациенты перестают быть обычными, они становятся нерепрезентативными.
Это не проблема для прагматического исследования статинов, которое я описал, потому что целью испытания на самом деле не является выявление того, какой статин лучше. В реальности, это испытание касается процесса, и его целью является нахождение ответа на гораздо более фундаментальный и важный вопрос: можем ли мы в повседневной практике отобрать пациентов дешево и незаметно? Если не можем, нам нужно выяснить почему и задать вопросы о том, являются ли барьеры соизмеримыми и можно ли их безопасно преодолеть. Специалисты по этике спорят, что двадцатиминутный процесс получения согласия является настолько ценным, что нам лучше оставить пациентов умирать, чем продолжать практиковать в невежестве. Я не говорю, что не согласен с этим; я говорю о том, что считаю, что люди заслуживают того, чтобы высказаться о своем согласии в открытых дебатах.
Но более того, меня беспокоит скрытая выдумка о стандартной медицинской практике, выражаемая этими правилами, и это никогда не ставилось под сомнение должным образом. Вероятно, если всех докторов вынудить признать неопределенность в рутинном обслуживании пациентов, это могло бы сделать нас немного скромнее и более нацеленными на улучшение оснований, необходимых для принятия решений. Вероятно, если бы мы честно говорили пациентам: «Я не знаю, какой из методов лечения лучше», какого бы случая это ни касалось, пациенты бы начали задавать вопросы сами. «Почему нет?» — мог быть первый вопрос и «Почему бы вам не выяснить?» — могло последовать вскоре.
Некоторые пациенты предпочтут избежать рандомизации, благодаря иллюзии определенности и выдумке о том, что их врачи в состоянии принять взвешенное решение, какой из статинов или иных препаратов лучше всего им подходит. Но я думаю, что мы должны быть в состоянии всем предложить рандомизацию, везде, где есть истинные сомнения насчет того, какое из двух широко применяемых лекарственных средств, уже зарекомендовавших себя как безопасные и эффективные, лучше. Я думаю, это лучше делать на основании сокращенной формы согласия, содержащей не более ста слов, с опцией доступа к более подробному пояснительному материалу для всех, кто этого захочет. И я думаю, комитеты по этике следует попросить предоставить доказательство тому, что вред, который они причиняют пациентом во всем мире, навязывая негибкие правила, такие как двадцатиминутный процесс получения согласия, пропорционален любой выгоде, которую они обещают.
Более того, я думаю, нам всем, как возможным пациентам, необходимо пересмотреть наши взгляды на участие в клинических исследованиях. Только благодаря исследованиям мы знаем, что работает, а что нет, и все мы приобретаем от участия пациентов в прошлых испытаниях, до нас; но, кажется, многие об этом забыли. Помня об этом, мы можем заключить социальный контракт, на основании которого все будут ожидать проведения постоянных испытаний, простых тестов A/B, где препараты сравниваются друг с другом, чтобы выявить, какой из них лучше или даже дешевле, если они оба одинаково эффективны. Доктор, не принимающий участия в этих испытаниях, может расцениваться как чудак, наносящий вред будущим пациентам. Для всех пациентов будет очевидно то, что участие в этих испытаниях является стандартным отражением потребности получить больше данных, чтобы улучшить медицинское лечение для себя в будущем и для других членов сообщества той же медицинской системы.
Почти во всех развитых странах мира медицинские услуги предоставляются бесплатно в медицинских пунктах (оплачиваются обществом через налогообложение). С точки зрения общества в целом, весь процесс можно рассматривать как простую сделку: мы даем вам лекарства бесплатно в определенных пунктах; взамен вы даете нам возможность выяснить, что лучше работает для вас и для других. Система здравоохранения могла бы постоянно проводить тестирование и обучение и улучшать свои показатели, получив знания о том, что работает.
Интересно, что вокруг первого действительно современного рандомизированного исследования было много движения. В 1946 году, когда только что был открыт стрептомицин, в Великобритании было произведено 50 кг этого антибиотика. Надеялись, что стрептомицином можно будет лечить туберкулез, но он был невероятно дорогим, и нужно было выяснить, как он работает на самом деле. В отношении пациентов с туберкулезным менингитом проблем не было: они практически всегда и в короткий срок умирали, поэтому, если любой из таких пациентов выживал после приема стрептомицина, становилось понятно, что это лекарство, вероятно, эффективное. Для пациентов с туберкулезом легких история была более запутанной: через какое-то время у некоторых пациентов отмечалась ремиссия, часто без приема каких-либо медикаментов, поэтому было сложнее судить об эффективности лекарства.
В США это лекарство имелось в свободной продаже за огромные деньги. Если вы хотели его попробовать, вы просто покупали немного, принимали и надеялись на лучшее. Но Медицинский исследовательский совет Великобритании был единственным распорядителем 50 кг стрептомицина, и там решили использовать это дорогое новое лекарство эффективно, в рандомизированных исследованиях, чтобы выяснить, насколько оно влияло на выживаемость (и вызывало ли оно какие-либо непредсказуемые побочные эффекты).
Доктора не были этим довольны, но в послевоенное время, когда нормирование было по-прежнему актуальным, идея централизованного контроля ради чего-то великого не была такой уж необычной. Первый надлежащий современный рандомизированный тест прошел, и во всем мире было выработано понимание эффективности стрептомицина во многом благодаря тому, что к этому приложил руки Медицинский исследовательский совет.
Если эта история отдает сталинщиной, приношу свои извинения, но вы могли меня не так понять. Я не предлагаю каждого пациента заставлять участвовать в испытаниях во всех случаях возникновения неуверенности в том, какое лечение является лучшим, используя то, что государство должно рационализировать поставки: я просто предлагаю ввести испытания в повседневную практику в клинике, сделать их нормой. Если люди хотят уклониться и принимать лекарства с неизвестной эффективностью, не получая никаких новых знаний, тогда, конечно, я принимаю их желание быть асоциальными или отказаться от личной выгоды.
Но эта потребность с каждым днем становится все необходимее. Здравоохранение является критически дорогим, испытания — лучший инструмент для принятия решений по лечению, и их можно проводить по самым важным вопросам медицины, при этом очень дешево и не причиняя никакого вреда участникам. Иррациональное прописывание лекарств стоит жизней и денег; в то время как стоимость исследования для предотвращения иррационального прописывания лекарств, в сравнении с этим, может быть очень низкой, а большое количество простых рутинных испытаний позволит выявить неудачные основания, которые засорили медицинскую практику, всего через несколько лет. Наша попытка, нацеленная на проведение испытаний почти бесплатно в повседневно заполняемых медицинских картах, является всего одним примером того, как это можно сделать.
Вместо этого мы имеем периодические маломасштабные испытания нерепрезентативных групп населения, проходящие с конструктивными недостатками, с бесконечными ошибками в информации, переданной пациентами. Исследования проводятся хаотично, ради коммерческих выгод. Некачественные результаты, полученные в этих исследованиях, вредят пациентам во всем мире. И если бы мы захотели, то могли бы это исправить.
Глава 6
Маркетинг
На настоящий момент мы установили, что факты, собранные для того, чтобы направлять выбор в медицине, страдают от огромного количества системных ошибок и проблем. Но это только часть истории: затем эти недолжным образом собранные факты распространяются и внедряются посредством хаотичных и необъективных систем, что способствует появлению дополнительного пласта преувеличений и погрешностей.
Чтобы понять, что здесь происходит, нам нужно задать простой вопрос: каким образом врачи решают, что прописать? Это удивительно сложный вопрос, и чтобы продраться сквозь эти дебри, нам нужно подумать о четырех основных игроках, нагнетающих давление: пациент; спонсор (что в Великобритании означает систему здравоохранения); врач и компания-производитель лекарств.
Для пациентов все просто: вы хотите, чтобы врач вам прописал самое лучшее средство от вашего недуга. Или скорее, вы хотите лечение, которое показало себя лучше всего в целом в честном тестировании, которое оказалось лучше других. Вероятно, вы доверяете своему врачу принятие решения и надеетесь, что существуют системы на местах, гарантирующие правильность выбора, поскольку если вы будете участвовать в принятии каждого решения, у вас на это уйдет уйма времени.
Не то чтобы пациенты оставались вне игры в силу традиции. На самом деле, пациенты редко принимают решение o том, какое лечение было бы лучше всего исключительно для них самих, читая литературу первичных исследований и отмечая сильные и слабые стороны испытания исключительно для себя. Мне это не нравится, и мне бы хотелось, чтобы эта книга научила вас всему, что вы должны знать. Но реальность такова, что принятие решений в сфере медицины требует большого количества специальных знаний и умений. Для получения необходимого уровня подготовки требуется время и практика, и существует риск того, что люди сделают очень плохой выбор, если не подготовятся.
При этом врачи и пациенты действительно все время принимают решение вместе, когда медицина предстает перед нами во всей красе, в дискуссиях, где врач действует как своего рода личный консультант по покупкам, выявляя, в каком результате пациент заинтересован больше всего, и ясно передавая самые лучшие из имеющихся фактов, чтобы решение было взвешенным. Некоторые пациенты хотят продлить жизнь любой ценой, например, тогда как другие могут быть недовольны тем, что приходится принимать таблетку дважды в день, и они предпочитают рискнуть получением плохих долгосрочных результатов. Позже мы это обсудим, но в настоящий момент остановимся на факте того, что в большинстве случаев пациенты хотят получать самое лучшее лечение.
Нашими следующими игроками являются спонсоры (Национальная система здравоохранения или страховая компания), и для них ответ тоже довольно прост: они хотят того же самого, что и пациенты, если только это не стоит бешеных денег. Для тривиальных ситуаций они могли протоптать «дорожку», согласно которой врачи общей практики (чаще, чем больничные врачи) должны выписывать лекарство, но за пределами этих простых правил для простых ситуаций, они полагаются на суждения врача.
Сейчас мы подходим к ключевым игрокам в принятии решений по лечению: врачам. Им нужна качественная информация, и к ней нужно относится критично. Проблемой современного мира является не нехватка информации, пожалуй, а информационный перегруз, а еще более точно, как это называет Клэй Щёрки «фильтр не сработал». Не далее как в 1950-х, помните, медицину продвигали почти всегда анекдот и высокий пост; фактически, только в последние десятилетия мы вообще собираем качественную информацию, и при всех недостатках наших нынешних систем нас переполняет лавина сведений. Вдохновенное будущее, будущее медицины на основе информации — информационная архитектура, которая может донести нужную информацию нужному доктору в нужное время.
Происходит ли это? Ответ простой: нет. Несмотря на изобилие автоматизированных систем для распространения знания, большей частью мы продолжаем полагаться на системы, выработанные веками, подобные научным журналам, которые по-прежнему используются для публикации отчетов о результатах клинических исследований. Часто если вы спросите врачей, знают ли они о том, что одно конкретное лечение лучше при определенных медицинских условиях, они скажут вам, что, конечно, да, и назовут его. Но если вы спросите, откуда они это знают, ответ может вас испугать.
Врачи могут говорить: мы это проходили в медицинском университете; именно это использует врач из соседнего кабинета; именно это прописывал местный консультант в письмах пациентам, о которых мы говорим; мне сказал об этом фармацевт-консультант; я усвоил это на обучении два года назад; думаю, я об этом читал в какой-то статье; я помню это из руководства, которое когда-то просмотрел; именно это рекомендуют местные директивы по прописыванию лекарств; об этом говорится в испытании, о котором я читал; я это всегда использую и т. д.
В реальности врачи не могут прочесть все научные статьи, относящиеся к их работе, и это не просто мое мнение или даже стенания о кипе собственнолично прочитанного. Существуют десятки тысяч научных журналов и миллионы научных медицинских газет, и каждый день их выпускают всё больше и больше. В одном недавнем исследовании пытались оценить, сколько времени уйдет на освоение этой информации.1 Исследователи собирали все научные газеты, опубликованные за один месяц, что было релевантным общей практике. Если затратить всего по несколько минут на каждую, они оценили, что врачу потребуется 600 часов, чтобы бегло просмотреть их все.
Это около 29 часов в день, что, конечно, невозможно.
Итак, врачи не будут знать обо всех испытаниях, не будут думать о каждом варианте лечения, относящемся к их сфере, не будут щепетильно проверять каждый описанный методологический трюк. Они будут «срезать углы», и этими «срезанными углами» можно воспользоваться.
Чтобы увидеть, насколько плохо врачи справляются с назначением лечения, мы можем взглянуть на национальные образцы прописывания лекарств. Министерство здравоохранения тратит порядка 10 миллиардов фунтов в год на лекарства. Вы знаете на сегодняшний день, что многие лекарства на рынке являются соглашательскими, и они нисколько не лучше лекарств, которые дублируют, и зачастую брендовые соглашательские лекарства можно заменить равно эффективными лекарствами того же класса, которые достаточно давно на рынке, чтобы не быть более запатентованными.
В 2010 году команда ученых проанализировала 10 самых прописываемых классов лекарств и подсчитала, что, как минимум, 1 миллиард фунтов тратится каждый год впустую докторами, использующими брендированные соглашательские лекарства в ситуациях, где равным образом подошли бы эффективные непатентованные лекарства.2
Например: аторвастатин и симвастатин оба одинаково эффективны, тогда как мы сегодня знаем (мы продолжаем возвращаться к статинам, потому что очень много людей пользуются этими препаратами), что срок патента на симвастатин закончился шесть лет назад. Итак, вы можете предположить, что всем следует использовать симвастатин вместо аторвастатина, если нет очень веской причины на выбор неоправданно дорогого варианта препарата. Но даже в 2009 году было выписано три миллиона рецептов на аторвастатин, этот показатель не так уж снизился с шести миллионов в 2006 году: это стоило Министерству здравоохранения лишних 165 миллионов фунтов в год. И все эти рецепты на аторвастатин выписывались, несмотря на глобальную национальную программу, направленную на переключение докторов на другой вариант.
То же самое можно наблюдать везде. Лозартан — лекарство для снижения кровяного давления типа БРА: в этом классе существует много соглашательских лекарств, а благодаря тому, что высокое кровяное давление является распространенной проблемой, этот класс медикаментов занимает четвертое место по стоимости для Министерства здравоохранения. В 2010 году закончился патент на лозартан: клинически он почти неотличим от других лекарств БРА, поэтому вы бы могли предположить, что Министерство здравоохранения переведет всех на этот препарат, готовясь к большому падению цены. Но даже после того как произошло падение цены, только 0,3 миллиона из 1,6 миллиона людей, принимающих БРА, принимали лозартан, таким образом, Министерство здравоохранения потеряло 200 миллионов фунтов в год.
Если мы не можем справиться с рациональным прописыванием лекарств даже по таким невероятно распространенным препаратам, это является хорошим свидетельством того, что назначение лекарств — дело случайное, где понятная информация не полностью доносится до людей, принимающих решения, как с позиции эффективности, так и с позиции экономии. Я могу честно сказать, если бы я отвечал за бюджет по медицинским исследованиям, я бы на год отменил все первичные исследования и оставил только фондовые проекты, придумывая новые способы оптимизировать наши методы распространения информации, обеспечивая учет и применение фактов, которые мы уже получили. Но я здесь не распоряжаюсь, и существуют гораздо более влиятельные факторы в этом вопросе.
Сейчас давайте посмотрим на решение врача с позиций компании-производителя лекарств. Вы хотите, чтобы врач прописывал ваш продукт, и вы сделаете все возможное, чтобы это произошло. Вы можете подать это под соусом «повышение осведомленности о нашем продукте» или «помощь доктору в принятии решения», но в реальности это желание продать. Итак, вы будете рекламировать свое новое лекарство в медицинских журналах, указывая выгоды, но преуменьшая риски и уклоняясь от нелестных сравнений. Вы отправите продавцов-консультантов по этому лекарству лично встречаться с врачами и обсуждать достоинства вашего препарата. Они предложат подарки, обеды и наладят личные отношения, которые позже могут оказаться взаимовыгодными.
Но проблема лежит еще глубже. Врачам требуется непрерывное обучение: они занимаются практикой в течение десятилетий с момента выпуска из университета, и если смотреть с высоты сегодняшнего дня, медицина изменилась до неузнаваемости, скажем, с 1970-х, а это как раз то время, когда проходили обучение ныне практикующие доктора. Это образование дорогостоящее, и государство не имеет желания платить, поэтому фармацевтические компании проплачивают беседы, обучение, обучающие материалы, заседания конференций, отзывы раскрученных экспертов, которые предпочитают это лекарство. Все это процветает, несмотря на опубликованные научные факты о том, что фармацевтические компании тщательно взращивают посредством селективных публикаций лестные результаты и скрывают конструктивные дефекты, чтобы создать красивый портрет своего продукта. Но это не единственный инструмент, доступный компаниям для влияния на начинку журналов. Они платят профессиональным писателям, чтобы те писали в научные журналы, выдерживая их собственные коммерческие спецификации, а затем ищут ученых, которые под этим подписываются. Это действует как скрытая реклама и способствует появлению большего количества публикаций по данному лекарству. Там также восхваляют резюме благосклонно настроенных экспертов и помогают докторам, «дружащим» с компанией, получать славу и внешнюю независимость, за что нужно благодарить университетскую корреспонденцию.
Компания также может дать денег группе пациентов, если точка зрения и ценности в данной группе помогают продавать больше лекарств, тем самым предоставляя компании больше известности и прибыли. Сверх всего этого, компания может затем заплатить научным журналам за публикацию этих материалов, которые также получат доход от рекламы и «перепечатанных» заказов. И благодаря этим научным изданиям компания может вывести на передний план свидетельство того, что это лекарство работает, и даже расширить рынок сбыта данного препарата, выпустив работу, которая услужливо показывает, что затронутая проблема, фактически, гораздо более распространенная, чем люди полагают.
Все это выглядит весьма дорогостоящим, и действительно является дорогостоящим: фактически, индустрия фармацевтики, в целом, тратит в два раза больше на маркетинг и продвижение, чем на исследования и развитие. На первый взгляд это выглядит чем-то из ряда вон выходящим, и имеет смысл поразмышлять об этом с разных контекстов. Например, когда фармацевтическая компания отказывает развивающейся стране в доступном новом лекарстве от СПИДа, причина кроется — говорит компания — в том, что нужны деньги с продаж, чтобы спонсировать исследования и разработки новых лекарств против СПИДа на будущее. Если исследования и разработки являются крупицей издержек компании и она тратит в два раза больше на продвижение, этот аргумент не может быть убедительным.
Масштаб этих трат сам по себе изумителен, если поставить его в контекст того, что мы все ожидаем от медицины, основанной на фактах: назначение для своих пациентов лучших лекарств. Потому что если вы отойдете от тщательно воспитанной индустрией веры в то, что эта маркетинговая деятельность абсолютно нормальна, и перестанете думать о лекарствах как о товаре потребления, подобном одежде или косметике, вы внезапно осознаете, что маркетинг лекарств существует только по одной причине. В медицине индивидуальность бренда является иррелевантной, и существует фактический объективный ответ на вопрос, будет ли одно лекарство с наибольшей вероятностью облегчать боль и страдания пациента и продлевать ему жизнь. Следовательно, маркетинг существует только по одной причине: воздействовать на принятие решения, основанного на фактах.
Это очень мощный механизм, к примеру, в США на медицинский маркетинг ежегодно тратится 60 миллиардов долларов.3 И, что впечатляет больше всего, эти деньги берутся не из воздуха: спонсирование полностью происходит из кошелька народа или из выплат пациентов в медицинские страховые компании. Около четверти денег, полученных фармацевтическими компаниями за лекарства, которые они продают, вкладываются в рекламную деятельность, которая, как мы увидим, имеет доказуемое влияние врачей, выписывающих рецепты. Итак, мы покупаем продукцию с огромной переплатой, чтобы покрыть рекламный бюджет компаний, и затем деньги тратятся на искажение научных данных клинической практики, что, в свою очередь, беспричинно удорожает результат наших решений и делает его менее эффективным.
Все это ложится тяжелым грузом на систему доказательной медицины, которая уже смертельно ранена низкокачественными испытаниями, которые, в лучшем случае, в не лучшем виде передаются врачам. Это просто великолепно. А сейчас перейдем к деталям.
Именно врачи принимают финальное решение о выписываемом препарате, но в реальности решение о том, какое лечение выбрать — и озаботиться ли вообще лечением, — принимают врачи совместно со своими пациентами. Здесь положение вещей как раз такое, как вам бы хотелось; но это превращает пациентов в еще один рычаг, на который нужно давить индустрии, заинтересованной в увеличении продаж.
Мы увидим в данной главе, что фармацевтические компании применяют многочисленные и разнообразные технологии: изобретение абсолютно новых заболеваний и объяснительных моделей; проплачивание групп пациентов; ведение звездных пациентов, которые борются (при помощи профессиональных пиарщиков) с правительством, которое отказало им в дорогих лекарствах и т. д. Но мы начнем с рекламы, поскольку в Великобритании идет непрекращающаяся битва за ее введение, и в сравнении с более тайными стратегиями, она кажется, несомненно, прозрачной.
Прямая реклама лекарств запрещена почти во всех экономически развитых странах с 1940-х годов, по причине того, как она работает: реклама воздействует на врача, выписывающего рецепт, и приводит к ненужному росту цен. США и Новая Зеландия (наряду с Пакистаном и Южной Кореей) изменили свое мнение в начале 1980-х и разрешили возродить этот открытый маркетинг. Однако от этого реклама не стала чьей-то чужой головной болью. Идет постоянная борьба за повторное открытие новых территорий, и в эпоху Интернета эта реклама просачивается сквозь национальные границы; но более всего эта реклама разоблачает некую чистую правду об индустрии.
Давайте взглянем на этот загадочный мир. Когда реклама вновь стала легальной в США, она могла появляться только в печатном виде, поскольку было требование включать всю информацию о побочных эффектах с этикетки лекарства. С 1997 года правила стали не такими жесткими, и сейчас побочные эффекты можно сокращать (их произносят скороговоркой в конце телевизионной рекламы). После этого изменения ежегодный рекламный бюджет фармацевтической индустрии вырос с 200 миллионов долларов до 3 миллиардов всего за несколько лет. Примечательны отдельные траты по препарату «Виокс» (161 миллион долларов), который был снят с рынка по причине серьезной озабоченности скрытой информацией, и препарату целебрекс (78 миллионов долларов), также позже снятому с рынка по причине причинения вреда пациентам.
При попытке оценки влияния этой рекламы на реальный мир были использованы разные подходы.4 В одном исследовании наблюдали за пациентами в Канаде, где прямая реклама лекарств по-прежнему запрещена, и в США. Выяснилось, что в США пациенты охотнее верили в то, что им нужен препарат, чаще спрашивали о специфическом лекарстве, рекламируемом по телевидению, и охотнее принимали рецепт на такое лекарство. Иными словами, реклама работала. Врачи в США, тем временем, чаще выражали свою озабоченность тем, были ли лекарства, запрашиваемые пациентами, подходящими.
В другом исследовании был применен более экспериментальный подход. Обученные актеры, представляющиеся депрессивными пациентами, направлялись на прием к врачам в трех американских городах (300 приемов всего).5 Все они рассказывали одну и ту же историю о плохом настроении, а затем в конце консультации им было предписано случайным выбором сыграть одну из трех ролей: попросить специфическое лекарство, проговорив его название; попросить «лекарство, которое могло бы помочь»; или ничего не просить. Те, кто делал то, на что толкает пациентов реклама, — просили специфическое лекарство, — имели в два раза больше шансов на получение рецепта на таблетку-антидепрессант. Думаете ли вы, что нечто хорошее может частично зависеть от того, будете ли вы считать эти лекарства стоящими (общие факты показывают, что они довольно неэффективны при мягкой и средней депрессии). Но каким бы ни было ваше мнение об антидепрессантах, факты очень четко показывают, что сказанное пациентами и их просьбы к врачу имеют значительное влияние на то, что прописывается. Вовлеченные и информированные пациенты — это то, что хотят видеть большинство врачей, но здесь возникает вопрос, действительно ли информация, полученная пациентами, истинно полезна и могут ли врачи противостоять нецелесообразным просьбам выписать таблетки.
Итак, в рамках того же исследования актеров-пациентов отправили к врачам, но в этот раз они рассказывали ясную историю о «нарушении адаптации», этот термин некоторые используют, чтобы описать простое явление плохого самочувствия в результате событий, происходящих в жизни. Это естественно, хоть и неприятно, и это знает любой нормальный человек, способный чувствовать, и таблетки в качестве лечения не являются хорошей идеей. Но пациенты с «нарушением адаптации», требующие таблетку с определенным названием, по-прежнему получали ее в 50 % случаев, в сравнении с 10 % случаев, относящихся к тем, кто не просил никаких лекарств. Это темная сторона рекламы, и, как врач, я всегда удивлялся людям, которые говорили, что врачи навязывают таблетки пациентам. В целом, врачи — милые люди, и они стремятся угождать. Они должны дать людям то, что те хотят, и многие пациенты убеждены, к каким бы социальным процессам, происходящим в их мире, это ни относилось, что таблетками можно все исправить. Я перефразирую для последующего в этой главе: многие люди были убеждены в том, что они пациенты.