Паутинка
Паутинка
Чтобы добиться улучшения в лечении рака, надо разрабатывать методы ранней диагностики.
Джон Локхарт-Маммери, 1926 г.
Для решения проблемы рака нам больше всего нужен — помимо универсального лекарства — метод обнаружения рака до проявления каких-либо клинических признаков и симптомов.
Сидней Фарбер в письме к Этте Розенсон, ноябрь 1962 г.
Дамы, а вы уже?
«Нью-Йорк Амстердам ньюс» о мазке Папаниколау, 1957 г.
Долгое и медленное шествие канцерогенеза — методичное, шаг за шагом продвижение ранних стадий до откровенной злокачественности — вдохновило ученых на еще одну стратегию предотвращения рака. Если рак и правда подкрадывается к жертве так неспешно, как предполагал Ауэрбах, то, возможно, есть время вмешаться и остановить это шествие на самых ранних этапах — атакуя не сам рак, а предраковое состояние. Можно ли победить канцерогенез на полдороге?
Немногие исследователи изучали эти ранние переходные стадии развития раковых клеток столь интенсивно, как цитолог Георгиос Папаниколау, грек по происхождению, работавший в Корнеллском университете в Нью-Йорке. Крепкий, невысокий, суховатый и чуточку старомодный, Папаниколау изучал медицину и зоологию в Афинах и Мюнхене, а в Нью-Йорк приехал в 1913 году. Едва с корабля, без гроша в кармане, он искал работу в медицинской лаборатории, но, чтобы не умереть с голоду, устроился продавцом в универмаг «Гимбельс» на Тридцать третьей улице. Ковры продавать он так и не научился и через три месяца непомерных трудов нашел место исследователя в Корнелле — что кажется еще большей фантастикой. Папаниколау подрядился исследовать менструальный цикл морских свинок — животных, у которых не заметно никакого кровотечения, равно как и каких бы то ни было выделений во время менструаций. Вооружившись риноскопом и ватными палочками, Папаниколау научился брать у морских свинок образцы клеток из шейки матки и размазывать их по предметным стеклам тоненьким слоем.
Он обнаружил, что эти клетки подобны миниатюрным часовым стрелкам. По мере того как у животных циклически повышался и понижался уровень гормонов, клетки шейки матки так же циклически меняли форму и размеры. Руководствуясь их морфологией, Папаниколау научился предсказывать наступление той или иной фазы менструального цикла — зачастую с точностью до дня.
К концу 1920-х годов Папаниколау перенес наработанную технику и на людей. (Рассказывают, будто бы его жена Мария, являя собой немыслимый пример супружеской стойкости и силы духа, позволяла брать у нее мазки каждый день.) В результате он обнаружил, что клетки, выделяемые шейкой матки у женщин, так же как и клетки морских свинок, позволяют определить стадию менструального цикла.
Как справедливо указывали Папаниколау, все это ровным счетом ничего не значило — очередное сложное, но в общем-то бесполезное изобретение. Как ядовито заметил один гинеколог, для расчета сроков и стадий менструального цикла «у приматов, включая женщин» вполне можно обойтись без диагностического мазка. Многие сотни лет женщины рассчитывали свои циклы и без помощи Папаниколау.
Обескураженный критикой исследователь вернулся к своим стеклам. Он провел почти десять лет, одержимо всматриваясь в мазки здоровых женщин. Вероятно, рассудил он, истинные достоинства теста кроются в мазках не нормальных, а патологических состояний. Что, если с их помощью возможно диагностировать патологию? Что, если годы изучения нормальных клеток были лишь прелюдией к выявлению клеточных аномалий?
Папаниколау вступил в мир патологических состояний. Он собирал мазки женщин со всевозможными видами гинекологических заболеваний — миомами, кистами, бородавками, воспалениями матки и шейки матки, стрептококковыми, гонококковыми и стафилококковыми инфекциями, внематочными беременностями, аномальными беременностями, доброкачественными и злокачественными опухолями, абсцессами и фурункулами, — надеясь найти в отшелушивающихся клетках признаки патологического состояния.
Как выяснилось, более всего аномальных клеток отшелушивалось при раке. Почти в каждом случае рака шейки матки Папаниколау находил в клетках мазка «странные и аномальные формы» с такими же диковинными, раздувшимися ядрами, сморщенными мембранами и сжавшейся цитоплазмой. Эти клетки не имели ничего общего с нормальными клетками здоровой женщины. «Становится совершенно очевидно», писал Папаниколау, что обнаружен новый тест на злокачественные клетки.
Опьяненный результатами, в 1928 году Папаниколау опубликовал статью о своем методе под названием «Новая диагностика рака». Доклад, впервые представленный на весьма странной конференции по евгенике, рассматривавшей «улучшение расы», снискал очередную волну презрения от маститых патологов. «Мазок Папаниколау», как Георгиос назвал свою методику, не отличался ни особой точностью, ни даже особой чувствительностью. Для диагностирования рака шейки матки, говорили коллеги, лучше провести биопсию — способ неудобный и инвазивный, но гораздо точнее и определеннее мазка. На научных конференциях эксперты пренебрежительно фыркали, заслышав о столь примитивной альтернативе настоящей биопсии. Самому Папаниколау было нечего возразить. «Кажется, работу надо продолжить», — самокритично заметил он в конце статьи. Совершенствуя и оттачивая два абсолютно бесполезных метода, на следующие двадцать лет Папаниколау исчез из поля зрения научного мира.
С 1928 года Папаниколау с почти монашеской одержимостью ограничивался исключительно мазками. Его мир сжался до череды рутин: ежедневные полчаса на дорогу в лабораторию, куда его привозила и отвозила жена, выходные в доме на Лонг-Айленде с микроскопом в кабинете и микроскопом на крыльце, вечера за печатанием отчетов по изученным образцам под льющуюся из фонографа музыку Шуберта и стакан апельсинового сока. Гинеколог-патолог по имени Герберт Траут помогал Папаниколау интерпретировать результаты. Японский художник-анималист Хашими Мураяма, коллега Папаниколау по первым годам в Корнелле, нанялся к ним рисовать акварели мазков при помощи камеры-люцида.
Для самого Папаниколау этот сумрачный и созерцательный период жизни стал чем-то вроде личной камеры-люцида, увеличивающей и отражающей его старые экспериментальные темы и перерождающей их в новые. Его начали одолевать все те же мысли, что не давали покоя десять лет назад: если нормальные клетки шейки матки претерпевают морфологические изменения постепенно, то, наверное, раковые клетки тоже морфологически изменяются с течением времени — маленькими постепенными шажками, в танце, уводящем их от нормальности к злокачественности? Подобно Ауэрбаху (работа которого была еще не опубликована), Папаниколау задался вопросом: можно ли различить промежуточные стадии рака — нарушения, еще только лишь крадущиеся к полному перерождению?
На рождественской вечеринке 1950 года, поддавшись на провокации слегка подвыпившего молодого гинеколога из его же лаборатории, Папаниколау высказал вслух поток мыслей, беспрестанно крутившихся у него в голове свыше десяти лет. Эти мысли буквально рвались из него. Подлинная цель мазка Папаниколау, по новому его замыслу, состояла не в том, чтобы найти рак, а в том, чтобы выявить его предков, предшественников — предвестников рака.
«Это было откровение, — вспоминал один из его студентов. — Мазок Папаниколау давал женщине шанс получить профилактическое лечение и во много раз уменьшить риск, что у нее когда-нибудь разовьется рак». Рак шейки матки, как правило, возникает в наружных слоях и разрастается поверхностными шелушащимися пластами, прежде чем зарыться внутрь, в окружающие ткани. Беря пробы у женщин, у которых еще не проявляются симптомы поздних стадий рака, Папаниколау рассуждал, что его тест, пусть и несовершенный, способен распознать заболевание на начальных этапах. По сути, он отводил стрелки диагностических часов назад — от неисцелимого инвазивного рака до излечимой, еще неинвазивной злокачественности.
В 1952 году Папаниколау убедил Национальный институт онкологии начать самое масштабное клиническое испытание по вторичной профилактике во всей истории онкологии. Испытывать предстояло его методику мазков. В графстве Шелби, штат Теннесси, этот анализ сделали ста пятидесяти тысячам взрослых женщин, живущих на территории в восемьсот квадратных миль, а потом отслеживали дальнейшую судьбу участниц на протяжении нескольких лет. Мазки поступали из сотен различных мест: из крохотных врачебных кабинетов, рассеянных меж коневодческих ферм Джермантауна, и из крупных клиник Мемфиса. Временные «клиники мазков Папаниколау» развернулись на фабриках и в офисных зданиях. Собранные мазки передавались в огромное отделение микроскопии при Университете Теннесси, на стенах которого висели фотографии образцовых нормальных и аномальных препаратов. Лаборанты днем и ночью изучали стекла, сверяясь с этими фотографиями. В разгар эксперимента ежедневно анализировалось до тысячи мазков.
Как и ожидалось, команда специалистов из Шелби обнаружила в популяции изрядное количество раковых изменений. В изначальной группе из ста пятидесяти тысяч женщин инвазивный рак шейки матки был обнаружен у пятисот пятидесяти пяти человек. Однако реальное доказательство принципов Папаниколау заключалось в другом открытии: к всеобщему изумлению, у пятисот пятидесяти семи участниц обнаружили преинвазивный рак или даже просто предраковые изменения — ранние стадии местного характера, легко поддающиеся лечению при помощи относительно несложной хирургической операции. Почти у всех этих женщин еще не проявлялось никаких симптомов — если бы им не провели теста, они бы и не заподозрили у себя никаких патологий. Что примечательно, средний возраст женщин с преинвазивными стадиями был на двадцать лет меньше, чем средний возраст женщин с инвазивным раком, — что, в свою очередь, снова соответствовало теории о длительном процессе канцерогенеза. Мазок Папаниколау переводил стрелки часов диагностики рака на двадцать лет, чем изменял спектр наблюдаемых патологий с преимущественно неизлечимых случаев на преимущественно излечимые.
В нескольких милях от лаборатории Папаниколау в Нью-Йорке центральный принцип диагностического мазка был перенесен на совершенно другую форму рака. Эпидемиологи рассматривают профилактику болезни в двух разных категориях. При первичной профилактике болезнь предотвращается устранением ее причины — прекращение курения в случае рака легких, вакцинация от гепатита В в случае рака печени. При вторичной профилактике, называемой также «скринирование», заболевание стараются предотвратить, выявив на ранних, бессимптомных стадиях. Мазок Папаниколау как раз и был изобретен в качестве средства вторичной профилактики рака шейки матки. Но если при помощи микроскопа можно обнаружить ранние стадии болезни в соскобах с ткани шейки матки, то, вероятно, другие способы «видеть» рак помогут обнаружить первые изменения в каком-нибудь другом подверженном раку органе?
В 1913 году берлинский хирург по имени Альберт Саломон и в самом деле попытался проделать нечто подобное. Упрямый и ревностный сторонник мастэктомии, Саломон брал удаленную грудь после операции и делал с нее рентгеновский снимок, стремясь обнаружить неясные очертания рака. В его коллекции набралось почти три тысячи снимков. При изучении их Саломон обнаруживал признаки болезни — микроскопические гранулы кальция, откладывающегося в раковой ткани («крупинки соли» — как потом стали называть их радиологи), или похожие на крошечных рачков скопления злокачественных клеток, напоминающих, откуда пошло само название «рак».
Следующим естественным шагом стал бы рентген груди перед операцией — как метод скрининга. Однако труды Саломона были безжалостно прерваны. Изгнанный нацистами из университета, спасаясь от концентрационных лагерей, Саломон бежал в Амстердам, где вместе со своими рентгеновскими снимками скрылся в подполье. Маммография, как назвал он свою методику, канула в забвение, но никто даже не заметил: в мире, одержимом идеями радикальной хирургии, где любые уплотнения в груди — и самые крошечные, и самые большие — лечились одними и теми же глобальными операциями, выявление микроскопических признаков болезни не имело никакого смысла.
Почти двадцать лет маммография маячила где-то на самой периферии медицины — во Франции, Англии, Уругвае, — в странах, где радикальная хирургия не настолько овладела умами врачей. Однако к середине 1960-х годов, когда теория Холстеда пошатнулась на пьедестале, маммография, продвигаемая пионерами рентгенологии, в том числе и Робертом Иганом из Хьюстона, добралась наконец и до американских больниц. Подобно Папаниколау, Иган считал себя не ученым, а способным умельцем — точнее, талантливым фотографом, делающим снимки раковых опухолей при помощи рентгеновских лучей, самой всепроникающей разновидности света. Он без конца возился с пленками, углами, позициями и выдержками, пока, по словам одного наблюдателя, не добился возможности выявлять на снимках «трабекулу, не толще паутинки».
Но можно ли обнаружить рак среди этих тенистых паутинок — причем обнаружить рано, чтобы предотвратить его дальнейшее распространение? Маммограммы Игана выявляли опухоли размером всего в несколько миллиметров, не больше ячменного зернышка. Однако вопрос заключался в том, спасет ли жизни проведение массового скрининга женщин для выявления и хирургического удаления микроскопических опухолей.
Скрининговые испытания в онкологии — дело непростое. Пожалуй, из всех клинических испытаний они наиболее трудны в проведении и наиболее подвержены ошибкам. Чтобы понять, почему это так, представьте себе весь долгий путь от лаборатории до клиник, в которых проводятся диагностические тесты. Предположим, в лаборатории изобретен новый тест на выявление ранней и бессимптомной формы какой-либо конкретной разновидности рака — к примеру, по уровню белка, выделяемого раковой клеткой. Первая трудность, встающая перед подобным тестом, носит технический характер: как осуществить его в реальном мире? По наблюдениям эпидемиологов, скрининговые испытания чреваты двумя типичными разновидностями ошибок. Первая — гипердиагностика, когда индивидуальные тесты дают положительный результат, однако на самом деле никакого рака нет. Такие случаи называются ложно-положительными. Люди, диагноз которым был выставлен на основании такого вот ложно-положительного анализа, оказываются в тисках унизительного приговора, в замкнутом круге тревоги, страха и жажды «сделать хоть что-нибудь», вынуждающем их опрометью бросаться за новыми анализами и агрессивным медицинским вмешательством.
Зеркальным отражением гипердиагностики является недостаточная диагностика — ошибка метода, при которой реально существующий рак тестом не выявляется. Недостаточная диагностика ободряет пациента — внушает ему ложную уверенность, что он совершенно здоров. Таким пациентам (ложно-отрицательным на жаргоне эпидемиологов) уготованы иные круги ада: отчаяние, шок, чувство, будто их предали, — когда болезнь, вовремя не выявленная при скринировании, рано или поздно даст о себе знать недвусмысленными симптомами.
Беда в том, что эти две крайности — гипердиагностика и недостаточная диагностика — идут рука об руку. Скрининговые испытания, поставившие себе целью избавиться от гипердиагностики путем ужесточения критериев, согласно которым пациент считается больным, часто расплачиваются за это недостаточной диагностикой, теряя пациентов, находящихся в серой зоне между положительным и отрицательным результатом. Такое положение легко понять на образном примере. Представим себе, воспользовавшись сравнением Игана, что паук задался целью сплести идеальную сеть для ловли мух. Увеличивая плотность сети, он тем самым увеличивает шансы выловить мух (подлинно положительный результат), но заодно еще и увеличивает шанс, что в сеть попадутся витающие в воздухе пылинки и соринки (ложно-положительный результат). Если же сделать сеть посвободнее, то шансов поймать настоящую добычу станет меньше, зато увеличится вероятность того, что все пойманное окажется мухами. В случае рака и за гипердиагностику, и за недостаточную диагностику приходится расплачиваться втридорога, а отыскать золотую середину нелегко. Да, любой тест на рак должен быть идеально точен и специфичен, но скрининговые технологии несовершенны. Поэтому скрининговые тесты чаще всего проваливаются не в силах преодолеть даже самого первого препятствия — уровень гипердиагностики или недостаточной диагностики в них слишком велик.
Однако предположим, наш новый тест сумел протиснуться сквозь это игольное ушко. Уровень гипердиагностики и недостаточной диагностики сочтен приемлемым, и мы начинаем проводить тестирование на группе пылающих энтузиазмом добровольцев. Более того, предположим, что как только тест становится общественным достоянием, врачи немедленно начинают обнаруживать ранние доброкачественные стадии болезни — в отличие от агрессивных быстрорастущих опухолей, которые только и удавалось выявлять до массового тестирования. Можно ли считать, что тест успешен?
Нет! Обнаружения маленьких опухолей самого по себе еще недостаточно. Рак демонстрирует широкий спектр самых разнообразных вариантов протекания. Некоторые опухоли по своей природе доброкачественны и генетически запрограммированы так, чтобы никогда не достигать окончательно злокачественного состояния. Другие же опухоли крайне агрессивны, и даже раннее вмешательство задолго до проявления симптоматики все равно никак не изменит участи пациента. Чтобы определиться с природными закономерностями того или иного типа рака, скрининговое испытание должно идти дальше. Оно должно повышать выживаемость пациентов.
Представьте теперь, что мы спланировали испытание с целью определить, увеличивает ли скрининговый тест выживаемость. Предположим, принять участие в тестировании предлагают двум идентичным близнецам, живущим рядом друг с другом, — назовем их Хоуп и Пруденс. Хоуп решает принять участие в испытаниях. Пруденс, опасаясь гипердиагностики или недостаточной диагностики, отказывается.
Ни та, ни другая не подозревают, что у них обеих развивается один и тот же тип рака, причем одновременно — с 1990 года. Опухоль Хоуп выявлена на скринировании в 1995 году, ей проводят хирургическое лечение и последующую химиотерапию. После этого следует пять лет ремиссии, но потом рецидив и смерть в 2000 году. Пруденс же, напротив, обнаруживает опухоль лишь в виде крупного новообразования в груди в 1999 году. Она, в свою очередь, тоже проходит курс лечения, приносящего ей кратковременное облегчение, но потом, как и у Хоуп, следует рецидив, и Пруденс умирает в 2000 году, одновременно с сестрой.
На совместных похоронах плакальщики тянутся за двумя одинаковыми гробами, а лечащие врачи сестер затевают жаркий спор. Врач Хоуп стоит на том, что у пациентки была пятилетняя выживаемость: опухоль обнаружили в 1995 году, а умерла Хоуп в 2000 году. Доктор Пруденс утверждает, что в ее случае выживаемость равнялась всего одному году: опухоль обнаружили в 1999 году, а умерла Пруденс в 2000 году. Оба не могут быть правы: близнецы умерли от одной и той же разновидности опухоли в одно и то же время. Разгадка этого мнимого парадокса — так называемой систематической ошибки опережения — лежит на поверхности. Использование понятия «выживаемость» в качестве конечной оценки результативности скрининговых тестов неудачно, потому что раннее выявление болезни отводит диагностические часы назад. И у Хоуп, и у Пруденс опухоли вели себя совершенно одинаково. Но поскольку опухоль Хоуп была обнаружена раньше, создается ошибочное впечатление, что она прожила дольше, а значит, тест принес ей пользу.
Выходит, наш тест обязан преодолеть новое препятствие: его внедрение должно в конечном итоге улучшать показатели смертности, а не выживаемости. Судить о том, оказался ли наш тест и в самом деле полезен, можно лишь задавшись вопросом, прожила ли Хоуп в результате него дольше, чем прожила бы без него. Если бы она дожила до 2010 года, пережив сестру на десять лет, у нас были бы все основания утверждать, что от теста есть польза. Но поскольку обе женщины умерли одновременно, мы поневоле приходим к выводу, что тест никакой выгоды для больного не несет.
Таким образом, путь скринингового теста к успеху весьма длителен и узок. По обеим сторонам от него тянутся пропасти гипердиагностики или недостаточной диагностики. Далее маячит искушение остановиться на возможности ранней диагностики. Потом приходится лавировать в коварных трясинах систематических ошибок оценки результата и выбора испытуемых. Выживаемость, несмотря на всю свою заманчивую простоту, не может служить конечным критерием успеха. На каждом этапе жизненно важна адекватная рандомизация пациентов. Лишь тест, удовлетворяющий всем этим параметрам — показавший выгоду в смысле смертности при рандомизированной выборке пациентов и с приемлемым уровнем гипердиагностики и недостаточной диагностики, — может считаться успешным. В столь жестких условиях очень немногие тесты способны пройти этот суровый отбор и доказать свою пользу.
Зимой 1963 года трое исследователей решили проверить, способно ли скринирование большой группы женщин, у которых нет выраженных симптомов рака молочной железы, предотвратить смертность от этой разновидности рака. Все трое, изгои в своих первоначальных областях, искали новый способ изучения рака молочной железы. Луис Венет, хирург, обученный в классических традициях, надеялся научиться выявлять рак на ранних стадиях, чтобы избежать крупных и калечащих радикальных операций, бывших в то время нормой в этой области онкологии. Сэм Шапиро, статистик, пытался изобрести новые методы проведения статистических испытаний. Но самые горькие причины были у Филиппа Стракса, нью-йоркского терапевта: в середине 1950-х годов он ухаживал за женой, мучительно умирающей от рака молочной железы. Попытки Стракса научиться выявлять ранние стадии рака при помощи рентгена были его личным крестовым походом, предпринятым, чтобы остановить биологические часы болезни, унесшей жизнь его жены.
Венет, Стракс и Шапиро прекрасно разбирались в тонкостях проведения испытаний. Они с самого начала осознали, что для проверки эффективности маммографии им требуется рандомизированное проспективное испытание, оценивающее смертность пациенток. Методологически выражаясь, их клиническое испытание должно было воспроизвести знаменитое испытание Долла и Хилла по поводу курения. Исследования Долла с Хиллом стали удачным побочным продуктом программы национализации системы здравоохранения в Великобритании — грандиозная выборка была достигнута за счет государственной «адресной книги», включавшей всех лицензированных британских врачей. Возможность провести испытания маммографии предоставило обратное явление — волна приватизации, прокатившаяся по послевоенной Америке. Летом 1944 года нью-йоркские законодатели запустили новую программу по предоставлению жителям Нью-Йорка услуг медицинского страхования по месту работы. Эта программа под названием «План страхования здоровья» (ПСЗ) стала прообразом нынешней «Организации медицинского обеспечения» (ОМО).
План страхования заполнил собой огромную пустующую нишу. К середине 1950-х годов триада внешних сил — иммиграция, Вторая мировая война и Великая депрессия — оторвала женщин от домашнего хозяйства и выгнала их на работу. Теперь они составляли треть всей рабочей силы Нью-Йорка. Работающие женщины хотели получить какую-либо медицинскую страховку, и ПСЗ, позволявший объединить риски и тем снизить расходы, был естественным решением их проблем. К началу 1960-х годов план насчитывал тридцать одну группу медицинского страхования и охватывал более трехсот тысяч человек, в том числе почти восемьдесят тысяч женщин.
Стракс, Шапиро и Венет быстро поняли важность этого ресурса: вот она, их статистическая группа — выборка жительниц Нью-Йорка и пригородов, которых можно обследовать и отслеживать долгое время. Испытание сделали намеренно простым: женщин в возрасте от сорока до шестидесяти четырех лет разделили на две группы. В одной группе провели скринирование при помощи маммографии, а в другой не стали. Этические стандарты для такого рода исследований в 1960-е годы значительно упрощали задачу: группе, в которой не проводили скринирования (то есть не предлагали маммографии), не требовал ось давать согласия — этих участниц просто зачисляли на испытание без их ведома, а потом отслеживали их судьбу.
Начатое в декабре 1963 года испытание сразу же превратилось в логистический кошмар. Маммография в те годы была делом нелегким и громоздким: аппарат величиной с доброго быка, фотографические пластины размером с небольшое окошко, ядовитые растворы и пары в фотолаборатории. Удобнее всего было проводить маммографию в специализированных клиниках, но участницы испытаний туда приходить не желали. Стракс и Венет в конце концов оборудовали передвижной фургон с рентгеновским аппаратом и установили его в центре Манхэттена, рядом с передвижными торговцами мороженым и сандвичами, убеждая женщин провести исследование во время обеденного перерыва[24].
Стракс принялся одержимо вербовать участниц испытания. Если какая-либо женщина отказывалась, он буквально не давал ей проходу — звонил, писал и снова звонил, уговаривая присоединиться. Процедура проведения маммограммы в клиниках была отлажена практически с автоматической четкостью, что позволяло в день принимать тысячи женщин.
«Опрос… пять станций по двенадцать женщин в час, то есть всего шестьдесят женщин… Кабинки для раздевания: шестнадцать кабинок по шесть женщин в час — девяносто шесть женщин в час. Каждая кабинка содержит четыре шкафчика для одежды, то есть всего шестьдесят четыре шкафчика. По завершении „цикла“ женщина заходит в ту же кабинку, чтобы снова взять свои вещи и одеться. Для ускорения оборота никаких излишеств вроде стульев и зеркал в кабинках быть не должно».
Поднимаются и опускаются шторки. Открываются и закрываются двери. Каморки без стульев и зеркал впускают и выпускают новых и новых пациенток. Карусель не останавливается ни днем, ни поздно вечером. За шесть лет трое исследователей сумели завершить скринирование, на которое в обычных условиях потребовалось бы не меньше двадцати лет.
Если при маммографии обнаруживали опухоль, то женщина получала лечение согласно принятым в то время стандартам: хирургическое вмешательство с целью удаления опухолевой массы — чаще всего радикальная мастэктомия — или операция с последующим облучением. Завершив цикл скринирования и последующего медицинского вмешательства, Стракс, Венет и Шапиро принялись наблюдать развитие эксперимента во времени, отслеживая уровень смертности от рака молочной железы в группе, где проводилось скринирование, по сравнению с группой, в которой его не проводилось.
В 1971 году, через восемь лет после начала испытания, Стракс, Венет и Шапиро начали получать данные, которые на первый взгляд казались убедительным доводом в пользу скринирования. В испытаниях приняли участие шестьдесят две тысячи женщин, примерно половине из которых проводилась маммография. За прошедший период в этой группе насчитывалась тридцать одна смерть от рака молочной железы, а в контрольной группе — пятьдесят пять. Абсолютное число спасенных жизней оказалось небольшим, зато впечатляло процентное уменьшение смертности — почти на сорок процентов. Стракс был вне себя от восторга. «Радиолог, — писал он, — становится потенциальным спасителем женщин — и их груди».
Положительным результатом испытаний при ПСЗ стало распространение маммографии. «За пять лет маммография перебралась из разряда сброшенных со счетов процедур на порог общепризнанных методик», — писал один радиолог. В Национальном институте онкологии всеобщий энтузиазм по поводу скринирования нарастал не по дням, а по часам. Артур Холлеб, глава Американского онкологического общества, поспешил провести параллель между этими обследованиями и мазком Папаниколау. «Американское онкологическое общество, — заявил Холлеб в 1971 году, — должно возглавить массовую программу по маммографии, точно так же, как было с мазком Папаниколау… Мы не можем больше предлагать населению нашей страны мириться с потерями многих жизней в результате рака молочной железы — ведь этот недуг за год уносит столько же, сколько унесли десять лет войны во Вьетнаме. Настал срок сплотиться всей страной. И я твердо верю, что это время настало».
Масштабная кампания Американского онкологического общества носила название «Проект по диагностике и выявлению рака молочной железы». Что примечательно, это были не клинические испытания, а именно выявление недуга, как и заявлялось в названии. В проекте не существовало контрольной группы. За год планировалось обследовать почти двести пятьдесят тысяч женщин — чуть ли не в восемь раз больше, чем Стракс за три года, — главным образом для того, чтобы продемонстрировать возможность маммографического скринирования на государственном уровне. Мэри Ласкер активно поддерживала этот проект, как поддерживали его и практически все онкологические организации Америки. Маммография — «сброшенная со счетов процедура» — внезапно оказалась символом на знамени современности.
Однако пока «Проект по диагностике и выявлению» победно летел вперед, начали появляться первые сомнения. Как мы помним, Шапиро рандомизировал испытание тем, что разделил женщин на две группы — «тестируемые» и «контроль» — и сравнивал смертность в этих группах. Как было принято в 1960-е годы, контрольную группу не информировали об участии в испытаниях. Это была виртуальная группа — выборка из учетных записей «Плана страхования здоровья». Когда женщина из этой группы умирала от рака молочной железы, Стракс и Шапиро исполнительно заносили смерть в таблицы, но — как при валке деревьев в лесу статистики — вся группа в целом рассматривалась в виде некоторой абстракции.
В принципе сравнение виртуальной группы пациентов с реальной могло бы и сработать. Однако по мере того как шли испытания, Стракс и Шапиро начали тревожиться: а вдруг есть женщины, у которых рак был диагностирован еще до начала испытаний? Для таких пациенток скринирование было совершенно бесполезно. Чтобы исправить возможную ошибку, Шапиро принялся исключать таких пациенток из обеих групп.
Исключить их из группы, которой делали маммографию, оказалось достаточно просто: перед маммографией радиолог расспрашивал женщину о ее медицинской истории. Однако контрольную группу расспросить было нельзя — именно в силу ее «виртуальности». Поэтому и отсев следовало провести «виртуально». Шапиро попытался сделать это с максимально возможной тщательностью и беспристрастностью, исключив равное количество женщин из контрольной группы. Но кто знает, не выбирал ли он на подсознательном уровне? Возможно, он все же исключил из группы обследуемых женщин больше пациенток с уже диагностированным раком. Разница была невелика — всего четыреста тридцать четыре пациентки из тридцати тысяч — но в статистическом смысле фатальна. Критики утверждали, что большая смертность в контрольной группе обусловлена неадекватным отсевом. Контрольная группа, говорили они, по недосмотру оказалась перегружена женщинами с уже развившимся раком, а значит, и большая смертность в этой группе — всего лишь статистическая ошибка.
Энтузиасты маммографии пришли в уныние. Они признавали, что требуется более объективная оценка, повторное проведение испытаний. Но где такие испытания можно провести? В США двести тысяч женщин уже приняли участие в «Проекте по диагностике и выявлению рака молочной железы», а потому не годились для нового испытания. Вдобавок академические круги насмерть перессорились по поводу интерпретации результатов. Слепо барахтаясь в этих противоречиях, мировое сообщество маммографов ударилось в новую крайность. Вместо того чтобы планировать новые эксперименты с учетом результатов прошлых, они запустили череду параллельных испытаний. За период между 1976 и 1992 годами массивные параллельные маммографические испытания прошли в Европе: в Шотландии (в Эдинбурге) и сразу в нескольких городах Швеции (в Мальме, Стокгольме, Коппарберге, Остерготланде и Гетеборге). В Канаде тем временем провели собственное рандомизированное маммографическое испытание, названное Государственным исследованием скринирования молочной железы. Как нередко бывало в истории онкологии, маммографические испытания превратились в гонку вооружений, где каждая группа ученых стремилась превзойти соперников.
Испытания в Эдинбурге обернулись сущим кошмаром. Начать с того, что сам этот город, разделенный на сотни изолированных и разобщенных врачебных практик, был неподходящим местом для проведения столь масштабного эксперимента. Врачи распределяли женщин в группы скрининга или контроля совершенно произвольно. Или, хуже того, женщины сами выбирали, куда записываться. Протоколы рандомизации пошли насмарку. Даже после начала испытаний женщины внезапно переходили из одной группы в другую, парализуя возможность адекватной интерпретации результатов всего эксперимента в целом.
В Канаде же, напротив, точность проведения испытаний и внимание к деталям были доведены до совершенства. Летом 1980 года там начали широко разрекламированную государственную кампанию по набору тридцати девяти тысяч женщин для прохождения маммографии. Набор осуществлялся через объявления в газетах, рассылки писем и звонки на дом. Для проведения испытаний аккредитовали пятнадцать специализированных центров. Когда женщина приходила в один из них, в регистратуре ей задавали несколько предварительных вопросов и предлагали заполнить анкету, после чего ее осматривал хирург или медсестра, а после осмотра имя заносили в реестр — типичную книгу учета, в голубоватую линеечку, какими пользовались в большинстве клиник. Рандомизация пациенток достигалась чередованием строк в реестре. Если женщина с одной строки попадала в группу скринирования, то следующая — в контрольную, третья снова в скрининговую и так далее.
Обратите внимание: рандомизация пациенток чаще всего происходила после того, как врачи узнавали медицинскую историю женщины и осматривали ее. Такого не предусматривалось и не предписывалось исходным протоколом (подробные описания процедуры были разосланы по всем центрам). Однако это незначительное изменение полностью загубило все испытания. Назначения, проводимые после первичного опроса, проводимого медсестрами, уже не были случайными. Женщины с аномалиями в груди или лимфатических узлах гораздо чаще попадали в группу для маммографии (например, в одной из клиник семнадцать таких пациенток попали в скрининговую группу и только пять — в контрольную). То же самое происходило в отношении женщин с предшествующей историей рака молочной железы и с пациентками, относящимися к «группе риска» на основании предыдущей истории болезни или сведений, представленных страховой компанией (восемь на маммографию, одна в контроль).
Отчего так вышло, никто до сих пор не понял. Назначали ли медсестры женщин из группы риска в скрининговую группу, чтобы подтвердить результаты неточного клинического осмотра — получить второе мнение при помощи рентгеновского снимка? Делалось ли это неосознанно? Стало ли невольным результатом сострадания, попытки помочь женщинам из группы риска, отправив их на маммографию? Пропускали ли сами такие пациентки очередь в приемной, чтобы нарочно попасть в нужную строчку? А если да, то кто их научил — координаторы испытаний, лечащие врачи, рентгенологи, медсестры в приемной?
Команды эпидемиологов, статистиков, радиологов и по крайней мере одна группа зарубежных экспертов с тех пор изучили неразборчивые записи в реестрах вдоль и поперек, ища ответа на эти вопросы и стараясь понять, что же пошло не так. «Подозрение, как и красота, таится в глазах смотрящего», — возражал один из руководителей испытаний. Однако поводов для подозрений нашлось немало. Реестры пестрели помарками и исправлениями: имена меняли на другие, строчки выбеливались и в них поверх вписывались новые пациентки. Показания сотрудников центров подтвердили эти наблюдения. В одном из центров координатор испытаний добавила в скрининговую группу своих подруг (вероятно, надеясь оказать им услугу и спасти их жизни). В другом, по словам кого-то из лаборантов, рандомизацию нарушали, направляя женщин в ту или иную группу. По страницам медицинских журналов летали обвинения и контробвинения. «Один урок случившегося очевиден, — пренебрежительно написал в редакторской статье онколог Норман Бойд, — рандомизацию в клинических испытаниях надо проводить так, чтобы отклонения были совершенно невозможны».
Однако, если оставить в стороне столь блестящее умозаключение, больше ничего очевидного не обнаружилось. Из всего этого тумана на свет явилось исследование, еще более несбалансированное, чем исследование в рамках «Плана страхования здоровья». Стракс и Шапиро ошиблись, избирательно не допуская женщин из группы риска в группу для маммографии. Канадцы же качнулись в другую сторону, избирательно обогатив группу для маммографии такими пациентками. Неудивительно, что результаты их исследования вышли сугубо отрицательными: в скрининговой группе от рака молочной железы умерло больше женщин, чем среди тех, кому никакой маммографии не проводилось.
Завершить всю эту запутанную историю выпало на долю Швеции. Зимой 2007 года я посетил Мальмё, место одного из шведских маммографических испытаний, начатых в конце 1970-х годов. Притулившийся на южной оконечности шведского полуострова, Мальмё представляет собой невыразительный сизый индустриальный город посреди такого же безликого сизого пейзажа. К северу от него тянется равнина Сконе, к югу катятся воды пролива Эресунн. Пострадавшая от экономического кризиса в середине 1970-х годов, область словно бы впала в экономическую и демографическую летаргию на целых двадцать лет. Миграция в город и из него двадцать лет держалась на поразительно низком уровне — всего два процента. Мальмё превратился в своего рода чистилище, где томилась в заточении большая выборка мужчин и женщин — идеальное место для проведения нелегкого медицинского испытания.
В 1976 году на маммографическое исследование в Мальмё записалось сорок две тысячи женщин. Половине этой группы — примерно двадцати одной тысяче — ежегодно проводили скринирование в маленькой клинике близ основной больницы Мальмё; второй половине скринирования не делали. Обе группы впоследствии находились под тщательным наблюдением. Эксперимент сработал, как часы. «В Мальмё имелась всего одна клиника по заболеваниям молочной железы — совершенно необычное дело для такого крупного города, — вспоминал ведущий исследователь Ингвар Андерссон. — Все участницы год за годом проходили маммографию в одной и той же больнице, что обеспечило в высшей степени достоверное, максимально строгое и контролируемое исследование».
В 1988 году, под конец двенадцатого года испытаний, были обнародованы первые результаты. В целом в скрининговой группе было диагностировано пятьсот восемьдесят восемь женщин с раком молочной железы, а в контрольной группе — четыреста сорок семь, что в очередной раз подчеркивало способность маммографии выявлять ранние стадии заболевания. На первый взгляд ранняя диагностика не дала никакого преимущества по числу спасенных жизней. Всего от рака молочной железы умерли сто двадцать девять участниц испытаний: шестьдесят три в скрининговой группе и шестьдесят шесть в контрольной — то есть никакой статистически значимой разницы.
И все же за этими смертями крылась определенная закономерность. Когда группы проанализировали по возрасту, выяснилось, что маммография принесла заметную выгоду группе женщин в возрасте старше пятидесяти пяти лет, уменьшив смертность среди них на двадцать процентов. У женщин младшего возраста никакого заметного положительного эффекта выявлено не было.
Эта же закономерность — заметная польза для пожилых женщин и практически никакой пользы для женщин помоложе — подтвердилась и результатами исследований, последовавших за испытаниями в Мальмё. В 2002 году, через двадцать шесть лет после начала проведения эксперимента в Мальмё, журнал «Ланцет» опубликовал исчерпывающий анализ всех проведенных в Швеции испытаний, в которых приняли участие общим счетом двести сорок семь тысяч женщин. Совместный анализ подтвердил результаты, полученные в Мальмё. На протяжении пятнадцати лет маммография привела к уменьшению смертности от рака молочной железы среди женщин от пятидесяти до семидесяти лет на двадцать — тридцать процентов. Однако для более младшей возрастной категории заметной пользы выявлено не было.
Словом, маммография вовсе не оказалась универсальной «спасительницей» всех женщин с раком молочной железы. Ее эффект, как выразился статистик Дональд Берри, «неоспорим для определенного сегмента женщин, но столь же неоспоримо скромен даже в этом сегменте». Далее Берри писал: «Скринирование — это лотерея. В победителях меньшинство… подавляющей части никаких выгод от маммографии нет, зато они расплачиваются потерей времени, а также риском, которым чревато скринирование… Риск же, сопряженный с непроведением маммографии после пятидесяти лет сопоставим с ездой на велосипеде без шлема пятнадцать часов подряд». Если бы все женщины по всей стране начали кататься на велосипедах по пятнадцать часов подряд, и притом без шлема, то, пожалуй, смертность среди них была бы несколько выше, чем если бы все они надели шлемы. Но для отдельно взятой женщины, которая раз в неделю едет без шлема за продуктами в ближайшую лавку на углу, риск настолько незначителен, что его можно даже не брать в расчет.
Впрочем, по крайней мере в Мальмё это уточнение пропало втуне. Многие участницы первоначального исследования уже умерли (по самым разным причинам), однако, как выразилась одна из местных жительниц, «маммография превратилась у нас в религию». В день моего приезда клинику посетило несколько десятков женщин — как старше, так и моложе пятидесяти пяти лет, — с поистине религиозной неукоснительностью явившихся на ежегодный рентген. Подозреваю, клиника и по сей день функционирует все с той же четкостью и обязательностью, что позволило после громкого провала в других городах провести здесь одно из самых значимых и самых трудных клинических испытаний в истории профилактики рака. Ровный поток пациенток струился в клинику и вытекал из нее, словно череда посыльных. Многие посетительницы — ведать не ведая о предостережениях Берри — приезжали на велосипедах, но без шлемов.
Почему же простая, воспроизводимая, дешевая и легкая в эксплуатации техника — рентгеновские снимки, позволяющие обнаружить в груди тень крошечной опухоли, — полвека не поддавалась исследователям? Почему на то, чтобы обнаружить в ней хоть какую-то пользу, потребовалось девять испытаний?
Отчасти ответ кроется в сложности проведения испытаний по ранней диагностике опухолей как таковых. Подобные испытания всегда изобилуют скользкими моментами, неоднозначны и подвержены всевозможным ошибкам. Эдинбург подвели нарушения рандомизации, «Проект по диагностике и выявлению рака молочной железы» — отсутствие рандомизации вообще. Испытания Шапиро загубила неумеренная забота о беспристрастности, канадские — излишняя сострадательность.
Вдобавок важен и старый парадокс гипердиагностики и недостаточной диагностики — хотя и с одним важным дополнением. Как оказалось, маммограмма не такое уж хорошее средство для выявления ранних стадий рака. Уровни ложно-положительных и ложно-отрицательных диагнозов при ней крайне далеки от идеального. Но роковой недостаток маммографии в том, что эти уровни не абсолютны — они зависят от возраста. У женщин старше пятидесяти пяти частота рака молочной железы достаточно высока — даже не слишком качественное скринирование позволяет выявлять ранние стадии рака и повысить выживаемость. У женщин между сорока и пятьюдесятью частота рака молочной железы падает до того уровня, когда найденное в груди пациентки «новообразование» чаще всего оказывается ложно-положительным результатом. Используя аналогию с лупой: лупа, предназначенная для чтения мелкого шрифта, вполне справляется со своей задачей, пока размер шрифта десять или шесть кеглей, после чего потом наступает предел. При определенном размере шрифта у читателя ровно столько же шансов прочесть букву правильно, как и неправильно. Таким образом, для женщин старше пятидесяти пяти лет, у которых «размер шрифта» частоты рака достаточно велик, маммограмма работает хорошо, а для женщин от сорока до пятидесяти лет маммография спотыкается на этом пороге неразличимости. Как бы интенсивно мы ни применяли ее для скрининга женщин этой возрастной группы, она как инструмент всегда окажется неудачной.
Последняя же часть ответа, безусловно, состоит в том, как именно мы представляем себе рак и скринирование. Люди — существа визуальные. Если мы видим, значит — верим. Мы верим, что лучший способ предотвратить рак — это распознать, увидеть его на ранних, неагрессивных стадиях. Вот как описал это Малькольм Гладуэлл: «Классический пример того, как должна протекать битва против рака: использовать мощную камеру; сделать четкий снимок; выявить опухоль насколько возможно раньше; лечить ее немедленно и агрессивно… Опасность, которую представляет опухоль, видно с первого взгляда — чем больше, тем хуже, чем меньше, тем лучше».