Каждый год 40 000 женщин умирают от рака груди в США.S. в одиночестве. Когда рак обнаружен на ранней стадии, его часто можно вылечить. Маммограммы – лучший доступный тест, но они все еще несовершенны и часто приводят к ложноположительным результатам, что может привести к ненужным биопсиям и хирургическим вмешательствам.
Одной из частых причин ложных срабатываний являются так называемые "высокий риск" поражения, которые кажутся подозрительными на маммограмме и имеют аномальные клетки при исследовании с помощью игольной биопсии. В этом случае пациенту обычно проводят операцию по удалению поражения; однако в 90% случаев поражения оказываются доброкачественными во время операции. Это означает, что каждый год тысячи женщин проходят болезненные, дорогостоящие, оставляющие рубцы операции, в которых даже не было необходимости.
Каким образом можно исключить ненужные операции, сохранив при этом важную роль маммографии в выявлении рака?? Исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL), Массачусетской больницы общего профиля и Гарвардской медицинской школы считают, что ответ – обратиться к искусственному интеллекту (ИИ).
В качестве первого проекта по применению искусственного интеллекта для улучшения обнаружения и диагностики команды совместно разработали систему искусственного интеллекта, которая использует машинное обучение для прогнозирования того, будет ли поражение с высоким риском, выявленное при игольчатой биопсии после маммографии, превратиться в рак во время операции.
При тестировании на 335 очагах высокого риска модель правильно диагностировала 97 процентов рака груди как злокачественные и сократила количество доброкачественных операций более чем на 30 процентов по сравнению с существующими подходами.
"Поскольку диагностические инструменты настолько неточны, у врачей есть понятная тенденция к чрезмерному скринингу на предмет рака груди," – говорит Регина Барзилай, профессор электротехники и информатики в Массачусетском технологическом институте Delta Electronics и сама выжившая после рака груди. "Когда в данных существует такая большая неопределенность, машинное обучение – именно тот инструмент, который нам нужен для улучшения обнаружения и предотвращения чрезмерной обработки."
Обученная на информации о более чем 600 существующих поражениях высокого риска, модель ищет закономерности среди множества различных элементов данных, включая демографические данные, семейный анамнез, прошлые биопсии и отчеты о патологии.
"Насколько нам известно, это первое исследование, которое применяет машинное обучение к задаче различения поражений с высоким риском, требующих хирургического вмешательства, от поражений, которые не требуют вмешательства," говорит соавтор Констанс Леман, профессор Гарвардской медицинской школы и руководитель отделения визуализации груди в отделении радиологии MGH. "Мы считаем, что это могло бы помочь женщинам принимать более информированные решения о своем лечении, и что мы могли бы предложить более целенаправленные подходы к здравоохранению в целом."
Недавний Макартур "грант гения" получателя, Барзилай является соавтором новой статьи в журнале с описанием результатов, написанной в соавторстве с Леманом и Манишей Бахл из MGH, а также аспирантами CSAIL Николасом Локашио, Адамом Едидиа и Лили Ю. Статья опубликована сегодня в медицинском журнале Radiology.
Как это работает
Когда маммограмма обнаруживает подозрительное поражение, проводится пункционная биопсия, чтобы определить, является ли это раком. Примерно 70 процентов поражений являются доброкачественными, 20 процентов являются злокачественными и 10 процентов представляют собой поражения высокого риска.
Врачи по-разному лечат поражения с высоким риском. Некоторые проводят хирургическое вмешательство во всех случаях, в то время как другие проводят операцию только на поражениях с более высокой частотой рака, таких как "атипичная гиперплазия протоков" (ADH) или "лобулярная карцинома in situ" (LCIS).
Первый подход требует, чтобы пациент перенес болезненную, трудоемкую и дорогостоящую операцию, в которой обычно нет необходимости; второй подход неточен и может привести к отсутствию рака в поражениях высокого риска, кроме ADH и LCIS.
"Подавляющее большинство пациентов с поражениями высокого риска не болеют раком, и мы пытаемся найти тех немногих, у которых он есть," говорит Бахл, коллега-врач отделения радиологии MGH. "В подобном сценарии всегда есть риск того, что, когда вы попытаетесь увеличить количество опухолей, которые вы можете идентифицировать, вы также увеличите количество обнаруженных ложных срабатываний."
Используя метод, известный как "классификатор случайного леса," Модель команды привела к меньшему количеству ненужных операций по сравнению со стратегией постоянного проведения операции, а также к возможности диагностировать больше раковых поражений, чем стратегия проведения операции только на традиционных "поражения высокого риска." (В частности, новая модель диагностировала 97 процентов рака по сравнению с 79 процентами.)
"В этой работе показан пример использования передовых технологий машинного обучения, чтобы избежать ненужных операций," говорит Марк Коли, директор по клинической информатике отделения радиологии и биомедицинской визуализации Калифорнийского университета в Сан-Франциско. "Это первый шаг к тому, чтобы медицинское сообщество приняло машинное обучение как способ выявления закономерностей и тенденций, которые в противном случае были бы невидимы для людей."
Lehman говорит, что радиологи MGH начнут внедрять эту модель в свою клиническую практику в течение следующего года.
"В прошлом мы могли рекомендовать хирургическое удаление всех поражений высокого риска," Lehman говорит. "Но теперь, если модель определяет, что поражение имеет очень низкий шанс быть злокачественным у конкретного пациента, мы можем провести более информированное обсуждение с нашим пациентом о ее вариантах. Некоторым пациентам может быть разумно проследить за их поражениями с помощью визуализации, а не иссечь их хирургическим путем."
Команда говорит, что они все еще работают над дальнейшим оттачиванием модели.
"В будущей работе мы надеемся включить фактические изображения из маммограмм и изображения слайдов патологии, а также более обширную информацию о пациентах из медицинских записей," говорит Бахл.
Двигаясь вперед, модель также можно легко настроить для применения к другим видам рака и даже к другим заболеваниям целиком.
"Подобная модель будет работать в любое время, когда у вас есть множество различных факторов, которые коррелируют с конкретным результатом," говорит Барзилай. "Мы надеемся, что это позволит нам выйти за рамки универсального подхода к медицинской диагностике."