Исследование было опубликовано в журнале Frontiers in Medicine. Ишемическая болезнь сердца (ИБС) представляет собой состояние, при котором сердце не получает достаточного количества крови и кислорода из-за сужения или блокировки коронарных артерий. Это обычно происходит из-за образования бляшек на стенках сосудов, состоящих из жиров и холестерина. ИБС может проявляться в форме стенокардии (боль в груди), инфаркта миокарда (сердечного приступа) или других осложнений.
Согласно данным ВОЗ, ишемическая болезнь сердца является наиболее распространенной причиной смертности в мире, она составляет 13 процентов всех случаев. Поэтому крайне важно правильно назначать лечение и снижать риски осложнений и рецидивов. Исследователи из НИУ ВШЭ разработали модель, которая может предсказывать вероятность возникновения осложнений после инфаркта миокарда.
Ученые проанализировали данные пациентов Сургутского окружного центра диагностики и сердечно-сосудистой хирургии, которые были госпитализированы с инфарктом миокарда в период с 2015 по 2024 год. При поступлении в отделение неотложной помощи врачи-исследователи объясняли пациентам цели исследования и получали их согласие на участие. Затем кардиологи оценивали состояние коронарных артерий, обеспечивающих кровоснабжение сердца, и на основе этой оценки проводили операции по восстановлению кровотока: баллонную ангиопластику и стентирование или аортокоронарное шунтирование. Пациенты получали медикаментозное лечение с использованием блокаторов РААС, бета-блокаторов, статинов и двойной антиагрегантной терапии. Все данные фиксировались во внутрибольничных историях болезни. У каждого пациента врачи определяли стандартные клинические показатели: артериальное давление, индекс массы тела, уровень холестерина и глюкозы.
На лабораторном этапе врачи-исследователи выделяли ДНК из лейкоцитов, собранных из образцов крови, а затем замораживали их при температуре -80 °C для будущего генетического тестирования. Генотип определялся по конкретной генетической вариации (полиморфизму) в гене VEGFR-2. Генетический маркер VEGFR-2 — это элемент в системе сигналов организма, который контролирует рост новых кровеносных сосудов. Существуют три варианта генотипа — C/C, C/T и T/T, которые отличаются вариацией нуклеотидов ДНК цитозина (C) или тимина (T) в этой области гена. Этот маркер давно известен, однако его влияние на прогноз осложнений после инфаркта миокарда исследовалось впервые.
Авторы статьи рассмотрели влияние 39 факторов на прогноз рисков сердечной смерти, повторного острого коронарного синдрома, инсульта и необходимости повторной реваскуляризации — процедуры, которая помогает восстановить кровоток в артериях. Для выбора эффективной модели исследователи обучили и протестировали несколько алгоритмов машинного обучения: градиентный бустинг (CatBoost и LightGBM), случайный лес, логистическую регрессию и подход AutoML.
Наилучшие результаты показала модель CatBoost — алгоритм градиентного бустинга, оптимизированный для работы с категориальными данными, а не числовыми. Он формирует прогнозы за счет последовательного создания и обучения «слабых» деревьев решений, где каждое последующее дерево корректирует ошибки предыдущего. При построении деревьев алгоритм делит данные на две части: модель обучается на одной части, а ошибки рассчитываются на другой. Это снижает риск переобучения, когда модель просто запоминает правильные ответы и помогает выявить общие закономерности для прогнозов в новых случаях.
Влияние признаков на точность модели оценивалось с помощью метода последовательного добавления признаков, который проверяет их вклад на каждом этапе. Ученые выделили 9 наиболее значимых факторов: пол, индекс массы тела, индекс коморбидности Чарлсона, учитывающий наличие серьезных сопутствующих заболеваний, состояние боковой стенки левого желудочка, степень поражения ствола левой коронарной артерии, количество пораженных артерий, вариант гена VEGFR-2, выбор процедуры чрескожного коронарного вмешательства или аортокоронарного шунтирования, а также дозировка статинов.
Результаты показали, что доза статинов — препаратов, применяемых для снижения уровня холестерина в крови, — является наиболее важным фактором, влияющим на риск развития осложнений. Высокие дозы статинов снижают этот риск, особенно у пациентов с неблагоприятным генотипом. Полиморфизм VEGFR-2, в частности наличие аллеля T, оказался на четвертом месте по значимости.
«Ранее генетические факторы не использовались в моделях машинного обучения, в основном из-за того, что секвенирование или даже генотипирование отдельных нуклеотидов не проводятся в больницах. Нам же, помимо стандартных показателей, были доступны данные о полиморфизме в гене VEGFR-2. Это позволило сравнить этот показатель с другими и выяснить, что аллель риска варианта VEGFR-2 входит в пятерку наиболее важных факторов для прогнозирования долгосрочных результатов у пациентов с инфарктом миокарда», — объясняет один из авторов статьи, заведующая Международной лабораторией биоинформатики НИУ ВШЭ Мария Попцова.
Исследователи подчеркивают, что анализ генетических данных способствует созданию более точных и персонализированных моделей прогнозирования рисков сердечно-сосудистых осложнений у пациентов после инфаркта миокарда.
«Сердечно-сосудистые заболевания требуют ресурсов для диагностики, лечения, реабилитации и профилактики, что создает значительную нагрузку на систему здравоохранения. Внедрение подобных моделей в клиническую практику позволит снизить смертность и частоту повторных инфарктов, оптимизировать лечение и уменьшить нагрузку на врачей», — комментирует один из авторов статьи, стажер-исследователь Международной лаборатории биоинформатики Александр Кирдеев.
Исследование было проведено в рамках проекта НИУ ВШЭ «Зеркальные лаборатории».