Дослідження опубліковане в журналі Frontiers in Medicine. Ішемічна хвороба серця (ІХС) — це стан, коли серце не отримує достатньо крові та кисню через звуження або блокування коронарних артерій. Зазвичай це викликано бляшками, які утворюються на стінках судин із жирів та холестерину. ІХС може проявлятися як стенокардія (біль у грудях), інфаркт міокарда (серцевий напад) або інші ускладнення.
За даними ВООЗ, ішемічна хвороба серця є найпоширенішою причиною смертності у світі, на неї припадає 13 відсотків смертей. Тому важливо правильно призначати лікування та знижувати ризики виникнення ускладнень і рецидивів. Дослідники з НДУ ВШЕ створили модель, здатну прогнозувати ймовірність розвитку ускладнень після інфаркту міокарда.
Вчені проаналізували дані пацієнтів Сургутського окружного центру діагностики та серцево-судинної хірургії, які поступили з інфарктом міокарда в період з 2015 по 2024 рік. При надходженні в відділення невідкладної допомоги лікарі-дослідники пояснювали пацієнтам умови дослідження та отримували їх згоду на участь. Потім кардіологи оцінювали стан коронарних артерій, що постачають серце, і, виходячи з оцінки, виконували операції з відновлення кровотоку: балонну ангіопластику та стентування або аортокоронарне шунтування. Пацієнтів лікували медикаментозно за допомогою блокаторів РААС, бета-блокаторів, статинів та подвійної антиагрегантної терапії. Дані фіксувалися у внутрішньолікарняних історіях хвороби. У кожного пацієнта лікарі визначали стандартні клінічні показники: артеріальний тиск, індекс маси тіла, рівень холестерину та глюкози.
На лабораторному етапі лікарі-дослідники виділяли ДНК з лейкоцитарних кілець у зібраних зразках крові, а потім заморожували при температурі –80 °C для майбутнього генетичного тестування. Генотип визначали за конкретною генетичною варіацією (поліморфізмом) у гені VEGFR-2. Генетичний маркер VEGFR-2 є елементом у системі сигналів організму, що контролює ріст нових кровоносних судин. Існує три варіанти генотипу — C/C, C/T і T/T, які відрізняються варіацією нуклеотидів ДНК цитозину (C) або тиміну (T) в цій ділянці гена. Маркер відомий давно, однак його вплив на прогноз ускладнень після інфаркту міокарда досліджували вперше.
Автори статті розглянули вплив 39 факторів на прогноз ризиків серцевої смерті, повторного гострого коронарного синдрому, інсульту та необхідності повторної реваскуляризації — процедури, що допомагає відновити кровотік в артеріях. Щоб вибрати ефективну модель, дослідники навчали та тестували кілька алгоритмів машинного навчання: градієнтний бустинг (CatBoost і LightGBM), випадковий ліс, логістичну регресію та підхід AutoML.
Найкращу продуктивність показала модель CatBoost — алгоритм градієнтного бустингу, оптимізований для роботи з даними, що позначають категорії або групи, а не числові значення. Він будує прогнози за рахунок послідовного створення та навчання «слабких» дерев рішень, де наступне дерево коригує помилки попередніх. При побудові дерев алгоритм ділить дані на дві частини: модель навчається на одній частині даних, а помилки розраховуються на іншій. Це знижує ефект перенавчання, при якому модель просто запам'ятовує правильні відповіді і допомагає знайти загальні закономірності для прогнозів у незнайомих випадках.
Вплив ознак на точність моделі оцінювали за допомогою методу послідовного додавання ознак, який перевіряє їх внесок на кожному етапі. Вчені відібрали 9 найбільш значущих факторів: стать, індекс маси тіла, індекс коморбідності Чарлсона, що враховує наявність серйозних супутніх захворювань, стан бічної стінки лівого шлуночка, ступінь ураження стовбура лівої коронарної артерії, кількість уражених артерій, варіант гена VEGFR-2, вибір процедури чрескожного коронарного втручання або аортокоронарного шунтування, а також дозування статинів.
Результати показали, що доза статинів — лікарських засобів, які використовуються для зниження рівня холестерину в крові, — є найважливішим фактором, що впливає на ризик розвитку ускладнень. Високі дози статинів знижують цей ризик, особливо у пацієнтів з несприятливим генотипом. Поліморфізм VEGFR-2, зокрема наявність алелів T, виявився на четвертому місці за важливістю.
«Раніше генетичні фактори не використовувалися в моделях машинного навчання, в основному через те, що секвенування або навіть генотипування окремих нуклеотидів не проводиться в лікарнях. Нам же, окрім стандартних показників, були доступні дані про поліморфізм у гені VEGFR-2. Завдяки цьому вдалося порівняти цей показник з іншими і з'ясувати, що алель ризику варіанту VEGFR-2 входить до п'ятірки найбільш важливих факторів для прогнозування довгострокових результатів у пацієнтів з інфарктом міокарда», — пояснює один з авторів статті, завідувачка Міжнародною лабораторією біоінформатики НДУ ВШЕ Марія Попцова.
Дослідники підкреслюють, що аналіз генетичних даних допомагає в створенні більш точних і персоналізованих моделей прогнозу ризиків серцево-судинних ускладнень у пацієнтів після інфаркту міокарда.
«Серцево-судинні захворювання потребують ресурсів для діагностики, лікування, реабілітації та профілактики, тому створюють високе навантаження на систему охорони здоров'я. Впровадження подібних моделей у клінічну практику дозволить знизити смертність і частоту повторних інфарктів, оптимізувати лікування та зменшити навантаження на лікарів», — коментує один з авторів статті, стажер-дослідник Міжнародної лабораторії біоінформатики Олександр Кірдеєв.
Дослідження виконано в рамках проєкту НДУ ВШЕ «Дзеркальні лабораторії».