Канадские специалисты разработали инструмент на базе технологии машинного обучения, который может прогнозировать выживаемость пациентов с раком в пятилетней перспективе. Он использует данные медицинской карты, включая отчет о первичной консультации у онколога.
Ранее аналогичные инструменты прогнозирования выживаемости для различных заболеваний, включая онкологические, создавались при помощи технологии машинного обучения, требующей структурированных данных, которые не всегда доступны. А вот сведений о применении методов NLP в исследованиях выживаемости онкопациентов исследователям найти не удалось.
Обработка естественного языка (Natural Language Processing, NLP) — технология на стыке машинного обучения и математической лингвистики. Применяется во многих сферах, в том числе в голосовых помощниках, автоматических переводах текста. Основные направления: распознавание речи (Speech Recognition), понимание естественного языка (Natural Language Understanding) и генерация естественного языка (Natural Language Generation).
Исследовательская группа решила устранить этот пробел, разработав и оценив нейронные модели NLP для прогнозирования выживаемости пациентов с раком, используя самые доступные данные, которые обычно содержатся в медицинской карте, в частности заключение онколога. Были использованы ретроспективные данные 47 тыс. пациентов, созданные в течение 180 дней после постановки диагноза в шести больницах Британской Колумбии (Канада) с 1 апреля 2011 по 31 декабря 2016 года. Пациенты, у которых было более одного онкодиагноза, были исключены.
Через шесть месяцев выжили 87% участников исследования, 65,4% — через 36 месяцев и 58,5% — через 60 месяцев после первой консультации. Все модели прогнозирования достигли высокой точности. Они были сопоставимы или даже превосходили показатели других моделей. При этом для получения таких результатов не требовалось построение структурированных наборов данных, подчеркивают авторы исследования.