Научные публикации и переводы

From clinical phenotypes to genomic signatures: machine learning integration for precision tuberculosis treatment prediction

Краткое содержание статьи. Неофициальный перевод на русский язык: АНО «Здоровье.ру» 2026.
«От клинических фенотипов до геномных сигнатур: интеграция машинного обучения для точного прогнозирования лечения туберкулеза»
ИСХОДНАЯ ИНФОРМАЦИЯ
Туберкулез (ТБ) остается серьезной глобальной угрозой для здравоохранения, ежегодно вызывая около 1,5 миллиона смертей. Несмотря на прогресс в лечении, 15–20% пациентов по-прежнему сталкиваются с неэффективностью лечения или рецидивом, что подчеркивает острую необходимость в точных прогностических инструментах для раннего выявления пациентов из группы высокого риска. Существующие методы, основанные на клинических параметрах, имеют ограничения в точности прогнозирования и выявлении потенциальных биологических механизмов.

МЕТОДЫ
В данном исследовании была разработана и валидирована инновационная прогностическая модель интегрирования мультиомиксных (multi-omics) данных. Авторы собрали клинические данные от 467 пациентов с туберкулезом и интегрировали транскриптомные данные из трех независимых общедоступных когорт (GSE19491, GSE31312, GSE83456), включающих 3240 дифференциально экспрессируемых генов. С помощью расширенной разработки характеристик и биоинформационного анализа были выбраны ключевые признаки. Авторы системно оценили 12 алгоритмов машинного обучения и применили стратегию ансамблевого обучения для построения окончательной модели. Производительность модели оценивалась с помощью строгих перекрестных и проспективных валидационных когорт.

РЕЗУЛЬТАТЫ
Анализ клинических данных выявил возраст, индекс массы тела (ИМТ) и уровень С-реактивного белка (СРБ) как значимые предикторы ответа на лечение. Транскриптомный анализ выявил 1247 дифференциально экспрессируемых генов между пациентами, отреагировавшими на лечение, и пациентами без реакции на терапию, дополненных путями иммунного ответа и метаболизма. Среди протестированных алгоритмов ансамблевая модель на основе Extra Trees показала наилучшие результаты с площадью под кривой (AUC) 0,986, что значительно превосходит модели, использующие только клинические данные (AUC = 0,850) или только геномные данные (AUC = 0,820). Анализ важности признаков подтвердил, что СРБ, специфические генные признаки (такие как пути репарации ДНК и ответа на интерферон), возраст и ИМТ являются наиболее важными предикторами. Внешняя валидация подтвердила надежность модели (AUC=0,972).

ВЫВОД
В данном исследовании успешно разработана высокоточная прогностическая модель, интегрирующая клинические и геномные данные, способная к раннему выявлению пациентов высокого риска со слабой реакцией на лечение. Модель демонстрирует отличную прогностическую эффективность и способность к обобщению, предоставляя мощный инструмент для продвижения к персонализированной медицине в борьбе с туберкулезом, направляя индивидуализированные стратегии лечения для улучшения прогноза пациентов и контроля распространения лекарственной устойчивости.

Неофициальный перевод: АНО «Здоровье.ру» 2026.

Смотреть полный текст статьи в полный текст статьи в оригиналена сайте публикатора (на англ. языке).

Полные данные (заголовок, авторы, дата и источник публикации):
From clinical phenotypes to genomic signatures: machine learning integration for precision tuberculosis treatment prediction

Liping Li, Huanqing Liu, Qian Lei, Tingting Li

Frontiers in Bioinformatics, 3 Mar 2026; 6:1787360.

DOI: 10.3389/fbinf.2026.1787360

CLINICAL TRIAL REGISTRATION: https://www.chictr.org.cn/, ChiCTR2300074328, 03/08/2023.
PMCID: PMC12993280
PMID: 41852497
eCollection 2026.