Искусственный интеллект предлагает перспективные методы оценки здоровья эмбриона без инвазивных тестов

Искусственный интеллект предлагает перспективные методы оценки здоровья эмбриона без инвазивных тестов

Данный обзор рассматривает возможности ИИ в оценке здоровья эмбриона путем анализа изображений для прогнозирования хромосомных состояний без использования инвазивных методов, что может привести к усовершенствованию неинвазивного скрининга в процедурах ЭКО.


Исследование: Неинвазивное предсказание плоидности человеческого эмбриона с использованием искусственного интеллекта: систематический обзор и мета-анализ. Изображение предоставлено: Krakenimages.com / Shutterstock.com

Реклама

Как выявляется анеуплоидия эмбрионов?

Анеуплоидия эмбриона определяется как аномальное количество хромосом и является основной причиной неудачи имплантации, потери беременности и врожденных аномалий.

В процедурах экстракорпорального оплодотворения (ЭКО) частота анеуплоидии достигает от 25% до 40% на ранних стадиях развития эмбрионов, причем этот показатель увеличивается с возрастом матери. Хотя предимплантационное генетическое тестирование на анеуплоидию (PGT-A), являющееся биопсийной техникой, улучшает результаты ЭКО за счет определения плоидности эмбриона, оно является дорогим, инвазивным и ограничено этическими и правовыми соображениями, что ограничивает его доступность.

ИИ с помощью машинного и глубокого обучения демонстрирует потенциал в точном прогнозировании плоидности эмбрионов. Однако для повышения надежности прогнозов и клинической применимости этих методов необходимы дополнительные исследования.

Об исследовании

Текущее исследование зарегистрировано в Международном проспективном регистре систематических обзоров (PROSPERO) и следовало рекомендациям PRISMA и CHARMS по отчетности.

Обширные литературные поиски были проведены в базах данных PubMed, MEDLINE, Embase, IEEE, SCOPUS, Web of Science и Cochrane. В ходе поиска выявлены исследования, посвященные разработкам алгоритмов ИИ для оценки плоидности эмбриона на основе медицинских изображений.

Критерии поиска включали термины, связанные с ИИ, генетическим тестированием и хромосомными аномалиями. Подходящие исследования, опубликованные до 10 августа 2024 года, должны были содержать диагностические показатели, такие как чувствительность, специфичность, и предсказательные значения, или соответствующие данные 2×2.

Статьи были изучены двумя независимыми рецензентами, и в случае разногласий привлекался третий рецензент. Из анализа исключались исследования без моделей ИИ или использующие не человеческие образцы, дубликаты и различные типы публикаций, такие как редакционные статьи.

Данные извлекались двумя рецензентами с использованием стандартной формы для обеспечения точности. Диагностические показатели, такие как чувствительность и специфичность, рассчитывались из таблиц контингентности, когда это было возможно.

Оценка качества проводилась с использованием критериев QUADAS-AI, оценивались потенциальные ошибки и применимость, а все различия разрешались третьим рецензентом. Основные показатели, такие как чувствительность (Se), специфичность (Sp) и площадь под кривой (AUC), анализировались с помощью кривых ROC и двусторонной модели случайных эффектов.

Гетерогенность изучалась с помощью мета-регрессии, оценивая факторы, такие как тип алгоритма и географическое расположение. Воронкообразный график Дика оценивал предвзятость публикации, в то время как анализ подгрупп выявлял дополнительные источники гетерогенности, такие как тип модели ИИ, метод аннотации и риск предвзятости.

Результаты исследования

Первоначальный поиск выявил 4,774 записи, из которых 1,543 дубликата были удалены. После анализа заголовков и аннотаций исключено 2,837 исследований, оставив 65 для полного анализа текстов.

В конечном итоге 20 исследований соответствовали критериям включения, из них в 12 предоставлены достаточные данные для мета-анализа. Шестнадцать исследований были ретроспективными, два — проспективными с двойным слепым оцениванием моделей ИИ, и два — неопределённого дизайна. Ни одно из исследований не использовало общедоступные изображения, восемь исключили изображения низкого качества, а двенадцать не рассматривали этот фактор.

Внешняя валидация с неселекционными данными была проведена в семи исследованиях. Десять исследований использовали глубокое обучение (DL), пять использовали машинное обучение (ML), и пять применяли оба метода.

Системы поддержки решений на основе ИИ классифицировались на черный ящик, матовый и стеклянный ящик в четырех, пяти и пяти исследованиях соответственно. Четыре исследования использовали либо модели черного, либо матового ящика, в то время как два использовали модели либо матового, либо стеклянного ящика.

Обобщенная диагностическая эффективность алгоритмов ИИ показала чувствительность 0.67, специфичность 0.58 и AUC 0.67. Выбор таблиц контингентности с самой высокой точностью улучшил чувствительность и специфичность до 0.71 и 0.75 соответственно, с AUC 0.80. Анализ клинической полезности с использованием номограммы Fagan определил положительное предсказательное значение 71% и отрицательное предсказательное значение 75% при предположении 46%-ной распространенности эуплоидных эмбрионов.

Качество исследования оценивалось с помощью инструмента QUADAS-AI, который выявил высокий или неясный риск предвзятости в выборе пациентов в 19 исследованиях, главным образом из-за ограниченного доступа к данным из открытых источников и отсутствия тщательной внешней валидации. Анализ гетерогенности выявил значительные вариации с индексом несогласованности (I²) 97.7% для Se и 92.2% для Sp. Пороговый эффект способствовал данной гетерогенности из-за различий в диагностических порогах для эуплоидных эмбрионов.

Метарегрессия выявила факторы, влияющие на гетерогенность, включая тип алгоритма ИИ, категорию DSS, метод аннотации, внешняя валидация, риск предвзятости, возраст матери, размер выборки и год публикации. Se и Sp были отрицательно коррелированы, что часто наблюдается в исследованиях диагностической точности. Воронкообразный график Дика не показал доказательств предвзятости публикации.

Анализ подгрупп показал, что модели DL имели более высокий AUC, чем модели ML — 0.71 против 0.63 соответственно. Исследования, включившие как изображенные, так и клинические данные, показали улучшенные результаты с AUC 0.71 по сравнению с 0.62.

Внешняя валидация, низкий риск предвзятости, учет возраста матери, и большие объемы выборок положительно повлияли на результаты моделей. Новые исследования также были связаны с более высокой специфичностью и AUC, демонстрируя улучшение точности моделей ИИ со временем.

Выводы

Несмотря на широкое использование PGT-A для улучшения результатов беременности за счет выявления хромосомных аномалий, его инвазивность увеличивает риск некоторых осложнений, включая преэклампсию и предлежание плаценты, с ограниченной пользой на протяжении беременности или для показателей живорождения. Следовательно, важно развивать надежные и неинвазивные методы прогнозирования плоидности.

ИИ, уже используемый в различных клинических областях, имеет потенциал для поддержки оценки эмбрионов в вспомогательной репродукции. Однако, существующие модели ИИ для прогнозирования плоидности не обладают достаточной точностью для замены PGT-A и должны служить в качестве вспомогательных инструментов для выбора эмбрионов.

Источник: NewsMedical

Добавить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Будьте в курсе самых важных событий

Нажимая кнопку "Подписаться", вы подтверждаете, что ознакомились с нашими условиями и соглашаетесь с ними. Политика конфиденциальности и Условия использования
Реклама