Новая модель ИИ предсказывает экспрессию генов в различных типах человеческих клеток.

Новая модель ИИ предсказывает экспрессию генов в различных типах человеческих клеток. Новая модель ИИ предсказывает экспрессию генов в различных типах человеческих клеток.

Резюме:
Исследовательская группа из Института рака Дана-Фарбер, совместно с Институтом Броуда при Массачусетском технологическом институте и Гарварде, Google и Колумбийским университетом, разработала модель искусственного интеллекта, способную предсказать, какие гены экспрессируются в различных типах человеческих клеток. Эта модель, получившая название EpiBERT, была вдохновлена BERT — глубокой обучающей моделью, созданной для понимания и генерации текстов на естественном языке.

Описание модели:
EpiBERT тренировали на данных сотен типов человеческих клеток в нескольких фазах. В модель помещали геномную последовательность длиной в 3 миллиарда пар оснований, а также карты доступности хроматина, которые показывают, какие из этих последовательностей разворачиваются из хромосомы и считываются клеткой. Изначально модель обучалась выявлять взаимосвязь между последовательностью ДНК и доступностью хроматина в определённых фрагментах генома для конкретного типа клеток. Затем, основываясь на этих знаниях, она предсказывала, какие гены активны в такой клетке. Модель успешно идентифицировала регуляторные элементы — части генома, распознаваемые факторами транскрипции, и их влияние на генную экспрессию во множестве типов клеток. EpiBERT формирует «грамматику», которая является как обобщаемой, так и предсказуемой. Этот процесс схож с тем, как большие языковые модели, подобные ChatGPT, обучаются создавать осмысленные предложения и абзацы. Модель EpiBERT способна обрабатывать доступность и предсказывать функциональные основания, а также уровень РНК-экспрессии для неизвестного ранее типа клеток.

Реклама

Значимость:
В каждой клетке организма содержится одинаковая последовательность генома, поэтому различия между двумя типами клеток заключаются не в генах, а в том, какие из них активируются, когда и в какой степени. Примерно 20% генома кодирует регуляторные элементы, которые определяют активацию генов, но о расположении этих кодов, их составе и влиянии мутаций на функцию клетки известно немного. EpiBERT поможет пролить свет на механизмы регуляции генов в клетках, а также на то, как нарушения в этой системе могут приводить к заболеваниям, таким как рак.

Финансирование:
Работа финансировалась Институтом Броуда, Фондом Novo Nordisk, Национальным институтом геномных исследований, Исследовательским фондом по борьбе с раком Шарфа и Грина, Семьёй Ричарда и Нэнси Лубин и Американским онкологическим обществом. Доступ и поддержка процессоров TPU предоставлены компанией Google.

Источник: NewsMedical

Добавить комментарий

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Будьте в курсе самых важных событий

Нажимая кнопку "Подписаться", вы подтверждаете, что ознакомились с нашими условиями и соглашаетесь с ними. Политика конфиденциальности и Условия использования
Реклама