Обложка статьи

Клинический биоинформатик: ищем причины болезней на уровне генов

Сидя в старших классах за подготовкой к ЕГЭ, я выписывал плюсы и минусы профессий и пытался рационально взвесить все «за» и «против». Рассматривал и биоинформатика. Атлас новых профессий обещал мне успех и прибыльность в клинической сфере к 2020 году. Однако, учась на биоинженера и занимаясь биоинформатикой в свободное время, так и не увидел ни одного такого специалиста. Появились ли клинические биоинформатики в 2020 году? Если да, где их найти и стоит ли идти на них учиться?

Такое определение клинического биоинформатика дает Атлас новых профессий:

«В случае нестандартного течения болезни [клинический биоинформатик] строит компьютерную модель биохимических процессов болезни, чтобы понять первопричины заболевания (выявляет нарушения на клеточном и субклеточном уровнях). На Западе эта специальность существует уже не первый год. Направлена она на то, чтобы по максимуму использовать весь багаж накопленной информации (генетической, биологической и медицинской). Это необходимо для подбора индивидуального метода лечения конкретному пациенту. Трансляционная медицина есть и в России. Специалисты прогнозируют появление большого количества рабочих мест в этой области».

Кто такой
Предпосылки к возникновению профессии «клинический биоинформатик» — большие объемы данных секвенирования ДНК и новые возможности эффективного поиска причин заболеваний в масштабах генома.

Ликбез

Секвенирование — определение последовательности мономеров (нуклеотидов или аминокислот) в цепочки биополимера (молекулы РНК, ДНК или белков).

Методы обработки статистических данных делят на первичные и вторичные. Первичная обработка нацелена на упорядочивание информации, группировку данных по тем или иным критериям.

Артефакты данных — закономерности в полученных после обработки данных, которые отсутствуют в исходных.

Пайплайны — это структурированный процесс разработки программного продукта.

Такой специалист должен одновременно хорошо разбираться в геномике, молекулярной биологии и той области биомедицинских наук, в которой работает. Например, генетика наследственных заболеваний или онкогенетика. Он должен владеть средствами анализа данных: прежде всего инструментами поиска информации о генетических вариантах и их аннотаций. Не менее важно хорошо знать молекулярную лабораторную «кухню», стоящую за методами секвенирования. Как минимум, чтобы выявлять в первичных данных артефакты и отличать их от истинных генетических изменений и разрабатывать новые методы анализа. Как ни странно, уметь программировать не всегда обязательно, если не планируете участвовать в написании программного обеспечения (ПО) и наладке пайплайнов первичной обработки информации.

Юрий Барбитов, исполняющий обязанности директора по науке Института биоинформатики:
— Для того чтобы соответствовать тому определению «клинического биоинформатика», которое дает Атлас профессий будущего, пока не хватает знаний и мощностей. В первую очередь это вопрос моделирования биологических процессов патологических механизмов. Сегодня мы можем это сделать, только сравнив полученные от здоровых и больных пациентов данные.

В отличие от биоинформатика общего профиля, клинический должен уметь работать с персональными данными. Помимо умения программировать на высокоуровневых языках и минимальной работы с командной строкой, будет полезно обучиться математическому моделированию и системной биологии. В частности специфическим алгоритмам построения математических систем: стохастических и на основе дифференциальных уравнений.

Где учат
Образовательных программ подготовки клинических биоинформатиков в России пока нет. Но по опыту руководителя Лаборатории Клинической Биоинформатики Федора Коновалова, «лучше всего для такой работы подходят выпускники биологических факультетов молекулярно-биологического, генетического профиля, биоинформатики с “биологической стороны” (ФББ МГУ). Хорошо себя показывают студенты медицинского факультета (ФФМ МГУ), где в ходе обучения дают большую фундаментальную научную базу и понимание, как устроен научный мир».

Юрий Барбитов:
— В рамках образовательных программ Института биоинформатики мы делаем акцент на актуальные практические задачи и востребованные научные проекты от ведущих организаций и частных компаний. Сейчас у нас нет специальных предметов по математическому моделированию. Но мы и не стараемся научить человека всему, чему можно. Поэтому, если появится спрос на биоинформатиков в клинической сфере в России, научные организации и клинические компании предложат нам такие проекты. Над ними смогут поработать студенты и получить необходимые навыки.

Импорт
Пять лет назад профессор Медицинской школы Стэнфордского университета Майкл Снайдер поставил над собой эксперимент. В течение 57 недель он отслеживал 40 000 показатель своего организма: анализировал молекулы ДНК, РНК, белков и метаболитов в крови. Данные восьми «омов»: микробиомы, генома, метаболома, эпигенома, транскриптома, протеома, цитокинома и антибодиома, — Майкл назвал «омиксным профилем». Такой тотальный контроль над телом позволил профессору обнаружить у себя склонность к диабету II типа. Изучая собственную биохимию, Майкл смог подобрать наиболее эффективную мишень для лекарственного препарата, поскольку классические формы лечения ему не помогали. Этот же принцип лежит в основе персонализированной терапии.

Омиксный профиль — неологизм, введенный научной группой Медицинской школы Стэнфордского университета. Включает в себя генетический анализ (геном), анализ человеческих микроорганизмов (микробиом), метаболитов (метаболом), расположенных на мембране клеток сигнальных молекул (цитокином) и содержащихся в крови антител (антибодиом). Также в омиксный профиль входит исследование влияния внешней среды (например, питания) на активность генов (эпигеном и транскриптом).

Сегодня лаборатория Майкла Снайдера занимается исследованием более 100 добровольцев, у многих из которых диагностировали признаки преддиабета. Для каждого участника сделали интегрированное профилирование персонального омикса (iPOP): исследователи обнаружили 49 влияющих на состояние здоровья отклонений и 12 генетических рисков. Среди них предраковые состояния, лимфома, сердечные проблемы и заболевания крови. Анализ генома одного из добровольцев показал, что он принимает лекарство, не приносящее ему пользу.

Члены лаборатории Снайдера создают и пайплайн для картирования генома и выявления генетических мутаций, лежащих в основе некоторых не диагностируемых болезней человека: связанных с работой иммунитета, задержкой развития, воспалением кишечника и прочие. В этом же исследовании команда изучает роль эпигенетики в развитии рака и аутизма.

Из менее экзотических примеров стоит упомянуть набирающий обороты онкологический анализ. Первые исследования в этой области появились еще 10 лет. Благодаря такому анализу на основе генетических данных можно подобрать персонализированную химиотерапию. Для этого нужно знать, какие факторы влияют на чувствительность или устойчивость к разным ее видам.

Юрий Барбитов:
— Если сравнивать развитие клинической биоинформатики за рубежом и в России, то мне кажется, за границей просто больше возможностей: более развита научная сфера и больше выделяемые ресурсов на ее развитие. Также на Западе уже накоплено достаточно данных, чтобы приступать к их интерпретации. В нашей стране я не вижу принципиальных преград для развития этой сферы.

Отечественное производство
В России есть десятки специалистов, занимающихся около-клинической биоинформатикой. Но эта область еще развивается по мере развития технологий секвенирования и моделирования. Данных становится все больше, их все дешевле получать, а потребность в анализе возрастает.

Юрий Барбитов:
— В России биоинформатики занимаются не моделированием процессов, а обработкой больших баз данных. В нашей стране под словосочетанием «клинический биоинформатик» чаще подразумевают специалиста, занимающегося поиском клинически важных мутаций для молекулярной диагностики наследственных заболеваний. Но моделированием этих процессов занимаются преимущественно научные лаборатории, а не реальные клиники.

Первопроходцы из Москвы
Московская Лаборатория Клинической Биоинформатики занимается геномной биоинформатикой: исследованием последовательностей ДНК, их возможной роли в развитии тяжелой патологии. Главных задач у Лаборатории две: помощь в обработке данных секвенирования ДНК с оценкой патогенности выявленных мутаций и написание ПО и проведение научных исследований для крупных лабораторий научного и научно-медицинского профиля.

Федор Коновалов, руководитель Лаборатории Клинической Биоинформатики:
— Есть неформальное определение биоинформатики: «работа с биологическими данными, не влезающими в Excel». В этом смысле наша область анализа — это совокупность всех литературных сведений о наследственных заболеваниях. При оценке патогенности той или иной мутации специалист обязан быстро найти о ней обоснованную информацию в литературе, к какому заболеванию она может приводить, какие есть доказательства этому. Так как наследственных заболеваний известно более шести тысяч, а возможных редких мутаций — число со многими нулями, такой поиск невозможно провести без специальных поисковых инструментов, баз данных и максимально автоматизированной аннотации. 

Но только человек способен убедиться в корректности и логичности критериев, собранных на основе отдельных описанных случаев, и однозначно понять тексты статей, написанных в разные годы разными стилями. В нашей области есть попытки полной автоматизации, однако такая система работает хуже, чем опытная команда клинических биоинформатиков. Задачу «софта» мы видим в том, чтобы помогать человеку делать работу предельно эффективно, но не заменять его, не теряя тем самым ценные качества специалиста.

Так будет или нет
Весной 2019 года Минобрнауки опубликовало федеральную научно-техническую программу развития генетических технологий до 2027 года. Планируется развить инструменты и базы данных в областях медицины, сельского хозяйства и биобезопасности.

На сайте кабинета министров указано, что программа подразумевает разработку «с помощью генетических технологий in vitro и in vivo моделей заболеваний человека, <...>, создание биоинформационных и генетических баз данных, создание не менее трех центров геномных исследований мирового уровня».

Реализация этой программы может создать спрос на клинического биоинформатика и дать необходимые кадровые места.

«Мегабайт» уже рассказывал о том, что Госдума опубликовала тендер на проведение исследований «Нормативное правовое регулирование использования вспомогательных репродуктивных технологий».

Ранее в серии мы обозревали профессии биоэтика, игромастера, медиаполицейского и молекулярного диетолога.

18 августа 2020

Еще почитать по теме

Обложка статьи
Летние каникулы биоинформатиков
Студенты и выпускники, которые увлекаются биоинформатикой, могут подать заявку на летнюю школу до 1 мая. Читайте комментарии участников прошлого года
Обложка статьи
Летние каникулы биоинформатиков
Студенты и выпускники, которые увлекаются биоинформатикой, могут подать заявку на летнюю школу до 1 мая. Читайте комментарии участников прошлого года