Для чего нужна биоинформатика

Профессия: биоинформатик

Научные исследования, решение прикладных задач и перспективы в будущем

Для чего нужна биоинформатика. Смотреть фото Для чего нужна биоинформатика. Смотреть картинку Для чего нужна биоинформатика. Картинка про Для чего нужна биоинформатика. Фото Для чего нужна биоинформатика

Для чего нужна биоинформатика. Смотреть фото Для чего нужна биоинформатика. Смотреть картинку Для чего нужна биоинформатика. Картинка про Для чего нужна биоинформатика. Фото Для чего нужна биоинформатика

Преподаватель курса биоинформатики в «Фоксфорде» Сергей Исаев рассказывает о своей профессии, карьерных перспективах и заработках молодого специалиста с дипломом биоинформатика.

От программирования к биологии

Я родился и учился в школе в Астрахани. До 9-го класса увлекался математикой и информатикой: участвовал в местных олимпиадах, самостоятельно изучил Python и пытался писать простенькие программы. Я очень не любил биологию в средних классах, однако в 9-м классе началось изучение молекулярной биологии, генетики и эволюции — и я понял, что это моё.

Я стал посвящать гораздо больше времени биологии и в какой-то момент начал заниматься в основном ей. Важной вехой стало участие в Школе молекулярной и теоретической биологии (ШМТБ). Здесь старшие школьники со всей России занимаются настоящими научными проектами под руководством действующих учёных. В школе я выбрал «сухую» (биоинформатическую) лабораторию Максима Имакаева, в которой занимались компьютерным моделированием диффузии хроматина. Тогда-то понял, что вместо того, чтобы выбирать что-то одно, я могу заняться сразу и биологией, и программированием.

Поступление в МГУ

В ШМТБ я прислушался к мнению преподавателей, прочитал отзывы в интернете и принял окончательное решение поступать на факультет биоинженерии и биоинформатики МГУ. Для поступления нужно было сдавать ЕГЭ по русскому языку, математике, химии, биологии и ДВИ по математике.

Для чего нужна биоинформатика. Смотреть фото Для чего нужна биоинформатика. Смотреть картинку Для чего нужна биоинформатика. Картинка про Для чего нужна биоинформатика. Фото Для чего нужна биоинформатика

Поступить было относительно непросто. Я самостоятельно занимался почти всё свободное от школы время, участвовал во Всероссийской олимпиаде школьников по биологии: диплом победителя или призёра гарантировал бы мне поступление. Но мне не хватило всего 0,2 балла до того, чтобы стать призёром на заключительном этапе. Пришлось поступать по результатам ЕГЭ.

Мне очень помогло наличие действительных дипломов нескольких олимпиад по химии, биологии и математике. Они принесли мне 100 баллов ЕГЭ по биологии и химии и 100 баллов ДВИ по математике. Всего получилось около 490 баллов — и я прошёл на бюджет. А вот в 2020 году ситуация с поступлением на факультет была сложнее — все бюджетные места были заняты призёрами и победителями ВсОШ, поэтому по ЕГЭ поступить было в принципе невозможно.

Чем занимается биоинформатик

Важно: под словом «биоинформатика» можно понимать разные вещи.

Во-первых, биоинформатика — это один из методов проведения фундаментальных биологических исследований. Например, с помощью алгоритмов можно определить, каким образом общаются злокачественные клетки рака с соседними клетками, или понять эволюцию группы организмов. Выбор методов и подходов зависит от поставленной цели. Задача биоинформатика — получить данные, изучить их и понять, какую информацию и с помощью каких алгоритмов можно из этих данных извлечь. Чтобы работать в этом направлении, нужно очень хорошо разбираться в какой-то конкретной области биологии.

Во-вторых, биоинформатика — это одно из направлений компьютерных наук. Есть биоинформатики, которые создают алгоритмы и разрабатывают пакеты программ для анализа данных. Здесь важно хорошо понимать фундаментальную математику и алгоритмы.

И в-третьих, биоинформатика — это метод решения прикладных задач в биотехнологической и медицинской индустрии. Например, с помощью анализа данных пациентам можно точнее назначать лекарство при разных заболеваниях. Для этого в медицинских и биотехнологических компаниях в штат нанимают биоинформатиков. Здесь для успешной карьеры не обязательно глубоко разбираться в каком-то конкретном домене биологии, достаточно быть компетентным в своей области — базовой молекулярной биологии и data science.

Чем я занимаюсь сейчас

Сейчас я учусь на 6-м курсе факультета биоинженерии и биоинформатики МГУ. Параллельно с учёбой с 3-го курса работаю в Институте проблем передачи информации РАН в лаборатории Юрия Валентиновича Панчина.

Я безумно благодарен судьбе, что попал к нему в лабораторию: это один из самых важных людей в моей академической карьере. Сложно переоценить, какую поддержку он мне оказывал в течение всей совместной работы. Сначала я был стажёром-исследователем, а потом стал исполняющим обязанности младшего научного сотрудника. В этой лаборатории я занимался в основном сравнительной геномикой различных беспозвоночных животных.

Также с 5-го курса я работаю в компании BostonGene, которая занимается исследованиями в области рака и разрабатывает систему для индивидуальной терапии пациентов на основе генетических анализов. Я занимаюсь исследованиями в отделе молекулярной онкологии.

Ещё одна сторона моей деятельности — преподавание. Курс по биоинформатике я начал вести в 2018 году — сначала в школе № 57, потом в школе «Летово». За это время удалось сделать неплохую программу, и вот с 2020 года веду курс биоинформатики и в «Фоксфорде». Мне очень нравится преподавать.

Это возможность общаться с людьми, рассказывать ребятам что-то новое, о чём они не прочитают в интернете, а также самому развиваться в профессии. Любая информация лучше укладывается в голове, когда её объясняешь другим.

Качества и навыки, которые нужны биоинформатику

Любознательность

В этой профессии очень важно обладать тягой к познанию, изучению нового, быть открытым новым методам. Биоинформатика очень быстро развивается, методы устаревают буквально на глазах за несколько лет — нужно быть в тренде, стремиться попробовать что-то новое.

Целеустремлённость

Чтобы сделать успешную карьеру, требуется приложить большие усилия, и тут очень важно не бросить на полпути, уметь поставить и достичь цель, проявлять усердие и терпение.

Математика

В биоинформатику не стоит идти, если пугает математика и математические методы. Математика необходима, чтобы разбираться в статистике, анализе данных, методах машинного обучения.

Аналитическое мышление

Биоинформатик постоянно имеет дело с анализом информации. Он должен уметь обобщать, отделять главное от второстепенного, группировать данные по категориям, устанавливать причины и следствия.

Английский язык

Это язык современной науки, на нём проходят конференции, публикуются статьи, книги, исследования. В программировании и IT тоже не обойтись без английского языка, так что биоинформатику свободный английский особенно важен.

Карьера и зарплата

Карьерная лестница, зарплата и перспективы зависят в том числе от того, какую из двух сторон профессии выбрать: научные исследования или решение прикладных задач.

В науке можно пройти путь от аспиранта до доктора наук и директора собственной лаборатории, сделать открытие и даже получить Нобелевскую премию. Однако на первых порах зарплата вряд ли будет высокой. Сейчас наука во многом существует за счёт грантов. Если вы даже аспирантом попадёте в хорошую лабораторию, которая занимается актуальными исследованиями, то сможете зарабатывать и 70 тысяч рублей в месяц. А можете попасть в неудачную лабораторию и зарабатывать намного меньше.

В индустрии вы начнёте с места джуниора в отделе компании, где перед вами будут ставить конкретные задачи, но по мере освоения профессии, нарабатывая опыт, можете стать, например, директором отдела компьютерных исследований. Биотехнологических компаний на рынке сейчас намного больше, чем 10 лет назад. Это молодая развивающаяся сфера, которая связана со здоровьем человека, так что новые рабочие места будут появляться. Зарплата начинающего биоинформатика в Москве колеблется от 60 до 80 тысяч рублей, ну а дальше можно зарабатывать и больше — карьерный рост тут устроен примерно так же, как и в других IT-компаниях.

Смежные сферы, куда можно пойти работать с образованием биоинформатика

Биоинженерия. Специальность на факультете называется «биоинженерия и биоинформатика», там дают знания в области молекулярной биологии, генетики, и теоретически можно пойти работать в эти сферы.

IT. Вы получите обширные знания в области компьютерных наук и анализа данных и сможете полностью уйти в эту сферу без привязки к биологии.

Медицинская статистика. Статистика — составная часть анализа данных, и если умеете одно — сможете и другое.

Где учиться на биоинформатика

Университеты с направлением «Биоинженерия и биоинформатика»:

Также биоинформатике обучают на таких направлениях, как «Биотехнические системы и технологии» (Уральский федеральный университет им. Б.Н. Ельцина), «Биомедицинские технические системы» (МГТУ им. Н.Э. Баумана), «Биотехнические и медицинские аппараты и системы» (МАИ, Национальный исследовательский университет «МЭИ», СПбГЭТУ «ЛЭТИ», Санкт-Петербургский государственный университет аэрокосмического приборостроения).

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter

Источник

Подкаст: кто такие биоинформатики и что они изучают

В новый выпуск подкаста «Сушите вёсла» зашёл руководитель научной группы Института биоинформатики Юрий Барбитов. Обсудили профессию биоинформатика и всё вокруг неё: чем похожа на Data Science, почему полезна для человечества и как продвигает науку. Запись выпуска внутри статьи.

«Сушите вёсла» — подкаст про разработку, аналитику, тестирование и всё, что связано с созданием IT-продуктов. Его ведут разработчики red_mad_robot Артём Кулаков и Рома Чорыев. В эпизоде #16 обсудили, что происходит, когда информатика пересекается с биологией, и Юрий Барбитов попробовал объяснить нам простыми словами про геном, секвенирование и «мокрых биологов».

Ниже подкаст и ответы на несколько горячих вопросов про биоинформатику.

1:50 — как попасть в биоинформатику;

10:20 — чем похожа на Data Science;

23:35 — как развивается биоинформатика и почему она важна;

40:00 — про платформы Folding at Home, World Community Grid;

1:05:09 — проблемы с хранилищами данных;

Юрий считает, что у каждого специалиста своё представление о том, что это за область науки. Но герою выпуска ближе такое определение — биоинформатики придумывают, как обрабатывать большие массивы биологических данных, чтобы получить из них конкретные научные результаты.

Эта дисциплина немного похожа на эксперименты в биологии, когда учёный в лаборатории проводит опыты, занимается исследованиями и получает результаты. По словам Юрия, его коллеги называют это «мокрой биологией».

«Мокрый биолог» делает в лаборатории разные манипуляции с живыми клетками, потом куда-то их засевает, пересевает, смешивает растворы. Человек, который занимается биоинформатикой, — dry biologist («сухой биолог»). Он, как и все программисты, выполняет рутинные задачи — пишет программы, скрипты, а потом их запускает. Отличие в том, что работа биоинформатика похожа на работу дата-сайентиста. Нужно не только написать, как обработать входные данные, и получить из них что-то. Ещё надо придумать, как всё это дело применить и как интерпретировать полученные результаты.

Впервые биоинформатику применили, когда люди начали заниматься геномом — это набор молекул ДНК с наследственной информацией. Геном есть у всех живых существ — от бактерий до людей. Если прочитать его и узнать всё про наследственную информацию, человечество научится исправлять наследственные ошибки, подбирать новые методы терапии и т.д.

Проблема в том, что наследственная информация очень большая — это очень длинный текст. Геном человека состоит из трёх миллиардов символов. Чтобы с ним правильно работать, его нужно для начала расшифровать.

Представьте, что у вас была пачка газет и её сначала взорвали, а потом нужно попытаться этот «пазл» составить обратно, собрать исходную газетную страницу из разорванных кусочков. Примерно так работает прочитывание генетических текстов.

В основе расшифровки генома — метод секвенирования. Это прочитывание, восстановление последовательности. Биолог берёт длинную цепочку символов генома и «разрезает» на небольшие кусочки. Затем использует секвенаторы (молекулярно-биологические приборы) — они помогают реконструировать последовательность символов в каждом кусочке. Секвенатор выдаёт набор прочитанных последовательностей — они и станут исходными данными для биоинформатики.

Если совсем на мой рабоче-крестьянский уровень опуститься, секвенатор — это такой специальный биологический компьютер. Мы в него что-то капаем, а он нам на экране буковки показывает.

Это наука на стыке двух областей — биологии и информатики. Поэтому в неё приходят программисты и биологи. Наш гость пришёл со стороны биологии. Поступил в СПбГУ на биофак, работал на кафедре, специализировался на генетике. Параллельно слушал онлайн-курсы по программированию, а потом узнал про биоинформатику.

В какой-то момент коллеги сказали: «Раз тебе это так интересно, то лучше просто получить дополнительное образование по биоинформатике». Так я и попал в Институт биоинформатики.

По словам Юрия, биоинформатика развивается очень активно, потому что для биологии и медицины уже недостаточно описательных исследований. Нужно проанализировать всё то, что человечество открыло за это время.

Практически всё, что можно было описать, уже описано. В последние 50 лет биология перешла на уровень, когда нужно не просто описать, как выглядит зверушка, где она обитает и что делает. Биология хочет знать, как это всё работает. Она пытается понять, как устроены живые организмы.

Необязательно. Прочитать геном одного человека стоит около тысячи долларов. Современные приборы позволяют читать геномы нескольких десятков человек. Но биоинформатика — это довольно хрупкая наука. Если «мокрый биолог» допустил ошибку в лаборатории или реагент изначально оказался некачественным, всё исследование нужно будет проводить заново. Из-за этого увеличится и бюджет, конечно же.

Многие исследования времязатратные. Ты долго-долго растил какую-то культуру раковых клеток и что-то с ними хотел сделать. А потом кто-нибудь пришел и не вытер ноги при входе в лабораторию или не надел халат правильно. Что-то попало в твою культуру, и всё сдохло.

№1 — колоссальные объёмы данных. Один прочитанный геном человека — это 100 гигабайт данных. Представьте, что вам нужно секвенировать сотни геномов.

В Великобритании люди пытаются отсеквенировать геномы всех новорожденных в течение кучи лет. Понятно, что это уже миллионы отдельных образцов, миллионы прочитанных геномов. И каждый, соответственно, по 100 гигабайт сырых данных. Это начинает уходить в космос по части объёма информации.

Данных уже так много, а найти эффективный метод для проверки гипотезы очень сложно. Учёные работали по-разному, получили разные результаты — и вся эта информация лежит в разных местах. Ну и как итог — собрать её из разных работ от разных людей очень непросто. Это может быть очень затратно и по времени, и по финансам.

№2 — биоинформатический софт. Некоторые часто используемые программы активно разрабатывают и улучшают, но они заточены под стандартные задачи.

С таким программами можно работать. Но если задача хотя бы чуть-чуть является нестандартной и люди пишут какие-то новые инструменты, разрабатывают новые алгоритмы для решения какой-то менее популярной задачи, получается софт в ужасном состоянии.

Например, вижу статью про «десять биоинформатических инструментов», которые помогают решить конкретную какую-то задачу. Наверное, восемь из десяти программ уже не работают. Потому что человек удалил свой репозиторий на GitHub или вообще залил софт на какой-то, прости господи, SourceForge, где он и погиб. Так что либо софта вообще нет, либо его невозможно скомпилировать без длительного и больного исправления всех багов, которые автор туда внёс.

Юрий подробно рассказал, чему обучаться, чтобы попасть в биоинформатику. Послушайте, начиная с 1:15:00. Если вкратце — обучение недорогое, но долгое. Предложений на рынке мало, но на крутых спецов спрос всегда есть. Нужно самому искать проекты и задачи, предлагать помощь и обрастать контактами.

Если прямо фокусироваться на том, чтобы войти в область полноценно и с перспективой, обучение потребует больших временных инвестиций. Но это вполне может стать парт-тайм работой на 20 часов в неделю минимум.

«Закон есть закон»: как жить в юридическом мире, если ты из айти.

Источник

Великий секвенатор: кто такие биоинформатики и что они изучают

В новый выпуск подкаста «Сушите вёсла» зашёл руководитель научной группы Института биоинформатики Юрий Барбитов. Обсудили профессию биоинформатика и всё вокруг неё: чем похожа на Data Science, почему полезна для человечества и как продвигает науку.

Для чего нужна биоинформатика. Смотреть фото Для чего нужна биоинформатика. Смотреть картинку Для чего нужна биоинформатика. Картинка про Для чего нужна биоинформатика. Фото Для чего нужна биоинформатика

«Сушите вёсла» — подкаст про разработку, аналитику, тестирование и всё, что связано с созданием IT-продуктов. Его ведут разработчики red_mad_robot Артём Кулаков и Рома Чорыев. В эпизоде #16 обсудили, что происходит, когда информатика пересекается с биологией, и Юрий Барбитов попробовал объяснить нам простыми словами про геном, секвенирование и «мокрых биологов».

Ниже подкаст и ответы на несколько горячих вопросов про биоинформатику.

Тайминг

1:50 — как попасть в биоинформатику;

4:30 — что такое биоинформатика;

10:20 — чем похожа на data science;

17:02 — секвенатор и секвенирование;

23:35 — как развивается биоинформатика и почему она важна;

29:30 — риски в работе с данными и в лабораториях;

35:17 — стоимость биоинформатических исследований;

40.00 — про платформы Folding at Home, World Community Grid;

50:25 — проблема с массивами данных в биоинформатике;

55:15 — в каком состоянии находится биоинформатический софт;

1:00:50 — где хранятся данные;

1:05:09 — проблемы с хранилищами данных;

1:15:00 — как обучиться на биоинформатика.

Что такое биоинформатика

Юрий считает, что у каждого специалиста своё представление о том, что это за область науки. Но герою выпуска ближе такое определение — биоинформатики придумывают, как обрабатывать большие массивы биологических данных, чтобы получить из них конкретные научные результаты.

Эта дисциплина немного похожа на эксперименты в биологии, когда учёный в лаборатории проводит опыты, занимается исследованиями и получает результаты. По словам Юрия, его коллеги называют это «мокрой биологией».

«Мокрый биолог» делает в лаборатории разные манипуляции с живыми клетками, потом куда-то их засевает, пересевает, смешивает растворы. Человек, который занимается биоинформатикой, — dry biologist («сухой биолог»). Он, как и все программисты, выполняет рутинные задачи — пишет программы, скрипты, а потом их запускает. Отличие в том, что работа биоинформатика похожа на работу дата-сайентиста. Нужно не только написать, как обработать входные данные, и получить из них что-то. Ещё надо придумать, как всё это дело применить и как интерпретировать полученные результаты.

С какими данными работает биоинформатик

Впервые биоинформатику применили, когда люди начали заниматься геномом — это набор молекул ДНК с наследственной информацией. Геном есть у всех живых существ — от бактерий до людей. Если прочитать его и узнать всё про наследственную информацию, человечество научится исправлять наследственные ошибки, подбирать новые методы терапии и т.д.

Проблема в том, что наследственная информация очень большая — это очень длинный текст. Геном человека состоит из трёх миллиардов символов. Чтобы с ним правильно работать, его нужно для начала расшифровать.

Для чего нужна биоинформатика. Смотреть фото Для чего нужна биоинформатика. Смотреть картинку Для чего нужна биоинформатика. Картинка про Для чего нужна биоинформатика. Фото Для чего нужна биоинформатика

Юрий Барбитов

руководитель научной группы Института биоинформатики

Представьте, что у вас была пачка газет и её сначала взорвали, а потом нужно попытаться этот «пазл» составить обратно, собрать исходную газетную страницу из разорванных кусочков. Примерно так работает прочитывание генетических текстов.

В основе расшифровки генома — метод секвенирования. Это прочитывание, восстановление последовательности. Биолог берёт длинную цепочку символов генома и «разрезает» на небольшие кусочки. Затем использует секвенаторы (молекулярно-биологические приборы) — они помогают реконструировать последовательность символов в каждом кусочке. Секвенатор выдаёт набор прочитанных последовательностей — они и станут исходными данными для биоинформатики.

Для чего нужна биоинформатика. Смотреть фото Для чего нужна биоинформатика. Смотреть картинку Для чего нужна биоинформатика. Картинка про Для чего нужна биоинформатика. Фото Для чего нужна биоинформатика

Артём Кулаков

архитектор специальных проектов red_mad_robot

Если совсем на мой рабоче-крестьянский уровень опуститься, секвенатор — это такой специальный биологический компьютер. Мы в него что-то капаем, а он нам на экране буковки показывает.

Кто попадает в биоинформатику — биологи или айтишники

Это наука на стыке двух областей — биологии и информатики. Поэтому в неё приходят программисты и биологи. Наш гость пришёл со стороны биологии. Поступил в СПбГУ на биофак, работал на кафедре, специализировался на генетике. Параллельно слушал онлайн-курсы по программированию, а потом узнал про биоинформатику.

В какой-то момент коллеги сказали: «Раз тебе это так интересно, то лучше просто получить дополнительное образование по биоинформатике». Так я и попал в Институт биоинформатики.

Почему недостаточно описательной биологии и где искать лекарство от рака

По словам Юрия, биоинформатика развивается очень активно, потому что для биологии и медицины уже недостаточно описательных исследований. Нужно проанализировать всё то, что человечество открыло за это время.

Практически всё, что можно было описать, уже описано. В последние 50 лет биология перешла на уровень, когда нужно не просто описать, как выглядит зверушка, где она обитает и что делает. Биология хочет знать, как это всё работает. Она пытается понять, как устроены живые организмы.

Исследования в биоинформатики — это дорого?

Необязательно. Прочитать геном одного человека стоит около тысячи долларов. Современные приборы позволяют читать геномы нескольких десятков человек. Но биоинформатика — это довольно хрупкая наука. Если «мокрый биолог» допустил ошибку в лаборатории или реагент изначально оказался некачественным, всё исследование нужно будет проводить заново. Из-за этого увеличится и бюджет, конечно же.

Многие исследования времязатратные. Ты долго-долго растил какую-то культуру раковых клеток и что-то с ними хотел сделать. А потом кто-нибудь пришел и не вытер ноги при входе в лабораторию или не надел халат правильно. Что-то попало в твою культуру, и всё сдохло.

О проблемах в профессии

#1 — колоссальные объёмы данных. Один прочитанный геном человека — это 100 гигабайт данных. Представьте, что вам нужно секвенировать сотни геномов.

В Великобритании люди пытаются отсеквенировать геномы всех новорожденных в течение кучи лет. Понятно, что это уже миллионы отдельных образцов, миллионы прочитанных геномов. И каждый, соответственно, по 100 гигабайт сырых данных. Это начинает уходить в космос по части объёма информации.

Данных уже так много, а найти эффективный метод для проверки гипотезы очень сложно. Учёные работали по-разному, получили разные результаты — и вся эта информация лежит в разных местах. Ну и как итог — собрать её из разных работ от разных людей очень непросто. Это может быть очень затратно и по времени, и по финансам.

#2 — биоинформатический софт. Некоторые часто используемые программы активно разрабатывают и улучшают, но они заточены под стандартные задачи.

С таким программами можно работать. Но если задача хотя бы чуть-чуть является нестандартной и люди пишут какие-то новые инструменты, разрабатывают новые алгоритмы для решения какой-то менее популярной задачи, получается софт в ужасном состоянии.

Например, вижу статью про «десять биоинформатических инструментов», которые помогают решить конкретную какую-то задачу. Наверное, восемь из десяти программ уже не работают. Потому что человек удалил свой репозиторий на GitHub или вообще залил софт на какой-то, прости господи, SourceForge, где он и погиб. Так что либо софта вообще нет, либо его невозможно скомпилировать без длительного и больного исправления всех багов, которые автор туда внёс.

Как обучиться на биоинформатика и где искать работу

Юрий подробно рассказал, чему обучаться, чтобы попасть в биоинформатику. Послушайте, начиная с 1:15:00. Если вкратце — обучение недорогое, но долгое. Предложений на рынке мало, но на крутых спецов спрос всегда есть. Нужно самому искать проекты и задачи, предлагать помощь и обрастать контактами.

Если прямо фокусироваться на том, чтобы войти в область полноценно и с перспективой, обучение потребует больших временных инвестиций. Но это вполне может стать парт-тайм работой на 20 часов в неделю минимум.

Полезные материалы

Онлайн-курсы на Stepik (для тех, кто не имеет бэкграунда в биологии):

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *