Сергей Шитяков и Михаил Носоновский | Новый алгоритм. Молекула белка. Химия, биология и IT на стыке.

Сергей Шитяков — профессор-исследователь, доктор медицинских наук, ведущий научный сотрудник лаборатории хемоинформатики НОЦ Инфохимии Университета ИТМО.

Михаил Носоновский — профессор отделения механики Висконсинского университета, лидер группы трибоинформатики НОЦ Инфохимии Университета ИТМО.

В этом видео наши гости рассказывают о разработанном ими новом методе в инфохимии, который они назвали RetroFold/Ретрофолд. Он позволяет делать попытки предсказания свёрнутой и развёрнутой форм протеинов.

Расшифровка видео
0:00
Итак всем Добрый день продолжаем научную тематику и она становится все наиболее
0:06
наиболее научный потому что в гостях у нас два профессора профессор носоновский
0:12
добрый день Здравствуйте профессор шитиков Здравствуйте Сейчас я уйду из
0:18
кадра и мы оставим наших профессоров в кадре они сами будут вещать кое-что что
0:24
люди будут узнавать я иногда буду что-то из за кадра возможно выкрикивать и
0:30
профессора уважаемые люди которые представляют университет ИТМО сами себе все расскажут я скажу только следующее
0:36
что Тема У нас сегодняшняя будет химия и находимся Мы в школе экспресс это онлайн-образование с 1 по 11 класс
0:43
поступление в институты подготовка к ЕГЭ но специальным форматом Когда вы можете
0:49
готовиться по каким-то специальным программам которые разрабатывают для вас в школе экспресс учителя можете учиться
0:56
удаленно приходить сдавать экзамены и так далее благодарим очередной раз в школу экспресс за возможность здесь
1:02
сниматься и продолжаем наши беседы Итак я продолжаю быть голосом за кадром и Для
1:09
начала я попрошу уважаемых профессоров представиться еще раз и рассказать Кто
1:15
вы и чем вы все-таки занимаетесь Сергей Ну спасибо за приглашение мне очень
1:23
приятно сегодня поприсутствовать таком формате и
1:29
рассказать о том чем мы занимаемся вместе с профессором сомовским меня
1:34
зовут Сергей шитиков и я работаю в тьму университет но отдел тема информатики
1:44
наверное вот что касается того чем я занимаюсь Ну а если быть
1:51
в таком более крупном масштабе что мы делаем Это химия
1:57
Органическая химия неорганическая хи медицинская химия
2:02
биологическая химия биотехнология создания новых лекарственных веществ или
2:09
как мы говорим драг-дизайн а также биотриба трибоинформатика и вот что
2:16
касается моих исследований Я занимаюсь такими биомедицинскими исследованиями
2:22
применением всех высшей изложенных наук в таком биомедицинском масштабе Меня
2:30
зовут Михаил носановский и я вообще по основному своему месту работы а
2:35
профессор в Америке в университете сервис консина город Милуоки но последние два с лишним года я стал очень
2:43
активно сотрудничать с университетом этмо и попал на их программу которая
2:49
предназначена для иностранных ученых для привлечения иностранных ученых к работе
2:55
которая подразумевает проводить в Петербурге в году что я вот собственно и делал
3:03
последние уже вот третий год я летом сюда приезжаю также приезжаю зимой на
3:09
месяц на зимние каникулы один раз весной приезжал и собственно вот весь следующий
3:14
год я собираюсь тут находиться потому что у меня по основному месту работы мой так называемый собачий колгот Когда я
3:20
могу путешествовать Ну и как-то бывать в других университетах в любой точке мира занимаюсь я в основном должен сказать
3:28
что я отнюдь не Химик совсем не Химик Ни с какой стороны мое образование вообще механика прикладная математика и
3:35
занимаюсь я вообще разными вопросами связанными с науками о поверхностях в
3:40
частности трения адгезия то есть прилипание поверхностей разные явления которые происходят на
3:47
интерфейсе на границе между твердой материалом и жидкостью на поверхности
3:53
жидкости это капельки пузырьки и другой круг явлений который
3:59
традиционно изучает физическая химия поверхностей То есть это область имеет отношение к химии Ну и
4:07
Кроме того я давно уже занимаюсь изучением трения изучение трения научный термин
4:14
трибология от слова трибос тереть название этой дисциплины и это
4:19
дисциплина меж дисциплинарная Она включает и физику поверхности химию
4:25
поверхностей и материаловедения то есть она перекликается с темами
4:31
перекликается с химией И в частности последние пару лет я развиваю нового
4:37
только появляющегося область которая называется либо информатика То есть это соединение трибологии изучение трения и
4:45
информатики различных новых методов машинного обучения которая бурно
4:52
развиваются в самые последние годы Дело в том что трение такое явление очень который очень трудно
5:00
описать теоретически из какого-то Единого общего принципа там много данных вот когда у вас много данных то найти в
5:07
них какой-то порядок корреляция как раз помогают вот эти новомодные методы
5:12
машинного обучения и искусственного интеллекта отсюда идея требуя Информатики и мы были одной из первых
5:18
групп которая стала ее развивать И в частности здесь в этом при центре инфо-химии тоже Мы
5:26
развиваем группу tribby информатики ряд исследований Ну наш сегодняшний разговор
5:31
будет не столько о науке О поверхностях сколько о приложении э разных э методов
5:38
использующихся в этой области к вопросу биологии молекулярной биологии того в
5:45
чём специалист как раз Сергей Дело в том что так получилось что когда я сюда приехал и Сергей Сюда Тоже приехал из
5:51
Германии в какой-то момент так получилось что мы э находимся в одном по
5:57
соседству и постоянно говорим на эти темы и у нас постепенно стали возникать идеи каких-то совместных работ и вот
6:05
несколько таких совместных работ у нас уже получилось Сергей в этом случае он очень хорошо
6:12
умеет считать рассчитывать молекулы что с ними происходит молекулярную динамику как
6:19
молекула взаимодействуют друг с другом что можно применять для допустим разработки лекарств
6:27
я стараюсь использовать какие-то математические методы с прикладной
6:33
математики связанные со скайлингом связанные с описанием того что происходит на поверхности симметрии и
6:40
других тем то есть это вот такое самое общее введение что чем мы
6:46
собственно занимаемся и о чем мы собрались сегодня говорить от себя скажу что очень приятно что Россия объединяет
6:54
Сергей США ой Сергея из Германии и Михаила из США Вот такой вот у нас
7:00
получается Каламбур Надеюсь зритель оценит Итак давайте перейдем тогда
7:06
непосредственно к сути того о чем сейчас мы будем говорить пожалуйста введите нас
7:12
в какой-то контекст желательно какими-то аналогиями которые были бы понятны
7:18
простому смертному вот такому человеку как я который не разбирается в вопросах биологии программирования искусственного
7:25
интеллекта и так далее Ну наверное как Уже все знают есть такое алгоритм который называется чат gpt он
7:34
очень нашумевший и конечно же мы тоже используем алгоритмы машинного обучения
7:40
в наших исследованиях вот если говорить про хема информатику то такие алгоритмы
7:46
очень помогают нам анализировать большие базы данных молекул если вот взять
7:53
какую-то базу данных код который мы сейчас анализируем она относительно небольшая это где-то 5000 молекул но
8:00
вообще на сегодняшний день есть базы данных соединений небольших органических
8:06
соединений которые включают в себя миллионы молекул вот чтобы эффективно
8:13
проводить исследования в области создания новых лекарств или поиску
8:19
каких-то ингибиторов ионных каналов и так далее То требуется очень эффективный алгоритмы
8:26
в том числе алгоритмы машинного обучения которые могут находить эти молекулы вот
8:31
здесь может какая-то аналогия есть сейчас там gpt когда используется тоже нейронные сети и
8:39
чат gpt находит какие-то паттерны в том массиве информации языковом который уже
8:46
есть уже накоплен в интернете здесь может быть есть какая-то аналогия мы
8:53
используем модели для поиска мо в химическом пространстве которое
8:59
называется Space Так называемая а чат gpt он ищет тоже паттерна ищет какие-то аналогии в
9:07
пространстве которые состоят из слов из информации вот есть какая-то информация массив информации и находят какие-то
9:16
паттерны скорее всего возможно объединить
9:21
тоже те же подходы которые используют gpt Потому что те же молекулы можно
9:28
конвертировать какие-то такие вот
9:33
скажем так паттерны но не паттерны а цепочки
9:40
информации которые могут быть обработаны чатом gpt вот мы пока не думали над этим
9:46
но скорее всего эта идея существует и вот здесь мы пытаемся применить
9:54
методологию которая используется в 3-бай информатики различные методы например
10:01
энтропия Воронова вот профессор насоновский Может рассказать в чем же заключается
10:10
эта методология Но более конкретно мы говорим сейчас о такой проблеме которая
10:16
связана со сворачиванием белков Так называемым фолдингом значит белки это конечно Строительная молекулы железные
10:23
строительные молекулы клетки и Вот я например не биолог как я говорил для
10:29
меня это задача Когда впервые они задумался она мне показалось очень интересной потому что в ДНК
10:36
структура белка зашифрованной линейно в виде текста то есть ДНК это по сути текст в какой-то момент она превращается
10:44
она прочитывается в клетке превращается в белок который должен свернуться строго определенным образом И в этот момент вот
10:51
он получает свои свойства свою функциональность То есть это некая он представляет собой некоторое
10:58
соотношение между текстом и физическим объектом со своими уникальными свойствами поэтому сам этот процесс
11:04
свертки белка он необычен он интересен он очень сложен свертку белка трудно
11:11
рассчитать Существует множество алгоритмов которые могут это делать так
11:16
или иначе Например я знаменитый алгоритм который Ну вот пару лет назад год назад
11:21
стал очень популярным так называемый альфа-фолт разработанный Google ну
11:27
какой-то компании связанные с Гуглом рядом компании Вы же решили попробовать пойти по другому пути и свертка белка А
11:34
есть также развертка молекулы когда она из клубка превращается в цепь допустим
11:39
Когда вы повышаете температуру и с одной стороны есть некоторая асимметрия между
11:44
тем что происходит когда у вас Линейная молекула сворачивается в клубок и когда
11:49
клубок разворачивается обратно с одной стороны есть некоторые симметрия Но это симметрия не полная в частности а
11:57
разворот молекулы анфолдинг развертку посчитать гораздо легче она происходит быстрее требует меньше ресурсов чем
12:05
свертка но свертка как бы важнее ее важно Ну знать понимать что там
12:10
происходит и по сути вот та статья о которой идет речь Мы решили использовать
12:17
расчет развертки белка для того чтобы понять что происходит при его свертки
12:23
поскольку посчитать это гораздо легче в сто раз быстрее происходит этот процесс сто раз меньше вычислительных ресурсов
12:30
он требует но во многом он близок с точки зрения физики к процессу свертки
12:36
Вот это собственно такая Центральная идея той статьи одной из тех статей
12:41
которую мы написали здесь вместе с Сергеем и опубликовали
12:47
в журнале королевского общества британском журнале достаточно престижно
12:53
значит это статья написана Ну и вот это один из примеров того что
13:00
мы делали Я бы хотел здесь дополнить что вот мы разработали такой новый метод
13:07
который пока еще никто не разрабатывал до нас и мы назвали его ретро Fold вот
13:14
такой метод он дает нам возможности предсказывать или возможность попытки
13:20
предсказания протеинов как развернутая форма протеинов так и свернутая форма
13:26
протеинов и вот гипотеза такая что когда у нас протеин развернут мы можем зная
13:33
эту информацию Мы можем каким-то образом предсказать свёрнутую форму протеина
13:39
здесь мы использовали подход молекулярной динамики которые есть имеет
13:45
свои преимущества и недостатки недостатки конечно же у него в том плане
13:52
что когда идёт молекулярная динамика то процесс стохастический вы генерируется конформации которые ну
14:01
скажем имеют рандомизированное вращение происходит
14:06
рандомизированное вращение торсионных углов и это дает нам скажем так
14:13
различные конформации в траектории Я бы тут назвал это как такой недостаток
14:18
потому что очень сложно Сложно если мы будем использовать этот алгоритм
14:26
для генерации конформации всякий раз у нас будут разные конформации генерироваться разные конформации но с
14:33
другой стороны этот процесс дает нам исследование процесса фолдинга и
14:38
анфолдинга в динамике что На мой взгляд является преимуществом если мы возьмем
14:44
всеми известные алгоритм альфа-фолта здесь у нас идет предсказание уже по такой
14:51
стационарной структуре и мы не можем смотреть процесс в динамике динамичный
14:56
процесс Почему нам важно знать когда белок свернут развернут Почему мы хотим
15:01
это предсказывать Каким образом это выглядит возможно можно нарисовать какие-то понятные схемы для наглядности
15:08
потому что конечно без подготовки можно только примерно так отдаленно
15:13
Представлять что же это такое ну если сказать про фолдинг про фолдинг белков то конечно же
15:21
холдинг является краеугольная краеугольная проблема или королю краеугольным камнем Что такое фолдинг
15:28
фолдинг это свертка белка вот если по-русски То есть это
15:33
трехмерная структура белка когда он начинает выполнять свою функцию я думаю
15:39
тут нужно начать разговор с того что белков существуют много тысяч в
15:45
организме например в человеческом организме и каждый из них имеет уникального последовательность состоит
15:52
из уникальной последовательности аминокислот это последовательность она заши ДНК То есть как работает наша она
16:00
ДНК ДНК ДНК представляет собой вот эту двойную
16:06
спираль где зашифрована Ну каждый Ген зашифрованный Гены геном Но каждый Ген
16:13
представляет собой один белок дальше происходит известные процессы
16:19
транскрипции трансляция ДНК и в результате в какой-то момент Ну я не
16:25
знаю может быть вы как микробиолог Может лучше про это рассказать в результате в какой-то момент
16:31
Они превращаются в последовательность из
16:38
аминокислот и изначально Это после этого это развернутая структура так называемая
16:46
Первичная структура То есть это Первичная структура дальше поскольку Все это происходит
16:51
вводной среде для такой молекулы развернутой для нее энергетически выгодно свернуться обычно в нормальной
16:59
ситуации При нормальной температуре есть так называемая вторичная структура белка
17:04
когда там образуют определенные спирали Альфа спирали бета листы
17:13
некие строительные блоки вот она сворачивается на не полностью образует некие строительные блоки и наконец есть
17:20
троичная структура когда молекула полностью свернута в некие сложные клубок и этот глубоко уникальный то есть
17:27
вот изначально последовательность аминокислот она полностью определяет то во что молекула
17:36
свернется её свернутая форму и именно в этой свёрнутой форме молекула выполняет
17:41
свою функцию в организме она может там допустим соединяться с другими белками может проникать в клетку воздействовать
17:48
на какие-то рецепторы Почему все возможные функции в организме
17:55
они в основном осуществляются белками то есть белки это такой строительный
18:01
материал организма А вот эта свертка из первичной структуры в нативного
18:06
третичного структуру которая обладает нужной функциональностью это процесс
18:11
очень важный очень интересный до конца непонятно как он происходит Почему собственно всегда получается одна и та
18:19
же структура Каким образом происходит это свёркость промоделировать ее довольно сложно понять как
18:27
Что произойдет с исходной последовательностью аминокислот Во что она превратится после холдинга после
18:33
свертки довольно сложно в компьютере рассчитать и вот это одна из таких больших задач которые заняты
18:39
молекулярная биология рассчитать фолдинг то есть свертку белка
18:46
для чего это нужно может быть Сергей расскажет да то есть я могу добавить еще
18:52
есть четвертичная структура Когда у нас имеются так называемые Да у нас имеется
18:59
белки но мономеры то есть и они объединяются уже более сложную
19:04
конструкцию в комплексе так называемые протеиновые комплексы вот если
19:11
привести пример такого комплекса то я могу привести пример
19:17
вирус иммунодефицита вот есть такая молекула которая называется протеаза и
19:23
Она состоит вот из таких мономеров которые объединяются в демеры и вот эти
19:28
демеры Они как раз такие образуют белок который имеет функцию
19:35
которая имеет каталитическую функцию всем понятно протеза Ну я сейчас объясню
19:41
протезы значит он расщепляет молекулы белка вот такой интересный белок есть у
19:48
вируса и если если бы мы рассматривали его как мономер то этот белок был бы не
19:53
активен А так как он Демир или состоит из двух частей он обладает
19:59
каталитической функцией каталитическую функцию значит этот белок
20:04
расщепляет определенные участки аминоки аминокислотные
20:11
последовательности в других Белках условно говоря есть какой-то аминокислотная последовательность это
20:17
белок есть какие-то участки которые распознаются
20:23
протезы вируса иммунодефицита и расщепляются и происходит фрагментация
20:28
фрагментация белков если вкратце определяет Что такое каталитическая
20:36
функция белков Ну я уже упомянул что мы изучали наш нашу модель на очень
20:43
маленьком белке который называется Trip Case он состоит из небольшого количества
20:48
аминокисло и его очень легко использовать как такую пилотную модель для изучения холдинга анфолдинга то есть
20:56
свертки развертки вот здесь нарисована Вот такая модель которая может быть также характерна для
21:03
tripcatch дальше через какое-то время он преобразуется этот белок вот в Такую трехмерную форму которую можно
21:11
[музыка] отмоделировать используя молекулярно динамические
21:18
методология можно сказать что холдинг это переход от линейной структуры глобулярная это фолдинг А В некоторых
21:26
случаях у вас происходит противоположные процессы Например если вы повышаете температуру Когда у вас там всё закипает
21:32
да у вас происходит анфолдинг или денатурация
21:40
и это процесс В каком-то смысле Они они
21:45
противоположны но они не совсем симметричные И в частности разработка белка происходит гораздо
21:51
быстрее чем его свертка потому что свертка происходит постепенно На релаксирует пока не превратится вот в
21:57
такую глобулу или клубок а развертка обычно происходит Ну как разрушение
22:02
быстрый процесс соответственно посчитать промежуточные стадии при разворачивании
22:09
при анфолдинге значительно легче вычислительно чем при холдинге Вот это
22:15
такая Центральная идея этой работы а затем мы действительно применили к
22:20
короткому модельному белку очень короткому который называется
22:29
а там всего Пару десятков аминокислот соответственно Можно даже с ограниченными ресурсами посчитать и
22:36
посмотреть как происходит и свертка и развертка и сравнить эти процессы и
22:42
дальше оказалось что они происходят Ну немного по-разному в том смысле что свертка скорее у вас по экспоненте
22:50
затухает развертка более или менее линейно происходит это в общем типично для любой самосборки и разрушения вообще
22:58
сама сборка более фундаментальная такой процесс который происходит в разных
23:03
ситуациях физики в химии и свертку можно считать одним из проявлений самосборки
23:12
разворачивание оно похоже на разрушение на какое-то быстрое разрушение структуры
23:18
которая у вас была и соответственно свертка происходит постепенно затухающей
23:27
скоростью развертка происходит быстро линейно и нужно определенная математическое преобразование для того
23:32
чтобы сопоставить одно с другим и вот собственно это преобразование мы
23:38
предложили и протестировали его на модельном примере короткого белка
23:45
называемого трипкейдж А в чем заключается самом математическое
23:50
преобразование То есть это написание каких-то алгоритмов Каким образом вот это вот химия или биология переходит в
23:57
математику Ну физически здесь от времени у вас затухания происходят пропорционально
24:03
экспоненте со знаком минус но там какая-то Константа и время да а здесь у
24:10
вас разворачивание происходит линейно то есть некая Константа и время
24:16
соответственно вам нужно преобразование которое по сути некая логарифмическая преобразование с точки зрения математики
24:23
которая сопоставит одно время с другим то есть идея тут в том что недостаточно просто поменять знак Так сказать
24:31
запустить время в обратную сторону это недостаточно То есть если вы представите себе например какой-нибудь там не знаю
24:38
фильм до запущенный в обратном например вы разбиваете стакан Да и снимаете это
24:43
на пленку на видео а затем запускаете в обратном направлении Ну это будет неправдоподобно всегда потому что само
24:51
сборка и разрушение они всегда происходят в разном масштабе времени и
24:56
вот для этого и нужно такое математическое преобразование которое сопоставит одно с другим а дальше
25:04
соответственно мы можем уже используя наши вычислительные данные вычислительные симуляция молекулярную
25:10
динамику мы можем это преобразование применить и сравнить эти два процесса То
25:16
есть это базовая математика линейный процесс привести к экспоненциальному и так Ну если очень
25:23
упрощенно то можно сказать тогда а дальше что за этим стоит написание каких-то программ симуляции программных
25:30
сред каким происходит образом вычисления сами Ну вообще да то есть если нам
25:36
удастся решить проблемы которые имеются в этом подходе вот я уже сказал что при
25:44
использовании молекулярной динамика информация они будут всегда разные и нам
25:49
нужно анализировать э тысячи десятки тысяч этих информации То есть
25:55
когда идёт идёт молекулярная динамика то белок он
26:00
изменяет свою свою как бы ну
26:07
поверхность и то есть из линейного переходит от глобулярную и Для этого нам
26:14
нужно проанализировать десятки тысяч этих информации то есть вот в этом
26:20
случае если мы хотим написать программное обеспечение возможно опять же поможет метод машинного обучения
26:27
когда мы возьмем модель натренируем ее на вот эту конформационную
26:34
конформационную матрицу и дальше проанализируем с использованием отхолдинга и анфолдинга и посмотрим если
26:42
нам это удастся то тогда мы сможем уже более точно предсказывать здесь вот был
26:48
использован такой математический подход для того чтобы сравнить энергии здесь мы
26:55
сравнивали По большой части энергии и нам удалось эти энергии сравнить и
27:00
показать что вот энергии холдинга и энергии отхолдинга они каким-то образом
27:06
коррелируют в на графике И тем самым возможно
27:12
из анфолдинга получить энергии холдинга и наоборот что-то в этом роде потому что
27:19
конечно же основная такая функция которая здесь бралась эта энергия
27:26
энергия белка предлагаю нарисовать какие-то графики чтобы не говорить о
27:31
функциях и об энергиях на пальцах я точно не воспроизведу график который с
27:37
нашей статье но один из графиков когда мы посчитали но Сергей этим занимался
27:42
посчитали разворачивание белка трипкейдж
27:48
энергия там ну экспоненциально убывала в некотором смысле здесь у нас время здесь
27:54
у нас допустим энергия здесь 0 а затем то же самое было посчитано для
28:03
свертки и было применено Вот это преобразование ну и соответственно у нас получились Точки которые более или менее
28:10
соответствовали там в пределах 10 процентов графика более или менее совпадали
28:16
опять-таки Если вы преобразуете здесь преобразуете время определенным образом
28:22
логарифмическим допустим образом то у вас это превратится в какую-то линейную функцию про эту работу можно еще сказать
28:30
что это фактически это некий первый шаг То есть я бы не преувеличивал здесь не говорил что мы там разработали алгоритм
28:36
далеки еще от того чтобы там запатентовать алгоритм что-то такое сделать мы просто попробовали как этот
28:43
алгоритм работают его мы назвали ретро Fold по аналогии с альфа-фолда
28:48
может быть такая амбициозная аналогия потому что альфа-фолт это конечно алгоритм придуманы огромным
28:55
коллективом людей Гуглом ретро Fold само это слово ретро оно
29:01
основано на идее ретро синтеза в химии когда
29:07
рассматривают синтез органических веществ но в обратном направлении то
29:13
есть восстанавливают по продукту реакции восстанавливают исходное реагенты то
29:20
есть вот слово ретро оно такое здесь имеет значение соответственно мы назвали этот подход ретро Fold мы его фактически
29:28
просчитали Ну вот для короткой молекулы Ну и дальше его При желании можно развивать и можно сделать один из
29:36
алгоритмов для быстрого упрощенного расчета фолдинга что было бы достаточно
29:43
важным поскольку Холдинг в целом большая задача сотни групп там по всему миру
29:50
работают над Как можно более точным расчетом фолдинга белковых молекул
29:55
почему такое количество групп занимается вот этой проблемой что она дает То есть
30:01
если говорить уже в таком глобальном общем философском смысле то есть что именно все эти научные коллективы ищут
30:08
вообще все эти научные коллективы ищут
30:13
возможность предсказания предсказание по сути дела
30:21
чтобы реконструкция структуры структуры свёрнутой структуры протеина которая
30:27
может выполнять ту или иную функцию То есть как мы уже сказали если протеин
30:33
свернут он начинает Выполнять ту или иную функцию в клетке и эти функции все
30:39
все функции которые у нас имеются вот клетка выполняет какие-то
30:45
функции все эти функции они естественно выполняются белками чтобы мы не брали
30:51
если мы хотим лечить какое-то какие-то заболевания если вот мы хотим лечить рак или мы хотим лечить
30:58
предположим болезнь Альцгеймера или мы хотим лечить вирусы иммунодефицита спит вирусы
31:05
иммунодефицита человека Или тот же ковид то мы должны понимать какие протеины мы
31:13
должны использовать и эти протеины должны быть в таком свернутом состоянии
31:19
То есть если у нас будет информация протеинах вот виде такой цепочки Она нам ничего не даст и мы не
31:25
сможем предположим использовать ее для создания новых лекарственных веществ Но это дальше уже по аналогии с дизайном
31:34
лекарственных веществ которым я занимаюсь что нам дает вообще структура протеина То есть протеине если он
31:41
свернут есть определенные карманы так называемые участки связывания которые
31:47
как раз таки являются участками для связывания с лекарственными веществами
31:53
вот эти карманы они появляются только тогда когда у нас протеин в таком Находится в таком
32:00
свернутом состоянии поэтому все эти научные группы они пытаются предсказать
32:05
наличие карманов наличие каких-то участков Как мы называем доменов определенных доменов которые играют
32:13
функцию переносчиков энергии Или например
32:18
они распознают определенные участки ДНК и выполняет функцию там репликации
32:26
молекулы ДНК и так далее То есть все практически все функции клетки они
32:32
выполняются вот при свернутыми свернутыми белками Вот это и есть основа
32:38
вообще основа жизни на земле если так уже
32:43
говорить о эволюции да то есть эволюция она движимо белками вообще эволюция
32:49
эволюция белков мы рассматриваем сейчас Если на молекулярный уровень выходить то
32:54
вообще те молекулы которые эволюционируют у нас это белки если брать органические молекулы они не
33:01
эволюционирует они вот как были миллионы лет назад если взять какой-то
33:06
предположим неорганическое соединение меламинца Мы изучаем мелами
33:15
создаем какие-то наночастицы если мы возьмём меламинца Не эволюционирует а
33:21
если мы возьмем белок вот Trip Catch и посмотрим через миллион лет он будет другой потому что эволюционирует вот эти
33:29
особенности изучение эволюции изучения функции белков а не напрямую связаны как
33:35
раз таки с холдингом или со сворачиванием протеинов то есть вся эволюция всего живого вообще которая
33:43
населяет нашу планету это эволюция как раз таки если брать молекулярную уровень
33:51
эволюции белков А вот вы говорите про алгоритм и создание алгоритма и Мы
33:56
начинали еще до начала записи говорить о машинном обучении так глобально то есть
34:01
Верно ли мое предположение о том что возможно что вы можете создать какой-то
34:07
алгоритм который будет выдавать на выходе молекулы белка с определенными заданными
34:15
параметрами Как вы говорите нужен карман в какой-то области или нужны домены в
34:20
определенных сетях и мы чтобы получить нужную молекулу белка для например нового
34:26
какого-нибудь там лекарственного там средства и так далее То есть Верно ли моё такое предположение что этот
34:34
алгоритм может существовать но оно части верно если мы возьмем какую-то последовательность и мы хотим создать
34:41
какой-то синтетический белок мы можем условно говоря
34:46
подвергнуть этот синтетической белок на предмет сворачивания фолдинга и
34:52
попытаемся понять дальше какие есть элементы у этого белка где имеются
34:58
карманы но я сейчас вот обобщаю ваш вопрос Какие участки отвечают за те или
35:05
иные функции этого Белка и вот такой в принципе такой белок в принципе может быть также подвергнут изучению
35:11
подвергнут таком фолдингу используя наша наш
35:16
алгоритм но опять же наш алгоритм еще сегодня сегодняшний день он больше в
35:23
таком математическом представленном математическом виде то есть некий некая
35:29
такая концепция как такового алгоритма Нет Есть есть возможности наверное
35:35
создания как я это вижу если Мы попытаемся интегрировать нашу систему в
35:41
машинное обучение то возможно мы нам удастся создать некий алгоритм который
35:47
будет предсказывать протеины холдинг протеинов на основании анфолдинга вот что-то в этом роде Но
35:55
пока это вопрос будущего я могу дополнить еще
36:01
сказав что сама вот это идея связи между линейной структурой популярной структуры
36:07
меня она постоянно завораживает Эта мысль потому что каждому белку соответствует один Ген в
36:14
ДНК это Ген и Ген превращается в белок в линейный белок Дальше он состоит из 20
36:20
Амино вот это как алфавит из 20 букв Да их 20 букв и вот эта последовательность
36:26
аминокислот это текст значит текст Вы можете копировать во много раз вас остается тот же самый текст Да он не
36:33
материален это текст И вот в тот момент когда он свертывается и превращается в
36:38
эту материальную структуру со своими функциями он фактически обретая Ну вот в этот
36:46
трехмерную структуру физически так сказать молекула которая взаимодействует определенным образом с другими
36:52
молекулами по своим правилам Значит вот в этот момент происходит некий переход
36:57
От текста к материи меня эта идея завораживает в принципе это то почему я
37:03
собственно заинтересовался Этой темой изначально из таких философских немножко
37:09
так сказать побуждение и Кроме того здесь еще идея самосборки и идея
37:15
разрушения значит само сборка имеет место очень часто особенно В биологии не только в биологии она на Химия имеет
37:22
место в механике очень часто у вас самоорганизуются какие-то структуры путем самосборки с другой стороны все
37:30
разрушается есть второе начало термодинамики энтропия повышается то есть вот для меня как для физика тоже
37:36
очень интересно понять соотношение между этими процессами и нельзя просто
37:41
обернуть время да и разрушение представить как само сборку
37:46
они текут по-разному между ними много общего Но много и различий И вот так
37:52
сказать понять что общая и что различается когда мы говорим о самосборке и о разрушении
37:59
вот это одна из так сказать мотивация которая Ну вот собственно благодаря за
38:06
который я заинтересовался вот этой темой а практически Конечно есть надежда что может быть можно на основе этой идеи
38:14
разработать новый алгоритм Когда вы считаете разборку молекулы получается
38:20
определенно Почему шуточное состояние которое она проходит посчитать это можно
38:25
быстро Это примерно в сто раз быстрее чем свертка и затем гипотеза что при
38:32
сверстке молекула тоже проходят те же самые промежуточные состояния и вам не нужно рассчитывать свертку чтобы узнать
38:39
вот эти промежуточные состояния То есть вы можете более эффективным образом их
38:45
рассчитывать используя вот эту идею асимметрия между холдингом и анфолдингом
38:51
или если говорить более глобально с точки зрения физики асимметрия между самосборкой и разрушением А вот вы
38:59
сказали что когда молекула находится в состоянии развёрнутом это больше информации А когда значит происходит
39:07
этот процесс тогда она происходит но превращается в молекулы конечно это тоже это не совсем точно это тоже ДНК это
39:13
текст Да как бы генетическая информация она хранится в виде текста Вот когда она у вас в ДНК еще Да это по сути текст
39:21
который копируются там много раз когда клетка воспроизводится которая передается как бы во время эволюции но
39:29
благодаря эволюции там как-то изменяется то есть наше наследственная информация
39:34
она хранится в виде текста по сути она ведет себя как текст Она имеет свойство
39:40
текста математические свойства можно почитать там энтропию вероятность разная характеристики то есть с ней можно
39:47
работать как с текстом она копируется то есть не важен конкретный так сказать экземпляр текста Когда у вас есть
39:53
какое-то слово да оно одно и то же слово корова Один раз
40:00
второй раз то же самое слово тот же самый текст вот в этом смысле она идеальна это так сказать как символ или
40:07
как текст конечно конкретная молекула когда она превращается уже в молекула белка когда
40:14
нуклеотиды ДНК уже заменяются аминокислотами но это уже конечно не текст это развёрнутая молекула и дальше
40:20
действуют определенные силы так называемые гидрофобные силы которые сворачивают эту молекулу каждый раз
40:27
уникальным образом каждый раз одним и тем же уникальным образом что тоже по-своему очень необычно Почему
40:33
собственно одна и та же Линейная молекула должна свернуться каждый раз уникальным образом вот собственно это
40:40
такая получается Если я правильно понял одним и тем же уникальным образом то
40:46
есть как сколько раз мне повторим эту операцию мы получим из развернутой всегда одну и ту же сторону это по сути
40:53
самый сборка она происходит благодаря так называемым гидрофобным силам это так
40:59
называемая энтропиная сила с точки зрения физики они связаны с тем что
41:05
молекула пытается увеличить свою энтропию хаоса находятся в некой среде водной среде и вот из взаимодействия
41:12
аминокислот с молекулами воды которые пытаются увеличить свой хаос фактически
41:18
это ну вероятностный процесс повыша энтропию этой молекулы в той среде в
41:25
которой она находится он приводит к тому что она сворачивается именно определенным образом а если поставленные
41:33
опыты то есть по вот этим вашим моделям когда мы что-то в колбе можем увидеть Ну
41:40
конечно есть уже опыт и есть модели экспериментальные модели вот тот белок
41:47
который мы использовали это Экспериментальная модель кристаллографическая модель которая
41:52
которую экспериментально получили с
41:58
использованием методов кристаллографии и эта модель использовалась как
42:03
референтная модель для того чтобы проводить такие такие эксперименты с
42:10
использованием нашего алгоритма и попытаться понять правильно Мы провели наш эксперимент или нет но я хочу еще
42:18
сказать что здесь конечно же частный случай Да вот этого белка Вот мы сейчас говорим folding and folding это Идет
42:25
сюда это идет это идет туда все Все хорошо Все выглядит довольно таки просто
42:31
действует гидрофобные силы Все сворачивается на самом деле в клетке на
42:36
все намного сложнее в реальности Да вот если взять какую-то даже молекулу протеина то иногда Даже несмотря на то
42:44
что действует гидрофобные силы Но вот взять молекулу какую-то белка К ней подходит другая молекула белка так
42:51
называемый шапирон и помогает ей свернуться то есть иногда белки
42:57
взаимодействуют друг с другом вот как люди мы с вами общаемся и делимся
43:02
информацией в живой клетке белки тоже иногда встречаются и начинают делиться
43:09
своей информацией они взаимодействуют определенными сайтами и один белок
43:15
помогает другому белку обрести свою функциональную полно ценность если можно
43:21
так выразиться и вот этот процесс тоже он очень интересный он здесь конечно же
43:28
не может быть изучен потому что здесь уже идет белковое взаимодействие вот которое приводит кожухолдингу то есть на
43:35
самом деле фолдинг он довольно таки разнообразный мы не можем иногда от физические параметры с использованием
43:43
физических параметров рассчитать молекулу Это намного сложно но это вот я
43:48
сейчас привел такой казуистический случай что живые системы они иногда
43:55
работают не так как думают физики физика Все просто из гидрофобные Силы которые
44:00
которые действуют происходит такая сворачивание и все просто на самом деле
44:06
в живой системе не все так просто есть вот такие интересные феномены А куда
44:12
будет дальше развиваться Ваша работа то есть Какой у вас дальнейший план что вы планируете получать там допустим через
44:19
пол года год или там допустим в масштабах там несколько нескольких лет
44:24
если говорить про этот проект то в дальнейшем Как я вижу вообще проблемы
44:30
фолдинга и вот если мы упомянем Альфа в том что есть определенные участки
44:36
протеина вот если нарисовать такие вот структуры которые называется
44:49
это такие домены и здесь имеются определенные лупы вот лупану петли
44:54
своего рода и вот эти петли они очень нестабильные и на сегодняшний день нет
45:00
алгоритмов которые бы хорошо предсказывали вот состояние вот этих петель потому что они очень подвижны И
45:07
как это эти петли располагаются в таком свернутом состоянии тоже это
45:14
Загадка На сегодняшний день и никто еще в мире не смог решить проблему
45:19
расположения этих петель это очень важно то есть как я вижу дальше наш проект мы
45:26
бы смогли заняться вот расположение попытаться решить проблему как же все-таки петли могут быть ориентированы
45:34
в пространстве для каких-то видов протеинов и так далее другой проект Как
45:39
я вижу Можно наверное попытаться понять как же все-таки
45:45
работает наш алгорит на более протеинов вот мы здесь взяли такой простой протеин
45:52
А есть разные протеины например глобулярные фибриллярные протеины
45:57
которые по своему состоянию более сложные у них есть различные домены
46:04
которые тоже иногда важно учитывать в фолдинге и вот здесь мы бы применили
46:09
такой алгоритм для других протеинов это Это следующий вариант другие варианты возможно наверное все-таки и
46:17
использовать какие-то протеины более сложные например демеры вот как здесь я показал это вирус иммунодефицита
46:24
человека протеза его и как как эти демеры могут образовываться как мономеры
46:30
могут образовываться в демеры тоже было бы интересно возможно потому что мы здесь используем молекулярную динамику
46:37
можно использовать также и демерные молекулы которые бы
46:42
формировали вот такой полноценный Михаил Ну в принципе надо сказать что
46:50
это не какой-то регулярный проект это в общем один из
46:55
многих таких небольших побочных проектов которым мы занялись Но вот благодаря тому что у нас такой неформальное
47:02
взаимодействие здесь в этом происходит то есть у нас нету скажем какого-то
47:08
Гранта большого на этот проект Но дальше совершенно понятно куда его можно развивать Конечно можно применять
47:14
пытаться применять и смотреть что происходит применять этот метод к разным
47:20
типам белков более сложным белкам То есть тут большие возможности для
47:25
развития есть но как бы вот интересно сторона этого проекта что он в общем
47:32
такой неформальный он возникло просто из нашего интереса из энтузиазма это не
47:37
была часть какой-то большой работы какого-то большого Гранта А есть
47:45
вероятность того что этот проект коммерция уйдет то есть для кого он может быть коммерчески интересней то
47:52
есть теоретически Я думаю что как любой алгоритм как любой метод Можно конечно запатентовать вот эту идею вроде бы
47:59
никто до нас не пытался то есть холдинг считают очень многие анфолдинг или
48:05
денатурация тоже считают но гораздо реже вот как бы сопоставить одно с другим и
48:12
заменить одно с другим это идею Как ни странно до нас никто не предложил и
48:18
конечно в такой ситуации можно подумать может быть и о регистрации патента да И
48:24
о каких-то таких вещах на алгоритм то есть возможность такая есть Ну и так
48:30
сказать Пойдем ли мы в этом направлении или нет зависит от разных там соображения от того что в принципе мы
48:36
будем делать да в ближайшее время я имею ввиду в промышленности где-то предприятие которое бы захотели кто
48:42
хотел бы купить этот алгоритм воспользоваться Ну вот Кто пользуется Ну вообще да вообще что касается
48:50
алгоритмов для предсказания холдинга белков это прежде всего Фарм компании
48:56
это синтетические биологи которые
49:01
изучают и создают новые протеины вот я еще занимаюсь синтетическая биологией У
49:08
нас есть лаборатория синтетическая биология вёрстбурге где мы создаем новые протеины мы мутируем протеины и пытаемся
49:16
понять какой будет фолдинг этих протеинов на сегодняшний день у нас есть проект где мы пытаемся понять как если
49:25
мы мутируем протеины тем или иным способом как это будет влиять на фолдинг
49:30
и на функцию данных протеинов вот такой проект Здесь очень важно понять
49:37
предсказать перед тем как делать какой-то эксперимент предсказать фолдинг протеина
49:43
потому что еще раз можно подчеркнуть что фолдин с помощью коррелируется стабильностью протеина потому что это
49:51
структура она стабильная здесь есть гидрофобные связи которые стабилизируют
49:56
прежде всего стабилизирует протеины как мы говорим еще как мы
50:02
говорим мы в эволюционном смысле они эволюционно стабильный консервативны вот
50:09
эти домены которые образуют такую красивую структуру трехмерную они очень
50:16
консервативны тем домены которые сейчас говорил и они вот формируют вот этот вот
50:23
этот такой трехмерный трехмерную геометрию протеина и вот здесь
50:29
важно понять как как вот эти 3 как вот эти домены взаимодействуют друг с другом
50:36
если они подвержены мутациям потому что протеины в результате эволюции мутирует
50:42
накапливаются мутации эти мутации могут полезны это могут быть вредны Я как
50:48
человек который занимается мутациями могу вам сказать Вот что мы сейчас ведем
50:53
проект по лечению Рака и создаем лекарственные вещества и мы пытаемся
50:59
Понять насколько мутации определенные мутации в протеинах приводят к
51:06
изменениям этих протеинов с учетом взаимодействия с лекарствами и это
51:12
нетривиальный вопрос я бы сказал для фарм компании это основной вопрос по ним
51:17
в понимании Каким образом это лекарство будет работать в будущем
51:23
если суммировать эти алгоритмы находят приложения в разработке новых лекарств в
51:30
ускорение методов изобретения разработки новых лекарств Что называется Drag Discovery конечно Фарма это очень
51:37
большая индустрия там большие деньги и в общем это бурно развивающаяся область
51:42
если возможно у вас какие-то какие-то еще слова которые нужно произнести
51:49
относительно вот этой темы вот этой работы можно сказать еще о том что Это мультидисциплинарная работа я еще раз
51:56
могу подчеркнуть что Ну я скорее физик и механик по своему первому образованию но
52:02
методы физики и прикладной математики очень хорошо работают в применении к
52:10
биохимии к молекулярной биологии к области медицины к области разработки лекарств и
52:18
там есть множество интересных задач и для успешного развития этих областей конечно нужно сотрудничество разных
52:25
специалистов и вот это то что происходит у нас центре инфа химии в этом благодаря
52:30
этому центру благодаря нашему директору Екатерине Владимировне скорб мы
52:36
познакомились Сергеем и в частности сделали эту работу
52:42
У нас сейчас три совместных статьи ну две вот уже опубликованы третье в работе то есть я хотел бы подчеркнуть важность
52:50
и пользу сотрудничества специалистов разных областях в данном случае я ну
52:56
условно говоря физик А Сергей изначально врач и молекулярный геолог как
53:04
биоинформация тема информация Я бы хотел добавить что вот этот проект Ну на мой
53:09
взгляд носит такой фронтирный характер потому что здесь мы На острие так скажем
53:15
основных проблем в науке которые на сегодняшний день есть то есть вот фолдинг молекулярный фонд это такая
53:22
основная проблема И за неё даже присужден нобелевское премии кто решит
53:28
проблему молекулярного фолдинга это лауреат Нобелевской премии в будущем я
53:35
бы так охарактеризовал с другой стороны сейчас в России требуется прорывы в
53:43
области синтетической биологии и машинного интеллекта машинного обучения
53:50
что как раз таки и являет собой наш проект и Мы надеемся что в будущем с
53:57
привлечением инвестиций нам удастся расширить его создать полноценный
54:02
алгоритм и помочь ученым и врачам эффективно лечить и
54:10
онкологические заболевания и создавать новые молекулы которых не было в природе для
54:17
нужд промышленности и медицины Я думаю на
54:23
этом мы сегодня и завершим эту встречу от себя еще раз передаю привет Екатерине
54:29
скорбь Екатерина скорб тот человек благодаря которому в нашем
54:35
проекте небольшом научно-популярном тоже происходит вот эти все неожиданные цепочки знакомств Сергеем с Миха теперь
54:43
вот поэтому Екатерине скорбь Я думаю что будет приятно что ее каждый раз
54:49
благодарят за те действия которые она совершают во благо науки и во благо
54:55
знакомству большому количеству людей на сегодня все Спасибо вам огромное за
55:02
встречу за то что вы пришли Надеюсь что мы еще поговорим дальше о науке о химии
55:07
о математике о физике и так далее Большое спасибо спасибо

Поделиться: