Нейросети решили сложнейшую биоинформатическую головоломку Константин
есть такой популярный спор, все спрашивают что великого сделали ученые в той или другой области двадцатый век был веком физики сейчас мы с вами находимся в веке наука жизни и в прошлом году дествительно произошел прорыв который конечно же прошел незамеченным для большинства людей звучит этот прорыв из лего сформулировать следующим образом что впервые ученые смогли предсказывать трёхмерные структуры белков с помощью компьютерных алгоритмов и привлечением методов искусственного интеллекта это действительно совершенно грандиозный шаг вперед для всего человечества
0:41для того чтобы понять почему вот эта
0:45возможность определения трёхмерных
0:47структур белков важно в общем-то для
0:49каждого из нас надо понять где мы были
0:51раньше и почему вообще это важно вся
0:55жизнь устроена на взаимодействие молекул
0:58больших молекул в основном это белки
1:01белки кодируются генами то есть очень
1:04интересно определить свой собственный
1:05геном то нужно вам это для того чтобы
1:07понять какие белки закодированы в вашем
1:10организме белки длинные цепочки
1:13аминокислот
1:14которые с одной стороны делаются по
1:17инструкции полученной из генов с днк а
1:20затем эти длинные цепочки аминокислот
1:23сворачиваются определенным образом в
1:25трёхмерные формы после того как она
1:27свернулась в эта форма на может
1:28выполнять какую-то функцию и на этой
1:30сложной поверхности есть разные выступы
1:33есть какие то там какие впадины канавки
1:36ямки и просто так устроены аминокислоты
1:40из которых сделал наши белки что на этой
1:42поверхности есть участки с отрицательным
1:44зарядом участки с положительным зарядом
1:46участки которые любят взаимодействовать
1:49с водой на 70 процентов состоит из воды
1:51участки которые не любят
1:53взаимодействовать такая сложная
1:54поверхность и
1:56белки взаимодействуют друг с другом за
1:58счет
1:59приблизительно такого же рода ну наверно
2:02как ключ-замок определенный ключ может
2:05войти только в тот замок у которого
2:08бороздка соответствует включу и открыть
2:11только этот замок это очень важно потому
2:14что выясняется что почти все что мы
2:17воспринимаем как заболевания например
2:19рак связано с тем что белки изменяются в
2:21результате мутации вот и сам аннотации
2:23которые тоже на слуху белок с измененной
2:26структурой
2:28трехмерный приобретает способность
2:30взаимодействовать не с тем чем надо
2:32опять же как-то продлить вот эту
2:34аналогию не знаю насколько успешно ключа
2:36и замка если у вас что-то с ключом там
2:39произошло что-то подкрутил отпилили еще
2:42что то этот ключ не будет входить в тот
2:45замок в которой он должен входить но
2:47может быть приобретет возможность
2:48взаимодействовать с другим замком и
2:50открывать или например тогда когда это
2:52не надо именно на этом построена
2:54патогенез многих наших болезней именно
2:57на этом построен например процесс
2:59узнавания вирусом рецепторов на
3:01поверхности наших клеток если бы это
3:03взаимодействие была бы нарушена та и
3:05заражением бы не было
3:06отсюда следует с необходимостью что
3:09важно знать трёхмерные структуры белков
3:11делайте лайки и подписывайтесь на канал
3:15давайте представим себе что мы хотим
3:17разработать лекарство которое будет
3:19предотвращать заражения крана венцы если
3:22я знаю как какую форму приобретает из
3:25белок я могу например разработать
3:27химическую молекулу какую заглушку
3:29которая будет связываться с тем участкам
3:32с белка который должен взаимодействовать
3:34с рецептором и следовательно вирус уже
3:36больше не сможет взаимодействовать с
3:37рецептором ну просто потому что то место
3:40которое должно взаимодействовать с
3:41рецептором она закрыта значит вирус
3:44больше не заразен таким же образом
3:47работают различные лекарства лекарства в
3:50конечном счете это малые химические
3:52молекулы они просто блокируют
3:54определенные взаимодействия белков в
3:57клетке и
3:58то что это так в общем то ученые знали
4:00уже начиная с 50-х годов была только
4:02одна загвоздка что определить
4:05трёхмерную структуру белка было крайне
4:08сложно
4:09например сейчас ученые умеют читать
4:12геномы определять последовательности днк
4:14в сущности любого организма за очень
4:17короткое время и за относительно
4:19небольшие деньги другой вопрос это что с
4:21этим делать дальше очень понятно просто
4:23потому что мы не знаем как информация
4:26закодирована я в днк реализуются на
4:28уровне трехмерных форм белковых молекул
4:31поэтому в базах данных современных
4:33хранятся миллиарды и триллионы
4:37последовательностью разных геномов и
4:38генов уровне днк
4:40структур белков которые кодируют эти
4:43молекулы днк плетьми но гораздо меньше
4:45на уровне нескольких десятков тысяч как
4:48определяются трёхмерной структуры белков
4:50делается это таким страшным кондо вами
4:53физика математическими медными
4:56большинство из нас если что-то читал об
4:58этом школе тоже хотят про это забыть
5:00один метод называется рентгеновская
5:02кристаллография
5:03это означает что вы должны иметь
5:05возможность выделить белок в очень
5:07большом количестве очистить его затем вы
5:10должны в условиях лаборатории
5:11сделать так что в этот белок очищенный
5:14образовал кристалл это длительный
5:15процесс и главное там гарантированный
5:18результат просто лаборатории люди могут
5:20проводить годы пытаются подобрать
5:22условия когда вырастет кристалла он не
5:24бросать затем вам нужно иметь доступ к
5:26очень
5:27высокотехнологическом оборудовании
5:29а затем вы должны привести вот эту
5:30математическую процедуру реконструкции
5:34молекулы на которой дифракции
5:36происходило что-то же в общем не тремя
5:38еще в 50-х 60-х 70-х годах даже в
5:41девяностых годах 20 века было массовым
5:44нобелевских премий дано именно за то что
5:46ученый рек получил трёхмерную структуру
5:49такого белка есть другие способы есть
5:52например метод ядерного магнитного
5:54резонанса
5:54несколько лет назад была дана
5:56нобелевская премия за такой
5:59криоэлектронной микроскопией от еще один
6:01третий метод который позволяет вам в
6:03некотором смысле действительно
6:04посмотреть в микроскоп только очень
6:06определенный микроскоп и в конечном
6:07счете увидеть трёхмерную форму ну и там
6:10тоже есть свои ограничение в общем все
6:11это не очень гордится с другой стороны
6:14белки это знают куда им свернуться пусть
6:17у вас есть спагетти
6:18длинные такие макаронины все они
6:20одинаковы вы их творили
6:22кастрюли ответ берете бросаете макароны
6:25на пол и смотрите на эту траекторию
6:27которая вот это вареное макаронина
6:29примет понятное дело что каждое
6:31макаронина будет чуть-чуть своя на узлом
6:33завяжутся другая там еще круто
6:34причудливую форму сделать но они все
6:37будут разные вот белкин с одинаковой
6:39аминокислотной последовательности всегда
6:41сворачивается в одну и ту же трёхмерную
6:43форму то есть белки и знают каким
6:44свернуться куда иногда мы нет мы не
6:47знаем мы можем только использовать вот
6:49эти чудовищные по сложности методы
6:51физически для определения того что
6:52происходит но раз белки это знают ученые
6:55конечно тоже мог начать думать не давать
6:57ему предскажешь если мы знаем какие
6:59аминокислоты какие источники
7:00отрицательных положительных зарядов еще
7:03чем у него стоят вдоль по цепочке
7:04давайте мы будем из первых принципов как
7:06то это все модерировать рассчитывать
7:08положен или 20 существует такое
7:10прекрасное о состязании когда говорится
7:13что мы дадим вам время если вы правильно
7:16подскажите структуры белка потому что в
7:18это время параллельно какие-то кристалл
7:20о графе эту структуру решают еще никто
7:23не знает что на самом-то деле вот ну и
7:26целая компания информатика в
7:28компьютерных биологов что-то
7:29предсказывает а потом в конце года мы
7:31открываемся и смотрим правильно они
7:32предсказали то что вот эти ученые
7:35практически определили или нет и всегда
7:37было неправильно всегда все когда доложи
7:39было оставляйте комментарии all видок
7:42следующими толки прошлом году произошло
7:45продлив две группы создали пакет
7:48программ это компьютерные программы одна
7:50называется раза это другая называется
7:52альфа фолд который удивительным образом
7:55с применением методов искусственного
7:58интеллекта научилась предсказывать
8:00структуры белков и это совершенно
8:03поразительно потому что но я тоже
8:04занимаюсь такого рода вещами ты там
8:06тратишь годы жизни на что-то потом
8:08звонишь этим ребятам службы схватить
8:10смотрите что у меня получилось они
8:12нажимают на кнопку никто за минуту
8:14получается компьютер все это
8:15рассчитывают они сделали очень такой
8:18хитрый ход потому что как бы ни было
8:21сложно определения белков все-таки уже
8:23десятки тысяч структуру разных белков
8:25базы данных есть и они просто
8:28натренировали искусственный интеллект не
8:31какие-то нервные сетки на то чтобы
8:34пытаться предсказывать уже определенные
8:36структуры правильно не заниматься
8:38физикой какой-то не делать все эти там
8:40как там плюс минус друг другу подходит
8:42уравнение каких дурацких писать вот а
8:45просто обучили нейронную сетку и
8:48выяснилось что она работает работает
8:50правильно реально эти люди сделали
8:52просто но обучалку они решили черт с ним
8:55мы не знаем как сворачиваться белки мы
8:57не знаем мы признаем это ну давайте мы
8:59просто посмотрим на то что уже есть
9:02мужик знаем эти десятки тысяч разных
9:05белков которые куда-то сворачиваться и
9:07давайте будем наш управление знаю как
9:10именно они сделали эту программу я играю
9:12все пользователи они
9:15тренируют компьютерную программу
9:17узнавать какие-то элементы структуры и
9:20фактически создается огромный каталог
9:22где написано что вот такой короткий
9:25участок из аминокислот допустим из
9:27десяти двадцати но с такой
9:28последовательностью до имеет тенденцию в
9:30среднем образовывать вот такую форму а
9:33вот какой-то другой участок ну просто
9:35это по факту это может ученые набрали
9:37достаточно данных он образует вот такую
9:40форму и т.д. и т.п. они фактически
9:44путем таким оперативным методом проб и
9:47ошибок обучали программу на каком-то
9:51определенном да это свете что-то
9:52предсказывать а потом подсовывали ей
9:55белок последовательности унесло с
9:57которой программы еще не встречалась и
9:59говорили определенному эту структуру те
10:01варианты программ элите набор параметров
10:03которые определяли структуру
10:05неизвестного еще программе долга плохо
10:07не откидываюсь вместо этого брались
10:09другие и вот таким в общем-то не
10:11научными от дома методом перебора был
10:13создан пакет программ и найден набор
10:15параметров которые почему-то делает это
10:17хорошо выше 90 процентов структур
10:20которые вот этим новые алгоритмы
10:21предсказывает оказываются верными это
10:24это совершенно потрясающий структур
10:26белков мы научились предсказывать лучше
10:28чем у предсказываем огонь и сейчас все
10:31находятся просто под грандиозным
10:33впечатлением этого прорыва потому что
10:34наша жизнь как ученых
10:36будет теперь совсем другой теперь у меня
10:39в лаборатории как некий стандартный шаг
10:42при изучении того и другого гена и либо
10:45продукта то есть белка мы используем эти
10:47программы для получения необходимой
10:49информации для дальнейших исследований
10:50сейчас очень много пользователей этого
10:53возникло это в частности полезно потому
10:54что вот наличие компьютерных методов
10:58достоверного предсказания в данном
11:00случае трёхмерных структур белков сильно
11:03демократизирует весь процесс научного
11:05производства потому что мне ребята
11:07которые это сделали они немного похожи
11:09на ребят которые сделали в свое время
11:10unix знаете есть несколько платформ и
11:12операционных систем вот unix он общей он
11:15ничей но зато все могут вы улучшите что
11:18тоже очень важно для жизнеспособности
11:22системой вот с альфа фондом ситуации
11:24очень похожи они молодцы они это все
11:27выложили в общий доступ и поэтому никто
11:30не мешает любому человеку в любой точке
11:32земного шара находящемуся с
11:36соответствующим доступом к интернету и
11:37возможности поставить правильный вопрос
11:39попробуем что-то сделать есть какие-то
11:42более закрытые части просто потому что
11:45очевидно что программа будет развиваться
11:47в определенных каких-то отношениях и
11:49будет лицензировать крупные фарме фирмы
11:51и использовать допиливать ее
11:53использовать в конкретных своих вещей но
11:57вот он все бери да не хочу если мы
12:01переходим понимание жизни как набора
12:04просто последовательности нуклеиновых
12:06кислот геном на компьютере к набору
12:09трехмерных форм если мы можем
12:11предсказывать какой белок с какой форме
12:14эффективны будет взаимодействовать каким
12:16другим белком а новая информация розетты
12:19и альфа fold позволяет предсказывать не
12:21только трёхмерные структуры белков но из
12:24чем такая форма будет взаимодействовать
12:27из других таких же форм другим белков
12:30имеющихся в клетке то мы вдруг начинаем
12:32на все это смотреть совсем по-другому
12:34важным является например вопрос
12:37выработки будущих пан вакцин вакцины или
12:41лекарств прямого действия который будет
12:44взаимодействовать с вирусом независимо
12:45от мутации который он накапливает надо
12:48понимать что совершенно очевидно тогда
12:51что если вы имеете каталог измененных
12:55вирусных белков вы можете предсказать
12:57структуру каждого из них вместо того
13:00чтобы делать вот этот многолетней можно
13:02быть анализ реально определение
13:04структуры измененных вирусным уголков
13:06посмотреть какие эти изменения и
13:09например подобрать ключик опять
13:11возвращаемся к этой идее ключа и замка
13:13который будет именно с этой измененной
13:15поверхностью взаимодействовать а можно
13:18наоборот вы можете просмотрев все
13:20вирусные белки которые вы знаете
13:22меняются в различных вариантов найти
13:25через части структуры которые судя по
13:27этим предсказанием не меняются по какой
13:30бы то ни было причине вот тогда я 7
13:32крепление если мы с вами об ступаем
13:34пытаемся поднять деньги или просто
13:36говорим с менеджментом какой-то фарм
13:38кампаниям давайте мы разработаем
13:40молекулу который будет как ключ
13:42взаимодействовать именно с этим местом
13:44галка он никогда не меняется она всегда
13:46одно и то же но потом пойдем к нашим
13:48друзьям химика марина в этом олег уже
13:49придумают мы дальше нужно будет идти
13:51через все испытания там на токсичность
13:54фармакодинамику генетику все как обычно
13:56но по крайней мере у нас кандидат
13:59будущего лекарство будет мгновенно это
14:01становится вопросом дней а может быть
14:03даже часов они годов это очень важно