Что полезного сделал ИИ? [Veritasium]

Оценили: 18

ИИ помогает расшифровывать структуру белков и создавать новые, способные выполнять определённые задачи. В теории, это поможет нам справиться со множеством проблем — от неизлечимых болезней до изменения климата. Дерек Маллер с канала Veritasium расскажет о том, на что способен искусственный интеллект в умелых руках умных людей.

*https://www.youtube.com/watch?v=2l-dv_z4KUc
**https://300.ya.ru/v_IDBsIw02

таймкоды

00:00:08 Введение в проблему

Глобальные проблемы человечества имеют универсальное решение, связанное с определением структуры белка.
Определение структуры белка — одна из главных научных задач прошлого века.

00:00:31 История исследования белков

Более 60 лет биологи собирали информацию о структуре 150 тысяч белков.
Команда из 15 человек определила структуру 200 миллионов белков за несколько лет.

00:01:03 Структура и функции белков

Белки состоят из цепочек аминокислот, соединённых пептидными связями.
Трёхмерная структура белка определяет его функции и специализацию.
Пример: гемоглобин связывает и удерживает кислород.

00:02:01 Методы определения структуры белков

Экспериментальные методы, включая рентгеновскую кристаллографию, позволяют определить структуру белка.
Джон Кендрю потратил 12 лет на изучение миоглобина.

00:03:44 Сложности и стоимость определения структуры

Определение структуры одного белка может занять много времени и стоить десятки тысяч долларов.
Учёные ищут бюджетные альтернативы для экономии ресурсов.

00:04:15 Попытки предсказания структуры белков

Лайнус Полинг предсказал альфа-спирали и бета-листы на основе свойств аминокислот.
Эволюция белков делает их структуру сложной и запутанной.

00:05:45 Соревнования CASP

Джон Мольт организовал соревнования CASP для создания программ, предсказывающих структуру белков.
Алгоритм Rosetta, разработанный Дэвидом Бейкером, объединил вычислительные мощности добровольцев.

00:07:16 Игра Fold It

В игре Fold It игроки пытались придать белковой цепочке правильную форму.
Участники игры стали соавторами публикаций о структуре фермента вируса иммунодефицита человека.

00:08:18 Проект AlphaFold

Демис Хасабис запустил проект AlphaFold для использования искусственного интеллекта в науке.
Первая версия AlphaFold использовала нейронную сеть и эволюционные данные.

00:09:29 Эволюционные закономерности и AlphaFold

Эволюция белков сохраняет их структуру, несмотря на мутации.
AlphaFold анализирует парные мутации и эволюционные закономерности для предсказания структуры белков.

00:11:32 Улучшение AlphaFold

AlphaFold 2 улучшил подход к глубокому обучению, интегрируя геометрические, физические и эволюционные принципы.
Увеличение вычислительных мощностей и улучшение подходов привели к значительному приросту точности.

00:12:26 Вычислительные ресурсы и данные

Доступ к огромным вычислительным ресурсам Google, включая тензорные процессоры.
Важность качества обучения, а не количества данных.
Пример с AlphaFold 2: разница в качестве обучения на том же массиве данных.

00:12:56 Трансформеры и внимание

Трансформеры основаны на концепции внимания, которая добавляет контекст к последовательной информации.
Пример работы внимания: система понимает, что «она» в фразе — это «животина», а не «улица».
Видео о трансформерах и внимании на канале Three Blue Brown.

00:13:41 Альфа-Фолд и Ива-Формер

Альфа-Фолд использует собственную версию трансформера Ива-Формер для анализа последовательностей аминокислот.
Ива-Формер имеет две башни: биологическую и геометрическую.
Связующий мост между башнями передаёт биологические и геометрические данные.

00:14:35 Механизм внимания и треугольное внимание

Механизм внимания анализирует столбцы и строчки таблицы, выявляя аминокислотные последовательности и признаки мутаций.
Треугольное внимание рассчитывает взаимодействие трёх аминокислот, используя неравенство треугольника.
Обмен информацией внутри Ива-Формера повторяется 48 раз, повышая точность данных.

00:15:54 Модуль структуры

Модуль структуры выделяет три ключевых атома для каждой аминокислоты и рассчитывает их ориентацию в пространстве.
Нейросеть рассчитывает сдвиг и поворот аминокислот для их размещения на своих местах.
Отказ от традиционного подхода к сборке цепочки аминокислот даёт нейросети больше свободы в работе.

00:17:11 Результаты AlphaFold 2

AlphaFold 2 показал потрясающие результаты на виртуальном CAP, предсказав структуры многих белков с высокой точностью.
Модель преодолела планку в 90 баллов, что стало значительным достижением.
За 60 лет учёные определили около 150 тысяч структур белков, а AlphaFold открыл более 200 миллионов.

00:18:27 Применение AlphaFold

Разработка вакцины от малярии и преодоление устойчивости к антибиотикам.
Анализ мутаций и их влияния на болезни.
Данные о строении и функциях белков редких вымирающих видов.

00:19:00 Нобелевская премия и новые белки

Джон Джампер и Демис Хасабис получили половину Нобелевской премии по химии за открытие AlphaFold.
Дэвид Бейкер получил вторую половину премии за создание новых белков с заданными функциями.
Метод RF-DIFU позволяет создавать новые белки, убирая случайный шум из структуры известных белков.

00:19:56 Перспективы синтетических белков

Синтетические белки повышают шансы на выживание при укусе ядовитой змеи.
Противоядия, созданные в лаборатории Бейкера, совместимы с организмом человека и могут производиться в больших количествах.
Разработка ферментов для улавливания парниковых газов и разрушения пластика.

00:21:14 Искусственный интеллект и материаловедение

Программа Gnome от DeepMind нашла более 2 миллионов новых кристаллов, из которых более 400 тысяч — стабильные материалы.
Искусственный интеллект революционизирует науку, решая фундаментальные проблемы с невиданной ранее скоростью.
Новые возможности в материаловедении, от сверхпроводников до аккумуляторов.

В этом видео

Как определить структуру белков
0:00
[музыка]
0:08
Что если у всех глобальных проблем
0:10
человечества от изменения климата и
0:12
неизлечимых болезней до пластикового
0:14
мусора, есть универсальное решение?
0:18
Притом настолько крошечное, что его
0:20
нельзя увидеть. Я говорю о достижении,
0:23
которое позволило решить одну из главных
0:26
научных задач прошлого века.
0:28
Определить структуру белка. Это как
0:32
доказать великую теорему Ферма только в
0:35
биологии. Более 60 лет армия биологов со
0:39
всего света по крупицам собирала
0:41
информацию о структуре 150.000 белков. А
0:45
потом всего за несколько лет команда из
0:47
15 человек определила структуру 200 млн,
0:51
по сути, всех известных белков, которые
0:53
встречаются в природе. Так как же им это
0:56
удалось? И почему это открытие может
0:58
решить проблемы никак не связанные с
1:00
биологией?
1:03
Белок — это цепочка аминокислот.
1:06
В центре каждой аминокислоты есть атом
1:09
углерода. К нему, с одной стороны
1:11
прикреплена аминогруппа, а с другой-
1:13
карбоксильная группа. Остаётся добавить
1:16
одну из двадцати возможных боковых
1:18
цепей. Она и определит, какую именно
1:21
аминокислоту мы получим в итоге.
1:24
Аминогруппа одной аминокислоты
1:26
соединяется с карбоксильной группой
1:28
другой. При этом образуется пептидная
1:31
связь. На собранную цепочку воздействует
1:33
молекулярное притяжение, электростатика
1:36
и сила водородных связей. Из-за всего
1:39
этого она скручивается и сворачивается.
1:42
В ходе этого процесса, который в
1:44
биологии называют фолдингом белка,
1:47
формируется его трёхмерная структура.
1:50
Именно она определяет функции белка и
1:52
его специализацию для конкретной задачи.
1:55
Например, у гемоглобина в крови есть
1:57
особый участок, который связывает и
1:59
удерживает кислород.
2:01
Чтобы согласованно работать, эти белки
2:03
должны иметь подходящую для конкретной
2:06
задачи структуру. Например, в мышцах
2:08
белки могут тянуться и сокращаться как
2:10
раз благодаря особой форме. Чтобы узнать
2:13
структуру одного единственного белка,
2:15
приходилось тратить уму времени.
2:16
Безусловно, понять, как выглядит белок,
2:18
стало возможно лишь с появлением
2:20
экспериментальных методов. Первый способ
2:23
разглядеть структуру белка — это создать
2:26
его кристаллическую форму, а затем
2:28
облучить рентгеновскими лучами. Далее
2:30
учёные расшифровывают полученную
2:33
дифракционную картину и пытаются понять,
2:36
какая молекула могла оставить такой
2:38
рисунок.
2:39
На то, чтобы впервые определить
2:41
структуру таким образом, британский
2:43
биохимик Джон Кендрю потратил 12 лет. Он
2:45
изучал миоглобин, важнейший белок
2:48
сердца, запасающий кислород.
2:50
Сначала Кендри взял сердце лошади, но в
2:53
нём миоглобина было маловато, и
2:54
кристаллы получались слишком мелкие.
2:57
Тогда Кендрию вспомнил про ныряющих
2:59
млекопитающих. В их мышцах этого белка
3:01
хватает, ведь им нужно запасать много
3:03
кислорода. Кендрю, раздобыв кусок
3:06
китового мяса, получил, наконец
3:08
кристаллы, достаточные для создания
3:10
рентгеновской дифракционной картины.
3:12
Когда структуру определили, оказалось,
3:14
что она очень странная. Люди ожидали
3:16
увидеть что-то логичное, геометрическое,
3:19
понятное. А там не то чтобы уродство, но
3:22
нечто настолько сложное и запутанное,
3:24
как будто смотришь на ракетный
3:25
двигатель, а у него детали торчат во все
3:27
стороны. Эта структура, которую
3:29
окрестили какашкой века, в 1962 году
3:32
принесла Кендриу Нобелевскую премию по
3:34
химии.
3:36
За следующие 20 лет удалось расшифровать
3:38
всего лишь сотню структур. Даже сейчас
3:41
выращивать кристаллы белка черезвычайно
3:44
сложно. Честно говоря, бывает, что
3:46
расшифровка структуры всего пары белков
3:48

это уже диссертация. Даже одного белка
3:51
хватит. Можно даже до конца не
3:53
расшифровывать. А ещё это дорого.
3:55
Рентгеновская кристаллография может
3:57
стоить десятки тысяч долларов за белок.
Почему белки такие сложные?
4:00
Поэтому учёные искали бюджетную
4:02
альтернативу. Узнать последовательность
4:04
аминокислот можно всего за сотню
4:06
долларов. И если научиться на основе
4:08
этого предсказывать структуру белка,
4:11
можно сэкономить много времени, сил и
4:14
денег. Мы понимаем, как ведёт себя
4:16
углерод, как он соединяется с серой, а
4:18
серо с азотом. Зная расположение
4:20
элементов, можно предсказать, где какая
4:22
связь получится. То есть, зная основные
4:25
принципы поведения молекул, вполне
4:26
реально спрогнозировать, как именно
4:28
скрутится белок. Одно из редких,
4:31
по-настоящему точных предсказаний в
4:33
биологии сделал лайнусполинг. По
4:36
свойствам аминокислот он заключил, что
4:38
они могут образовывать так называемые
4:40
альфа-спирали и бета-листы. Это
4:42
вторичная структура, локальные завитки и
4:44
скрутки цепочки. Но дальше спиралий и
4:46
листов дело не шло. Биохимики безуспешно
4:49
искали закономерности, позволяющие
4:51
определить окончательную структуру
4:53
любого белка. Отчасти это объясняется
4:55
тем, что эволюция не создавала белки из
4:57
чистого листа. Это как
4:59
программист-недоучка, который не знает,
5:01
что делает. Что-то работает, отлично,
5:03
надо повторить. В результате получаются
5:05
одновременно восхитительные и невероятно
5:08
сложные и запутанные конструкции. Белки
5:10
никто не конструировал с расчётом на
5:12
конкретную задачу, в отличие от
5:14
механизмов, которые проектирует человек.
5:17
И вот о каком уровне сложности мы
5:19
говорим. Сайрус Ленталь, биолог из MIT,
5:23
прикинул, что даже коротенькая пептидная
5:25
цепочка из тридцати 5 аминокислот может
5:29
сложиться просто невообразимым
5:31
количеством способов. Суперкомпьютер,
5:33
который перебирает 30.000 вариантов в
5:36
наносекунду, искал бы правильную
5:38
структуру в 200 раз дольше, чем
5:41
существует вселенная.
5:45
Но Джон Молт, профессор из Меэролинда,
5:48
решил не издаваться. В 1994 он придумал
5:52
соревнование под названием Касп. Задача
5:54
была простая: создать такую компьютерную
5:57
программу, которая предсказала бы
5:58
структуру белка по последовательности
6:00
его аминокислот. Участникам загадывали
6:02
какой-нибудь уже известный белок, и то,
6:05
что получалось в ходе программного
6:06
моделирования, сравнивали с
6:08
экспериментальными данными. За полное
6:10
совпадение давали 100 баллов, но любой
6:13
результат от 90 и выше уже считался
6:16
успешным. Участники Касп собирались в
6:19
Калифорнии в старой деревянной часовне,
6:22
переделанный под конференц-центр. Там
6:24
появился забавный ритуал. Если кто-то
6:27
выдавал совсем уж ерундовое
6:28
предсказание, все начинали стучать по
6:31
полу ногами.
6:33
Стучали часто. В первый год ни одна
6:35
команда не смогла набрать больше 40ка
6:37
баллов. Лучше всех тогда справился
6:39
алгоритм Розеетто, который придумал
6:41
биолог из Вашингтонского университета
6:43
Дэвид Бейкер. Он нашёл способ ускорить
6:46
расчёты, объединив вычислительные
6:47
мощности компьютеров, простаивающих дома
6:50
в школах и библиотеках. Добровольцы
6:52
устанавливали программу Розеetta at home
6:55
Home и помогали учёным.
6:57
Там можно было включить заставку,
6:59
которая показывала, как программы
7:01
перебирают разные варианты структур.
7:03
Некоторые писали нам письма о том, что,
7:05
судя по этим картинкам, они справились
7:08
бы лучше.
7:10
И тогда у Быкера появилась идея сделать
7:12
компьютерную игру.
7:16
В игре под названием Fold It нужно было
7:19
попытаться придать белковой цепочке
7:21
правильную форму.
7:23
Теперь подбором занимался не компьютер,
7:26
а обычные люди. 3 недели подряд больше
7:29
50.000 игроков расшифровывали один из
7:32
ферментов вируса иммунодефицита
7:34
человека. Получившуюся у них структуру
7:36
сравнили с данными кристаллографии, а
7:38
она оказалась верной. Участников игры
7:41
указали соавторами публикаций. Среди
7:44
прочихд играл выдающийся шахматист Демис
7:47
Хасабис. Незадолго до этого он основал
7:50
кампанию по разработке искусственного
7:52
интеллекта Deep Mind. Она известна
7:54
алгоритмом Alpha Go, который победил
7:56
чемпиона мира по го Ли Сидоля и
7:59
шокировал всех оригинальным ходом под
8:01
номером 37.
8:04
Так вот, Демис Хасабис навсегда запомнил
8:06
опыт игры Folded. Меня это, конечно,
8:09
привлекло с точки зрения гейм-дизайна.
8:12
Представляете, как здорово было бы
8:13
научить компьютер думать так же, как эти
8:15
игроки, не профессионалы, а обычные
8:17
любители биологии. Вернувшись из Кореи,
8:20
команда Deep Mind провела недельный
8:22
хакатон в попытке обучить искусственный
8:24
интеллект играть в Folded. Это был
8:27
первый шаг главной цели Хасабиса,
8:29
использовать искусственный интеллект для
8:31
развития науки. Чтобы решить проблемы
8:33
фолдинга, он запустил новый проект под
8:36
названием Альфафолд. Тем временем
8:38
качество прогнозов лучших участников
8:41
Касп, включая Розетту, перестало расти.
8:44
Более того, после восьмого соревнования
8:46
результаты ухудшились.
8:49
Точность предсказаний падала, несмотря
8:51
на мощные компьютеры и огромную базу
8:53
данных белков, на которых можно было
8:55
тренировать программу. В Deep Mind
8:57
надеялись, что Alpha Fold это изменит.
9:00
Первая версия AlphaFold 1 была обычной
Как работает AlphaFold?
9:03
нейронной сетьчью, похожей на те, что
9:05
использовали в то время для
9:06
компьютерного зрения. Её обучили на
9:09
огромном массиве данных о структуре
9:11
белков.
9:13
На вход Альфад получала
9:15
последовательность аминокислот и
9:16
информацию о некоторых эволюционных
9:18
закономерностях.
9:21
Эволюция работает за счёт мутаций,
9:23
изменений в генетическом коде, который,
9:25
в свою очередь, меняет
9:26
последовательность аминокислот в белке.
9:29
Виды развиваются и эволюционируют.
9:32
Несмотря на это, белки обычно сохраняют
9:34
свою структуру. Ведь от этого зависит их
9:36
функция. Например, гемоглобин выглядит
9:38
одинаково у человека: кошки, лошади, да
9:41
и вообще у любого млекопитающего.
9:43
Эволюция говорит: «Работает, не трогай».
9:45
Поэтому мы можем сравнить
9:46
последовательности одного и того же
9:48
белка у разных видов, и у нас получится
9:51
такая эволюционная таблица. Если
9:53
последовательности совпадают, значит,
9:55
скорее всего, эти участки важны для
9:57
структуры и работы белка. Но даже если
10:00
последовательности отличаются, стоит
10:01
обратить внимание на парный мутации. Они
10:04
подскажут, какие аминокислоты,
10:05
расположенные скорее всего рядом.
10:07
Например, возьмём положительно
10:09
заряженный лизин и отрицательно
10:11
заряженную глутаминовую кислоту. Они
10:13
притягиваются друг к другу и удерживают
10:15
белок в свёрнутом состоянии. Если
10:17
мутация заменяет лизин на отрицательно
10:19
заряженную аминокислоту в место,
10:21
притяжении возникает отталкивание, что
10:23
приводит к дестабилизации всего белка.
10:25
Поэтому требуется компенсирующая
10:27
мутация, которая заменит глутаминовую
10:29
кислоту на другую с положительным
10:31
зарядом. Это явление известно
10:32
какаволюция. Информация о составе белков
10:35
у разных видов оказалась крайне полезной
10:37
для Alphaфолт.
10:39
Правда, результатом работы стала не
10:41
3D-структура белка, а более простое
10:44
двумерное представление парных
10:46
взаимодействий.
10:48
Последовательность аминокислот
10:49
выстраивается по горизонтали и
10:51
вертикали.
10:52
Если две аминокислоты в конечной
10:54
структуре находятся близко, их
10:56
пересечение на диаграмме будет светлее,
11:00
для отдалённых пар темнее.
11:05
Помимо расстояния эта диаграмма содержит
11:07
информацию о том, как молекулы
11:09
аминокислоты закручиваются в структуре
11:12
белка. Итак, в первой версии
11:14
последовательности аминокислоты
11:15
эволюционные данные загружали в
11:17
нейросеть, которая выдавала таблицу с
11:19
информацией об этих парных
11:21
взаимодействиях. Затем отдельный
11:23
алгоритм сворачивал цепочку аминокислот
11:25
с учётом предсказанных расстояний и
11:27
углов поворота. Так получалась структура
11:30
белка.
11:33
С этим подходом Alльpha вышла на Кап и
11:37
сразу же привлекла всеобщее внимание.
11:39
После множества доработок она стала
11:41
явным победителем, но работала всё ещё
11:44
не идеально. Результат в 70 баллов
11:46
оставался ниже установленной планки в
11:48
90.
11:50
Чтобы добиться улучшения, команде Deep
11:52
Mind пришлось вернуться к расчётам.
11:54
Возглавить проект Альфа Fold Хасабис
11:56
пригласил Джона Джампера. В Альфа Fold 2
11:59
мы поменяли подход к глубокому обучению
12:01
так, чтобы отдельные блоки системы
12:03
хорошо разбирались в белках в
12:05
геометрических, физических и
12:06
эволюционных принципах. И их надо было
12:09
встроить в ядро сети, а не просто
12:10
использовать как дополнение. Это дало
12:12
колоссальный прирост в точности.
12:15
Улучшить результаты работы ИИ и решили
3 способа улучшить результаты работы ИИ
12:18
сразу тремя способами. Во-первых, дать
12:20
больше вычислительных мощностей. В этом
12:23
у Deep Mind были, наверное, лучшие
12:25
условия в мире: доступ к огромным
12:27
вычислительным ресурсам Google, включая
12:29
их тензорные процессоры. Во-вторых,
12:32
предоставить большой разнообразный
12:34
массив данных. Действительно ли данные —
12:37
это главная проблема? И почему? Мне
12:39
кажется, значимость количества данных
12:41
переоценивают. Тут надо быть осторожнее.
12:44
Alpha Fold 2 тренировали на том же
12:45
массиве, что и Альpha Fold 1. Разница
12:47
была в качестве обучения, так что
12:49
нехватка данных — это не так страшно.
12:51
Чем эффективнее процесс обучения, тем
12:54
меньше она ощущается.
12:56
И последний способ- улучшить алгоритмы
12:59
Ии. В ходе работы команда Alphaфold 2
13:03
сосредоточилась на трансформере. Это его
Что такое трансформер в ИИ?
13:06
обозначает буква Т в чар PT. Он основан
13:09
на концепции под названием внимание. Во
13:11
фразе животина не перешла улицу, потому
13:14
что она слишком устала. Система
13:16
благодаря вниманию понимает, что она —
13:18
это животина, а не улица, потому что
13:21
дальше говорится про усталость. Внимание
13:23
добавляет контекст к любой
13:25
последовательной информации, разбивает
13:27
её на элементы чанки, превращает их в
13:29
наборы чисел и устанавливает связи между
13:32
ними. В нашем примере между словом она и
13:35
словом животина. На канале 3 Blue One
13:38
Brown есть отличные видео про
13:40
трансформеры и внимание. С его помощью
13:43
большие языковые модели предсказывают,
13:45
каким словом лучше всего продолжить
13:47
предложение. Но у Альpфа тоже есть
13:49
последовательная информация. Не
13:51
предложение, а последовательность
13:53
аминокислот. Для их анализа команда
13:55
Альфа создала собственную версию
13:57
трансформера Иваформер.
14:00
В Иваформе две башни. Первое,
14:02
биологическая хранит эволюционную
14:05
информацию, а другая — геометрическая.
14:07
Данные о парных связях между
14:09
аминокислотами.
14:10
Альфа 1 начинала с одной башни и
14:13
пыталась на её основе предсказать
14:14
другую. В Альфафолт 2 такого уже не
14:17
было. Ивоформер строил обе башни
14:19
одновременно.
14:21
Он сразу начинал и с эволюционных таблиц
14:23
и с представления о парных связях,
14:25
основанных на похожих, известных белках.
14:28
А главное, между башнями появился
14:30
связующий мост. По нему в обе стороны
14:32
передавались биологические
14:34
геометрические данные. В биологической
14:36
башне механизм внимания анализировал
14:38
столбцы таблицы и выявлял аминокислотные
14:41
последовательности, которые не менялись.
14:43
Тот же механизм искал в строчках
14:45
признаки одновременных мутаций.
14:47
Обнаружив, что аминокислоты связаны друг
14:49
с другом и, вероятно, играют важную роль
14:52
в структуре белка, ибоформер передавал
14:54
данные в геометрическую башню, где
14:56
механизм внимания рассчитывал
14:58
пространственное расстояние между
15:00
аминокислотами.
15:02
была внедрена ещё одна инновация.
15:04
Треугольное внимание. Оно позволяло
15:07
рассчитывать взаимодействие трёх
15:08
аминокислот. Для каждой тройки
15:10
аминокислот альфафолд применяет
15:12
неравенство треугольника. Сумма длин
15:14
двух сторон должна быть больше третьей.
15:17
От этого зависит, как далеко друг от
15:19
друга могут находиться эти аминокислоты.
15:21
А на основе этой информации обновляются
15:23
данные о парных связях. Это помогает
15:26
модели создать своего рода согласованную
15:28
картину структуры. Когда геометрическая
15:31
башня определяет, что две аминокислоты
15:33
не могут находиться рядом, она
15:34
отправляет сигнал в биологическую башню,
15:36
чтобы та исключала их связь из
15:38
эволюционного анализа. Такой обмен
15:40
информацией внутри Ивафор Forформер
15:42
повторяется 48 раз, и информация в обеих
15:45
башнях становится всё точнее. Затем
15:47
полученные структурные закономерности
15:49
передаются следующему инновационному
15:51
модулю Альфафол 2 блоку построения
15:53
трёхмерной структуры. Для каждой
15:55
аминокислоты мы выделяем три ключевых
15:57
атома, которые задают её ориентацию в
16:00
пространстве. Изначально все
16:01
аминокислоты располагаются в начале
16:03
координат. Задача нейросети —
16:06
рассчитать, как каждую из них надо
16:08
сдвинуть и повернуть, чтобы они все
16:10
оказались на своих местах. Вот чем
16:11
занимается модуль структуры. Но ключевая
16:14
особенность модуля структуры заключается
16:16
в том, что он не делает. Считалось, что
16:19
программа должна знать, что собирает
16:20
цепочку, что одни аминокислоты должны
16:23
быть связаны с другими. Мы отказались от
16:25
такого подхода в Alphaфол. Вместо этого
16:28
мы как бы даём ей набор из деталек и
16:31
позволяем размещать каждую, как она
16:33
считает нужным. Вероятно, это помогает
16:36
ей не зацикливаться на том, что все
16:37
элементы должны образовывать цепочку. И
16:41
таким образом даёт больше свободы в ходе
16:44
работы. А цепь получается в конце сама
16:46
собой. Вот почему, наблюдая за работой
16:49
Альфа в реальном времени можно заметить
16:51
странные и очень сомнительные варианты.
16:56
Модуль структуры создаёт трёхмерную
16:58
модель белка, но это лишь черновой
17:00
вариант. Его пропускают через IVER
17:03
минимум трижды, каждый раз, уточняя
17:05
полученную структуру. И лишь после этого
17:07
система выдаёт окончательный результат.
Alphafold-2 и Нобелевская премия
17:11
В декабре 2020 Deep Mind вернулась на
17:14
виртуальный Касп с Alphaфол 2. И на этот
17:17
раз у них всё получилось.
17:20
Сейчас зачитаю письмо от Джона Мота.
17:23
Ваша команда показала потрясающие
17:25
результаты на КАП-14 и по сравнению с
17:28
другими командами, и по абсолютной
17:29
точности модели. Поздравляем вас с
17:32
успехом. Структуры многих белков,
17:35
предсказанны Альфа Fall 2 практически не
17:37
отличались от эталонных,
17:40
и они наконец преодолели планку в 90
17:43
баллов.
17:46
Я так долго работал над этой проблемой,
17:49
столько раз начинал сначала, и вдруг вот
17:51
оно решение. Мы его нашли. Это
17:54
невероятно воодушевляет. Впрочем, в
17:57
науке так и бывает. За 60 лет работы над
18:01
белками учёные со всего мира с огромным
18:03
трудом определили около 150.000
18:06
структур.
18:08
А потом появился Альфафолт и открыл
18:11
больше 200 миллионов.
18:15
Это почти все известные в природе белки.
18:19
Всего за несколько месяцев Альфафолд
18:21
продвинул работу научных лабораторий по
18:24
всему миру на несколько десятилетий
18:26
вперёд. Благодаря ему была разработана
18:29
вакцина от малярии. Он помог преодолеть
18:32
механизмы устойчивости к антибиотикам,
18:34
вернув эффективность жизненно важным
18:37
препаратам.
18:38
показал, как мутации проявляются на
18:40
уровне белковых структур и приводят к
18:42
разным болезням от шизофрении до рака. А
18:45
биологи, изучающие редкие вымирающие
18:47
виды, получили бесценные данные о
18:49
строении функциях их белков. У статьи об
18:52
Альфафол 2 уже больше 30.000
18:55
цитирований. Это изобретение стало
18:58
настоящим прорывом.
19:01
В 2024 Джон Джампер и Демис Касабис
19:05
получили половину Нобелевской премии по
19:06
химии. за это открытие. Вторую половину
19:09
дали Дэвиду Бейкеру, но не за
19:10
предсказание структуры белков с помощью
19:12
розет, а за создание совершенно новых
19:15
белков. Разрабатывать с нуля белки с
19:17
заданными функциями сложнейшая задача, и
19:20
мы с ней справляемся. Дэвид делает это с
19:22
помощью примерно такого же
19:24
искусственного интеллекта, который
19:25
рисует картинки в системах типа Дали.
19:28
Можно сказать: «Нарисуй кенгуру верхом
19:29
на кролике» или что-то подобное, и он
19:31
это сделает. Точно так же мы проектируем
19:34
белки. Метод называется RF diffusion в
19:37
качестве обучения и просит убрать
19:39
случайный шум, добавленный к структуре
19:41
какого-нибудь известного белка. После
19:44
такой тренировки систему можно попросить
19:46
создать белки для разных целей. На вход
19:50
подают случайный шум, а и конструируют
19:52
новый белок с заданными параметрами.
19:56
У этого подхода колоссальные
19:58
перспективы. Представьте, что вас
20:00
укусила ядовитая змея. Если повезёт, вам
20:03
дадут противоядие. Чтобы его получить,
20:06
берут яд конкретной змеи и вводят его
20:09
животным, например, лошадям. Потом у них
20:12
извлекают антитела, очищают и вводят
20:14
пациенту. Проблема в том, что такие
20:17
антитела часто вызывают аллергические
20:19
реакции. Благодаря новейшим
20:21
синтетическим белкам, созданным в
20:23
лаборатории Бекера, у пострадавшего
20:25
банально возрастают шансы на выживание.
20:28
Такие антитела нейтрализуют смертельный
20:31
змейный яд. и совместимый с организмом
20:33
человека. Подобные противоядия можно
20:36
производить в больших количествах и
20:37
легко доставлять куда надо. Эти
20:39
крушечные молекулярные машины открывают
20:41
поистине безграничные возможности. Какие
20:44
направления вам кажутся самыми
20:45
интересными? Наверняка получится
20:47
улучшить вакцины. У нас есть несколько
20:49
белков, которые проходят клинические
20:51
испытания для лечения рака. Ещё работаем
20:53
над аутоиммунными заболеваниями. Нас
20:55
интересуют проблемы, связанные с
20:57
улавливанием парниковых газов. Мы
20:59
разрабатываем ферменты, способные
21:00
поглощать метан или разрушать пластик.
21:02
Этот подход очень эффективен благодаря
21:05
высокой скорости создания модификации
21:07
белков. Это настоящее чудо для любого
21:10
химика или специалиста, который работает
21:13
с белками. Теперь мы можем
21:15
спроектировать белок на компьютере,
21:17
определить его аминокислотную
21:19
последовательность и всего через пару
21:21
дней получить готовую молекулу. Этот
21:25
подход мы в шутку назвали ковбойской
21:27
биохимией. пришпорил коня и несёшься
21:30
вперёд. И что удивительнее всего, он
21:32
прекрасно работает. То, что
21:34
искусственный интеллект сделал для
21:36
белков, практически ничто по сравнению с
21:38
возможностями в других областях и на
21:40
других масштабах. В материаловедении
21:42
программа Гном от Deepmind уже нашла 2 с
21:45
лишним миллиона новых кристаллов, из них
21:47
больше 400.000. Стабильные материалы,
21:50
которые можно использовать в технологиях
21:52
будущего от сверхпроводников до
21:53
аккумуляторов.
21:55
Искусственный интеллект совершает
21:56
революцию в науке, помогая решить
Будущее ИИ
21:58
фундаментальные проблемы, которые раньше
22:01
тормозили прогресс. Если представить
22:03
себе все знания как дерево, в нём можно
22:06
выделить особые участки, фундаментальные
22:08
проблемы, решение которых открывает
22:10
доступ к совершенно новой ветви, по
22:12
которой можно идти дальше. Благодаря
22:14
этому и расширяет границы знаний с
22:18
невиданной ранее скоростью. Решать
22:21
задачи в два раза быстрее — это здорово.
22:23
Мы такое любим.
22:25
Но тут речь про сотни тысяч раз. Это
22:27
принципиально другой уровень. Подходы и
22:29
процессы полностью меняются, открываются
22:32
новые возможности, и всё вдруг
22:35
выстраивается вокруг них. Вот что
22:38
по-настоящему вдохновляет. Эти открытия
22:40

фундаментальный скачок, настоящий
22:43
прорыв науки. Даже если искусственный
22:46
интеллект не будет развиваться дальше,
22:48
мы ещё несколько десятилетий сможем
22:50
поженать плоды тех открытий, которые уже
22:52
сделаны благодаря ему. А если развитие
22:55
продолжится, откроются перспективы,
22:56
которые раньше считались недостижимыми.
22:59
От победы над всеми болезнями до
23:01
создания революционных материалов и
23:03
восстановления загрязнённых экосистем.
23:05
Прекрасное будущее. Главное, чтобы Иини
23:09
успел до этого захватить мир и всех нас
23:11
уничтожить.
23:13
Переведено и озвучено студией Верт Рт
23:15
Дайдер.

таймкоды

В этом видео

Похожие записи