Всем привет! Сегодня мы будем создавать нейросеть, которая будет учиться ходить!
В этом видео мы займемся созданием искусственного интеллекта для сразу четырёх моделей персонажей: киберштаны(???), киберчерепаха, киберпаук и робот.
Каждому из них мы дадим 10 миллионов шагов для обучения, а затем сравним полученные результаты, чтобы определить победителя!
В следующем видео мы посмотрим на сражение этих искусственных интеллектов на одной игровой карте, устроим что-то типо батл рояла!
Так что подписывайся на канал, чтобы ничего не пропустить!
Расшифровка видео
Вступление
0:00
всем привет с вами крашер и сегодня
0:02
искусственный интеллект будет учиться
0:04
ходить и нашим первым подопытным
0:07
которого обучит нейросеть является вот
Принцип обучения нейросети
0:11
такой персонаж это получается штаны ok
0:17
он состоит из нескольких блоков все они
0:19
связаны между собой по сути это аналог
0:23
наших ног которые соединяются между
0:25
собой с помощью связок
0:27
каждая нога как и наш с тобой может
0:30
поворачиваться в нескольких направлениях
0:32
бедро может поворачиваться на 90
0:34
градусов вперед и назад
0:36
а также имеет 30 градусов для повороты в
0:39
стороны и вращения после бедра идет
0:42
голень которая может поворачиваться на
0:43
120 градусов назад и чтобы дать
0:46
возможность нейросети найти более
0:48
удобный способ передвижения я также
0:50
добавил 30 градусов для поворота и
0:52
вращения как у бедра
0:54
кстати об использовании россетти в
0:57
качестве основы у нас здесь
0:59
asset unity млн джинс во время работы
1:01
программы
1:02
наша не растить собирает ряд данных во
1:04
первых это положение каждой части тела
1:07
нашего персонажа
1:08
а также силу с которой они связаны между
1:11
собой кроме того нейросеть в качестве
1:14
входных данных получать информацию а в
1:17
положение цели нашего искусственного
1:19
интеллекта я готов представить тебе куб
1:23
награду за его касание 1 балл
1:26
также я добавил награду за то что наш
1:29
искусственный интеллект просто
1:30
поворачивается и смотрит в сторону куба
1:32
это 0,01 каждый шаг и если он не просто
1:36
смотрит но еще и идет по направлению к
1:39
цели то получает 0,03 очка а
1:42
контролирует изменяет наши не раз сеть
1:44
положение и поворот каждой части тела
1:47
героя а также силу связок прямо сейчас
1:51
ты можешь наблюдать как это происходит в
1:53
процессе обучения он падает падает
1:56
падает пока не начнет получаться
1:59
двигаться по направлению к цели и
2:01
зарабатывать свои заветные баллы сначала
2:03
наш герой получал только штраф за время
2:05
и спустя 600 тысяч шагов
Обучение нейросети штанов
2:08
начало вырабатываться
2:09
вот такая стратегия он по сути лежа
2:13
пытается дрыгаться и лететь прямиком к
2:16
цели еще и брейк-данс подрубать иногда я
2:20
конечно ни на что не намекаю но пока что
2:22
эта модель поведения не совсем похоже на
2:24
то как мы ходим в реальной жизни полтора
2:28
миллиона шагов и у наших штанов с
2:30
искусственным интеллектом новая тактика
2:32
как видишь теперь не решили просто
2:34
ползать по карте позы на жопе по карте
2:37
конечно неплохо но давай заставим их все
2:40
же ходить и за дело берутся два новых
2:43
штрафа первый штраф за то что голова
2:46
касается земли если это произошло то
2:48
кибер что на теряют один балл и цены
2:51
перезапускается и 2 штраф это штраф за
2:53
время чтобы он обучался еще быстрее
2:56
давай посмотрим что будет наша не растет
2:59
делать теперь первым делом он падает
3:02
круто
3:04
падает падает падает и снова падает
3:09
даем чуть больше времени на тренировку и
3:12
видим как наши кибер штаны
3:13
начали поворачиваться в сторону цели это
3:17
прогресс но стоять у него все еще не
3:20
получается он падает падает и падает
3:24
интересно сможет ли наша не раздеть
3:27
витте и сложившейся довольно-таки
3:30
сложной ситуации прошло три миллиона
3:33
попыток и наша не растить не тоже
3:35
научилась стоять на месте она научилась
3:38
передвигаться
3:39
вот таким вот приставными шагами
3:41
прогресс обшита на лицо и вот сейчас ты
3:45
видел как он сам в первый раз добежал до
3:47
цели причем сделал это способом почти
3:50
похожим на обычный бег 6 меня нафс оков
3:53
и ты посмотри на наши кибер штаны
3:55
насколько сильно они прогрессировали
3:57
помимо того что они теперь могут
4:00
добежать до цели причем не только 1
4:02
иногда происходит вот такой нереальный
4:04
фристайл ограничением на время обучения
4:07
мы сделаем 10 миллионов шагов для
4:10
каждого из наших четырех персонажей
4:12
чтобы потом можно было сравнить кто из
4:15
них научиться быстрее у кого будет лучше
4:17
результаты ну что пришла пора посмотреть
4:20
на на готовую модель
4:21
прошедшую
4:22
5 миллионов шагов и посчитаем сколько
4:26
целей она сможет собрать за одну минуту
4:28
поехали кстати пока не забыл хочу
4:31
сказать спасибо всем кто ставит лайки
4:33
под видосами пишет комментарии
4:35
это очень помогает в продвижении канала
4:37
огромное вам отдельное спасибо погнали
4:40
дальше 60 секунд стартовали и наша кибер
Результат нейросети штанов
4:44
что нанесут в атаку 1 есть 2 есть как ты
4:48
заметил наши кубы с появляется в
4:50
случайном месте на карте
4:52
это помогает избежать определенного
4:54
заучивания то есть допустим от ситуации
4:56
когда нейросеть запомнит конкретно
4:58
расположение каждого из кубов и просто
5:00
будет уже на упреждение туда как бы
5:02
бежать а тут ей нужно постоянно
5:05
адаптироваться и и вот так интересно
5:10
становиться на шпагат чтобы удержать
5:11
баланс
5:14
отличная смогло быть сальто но к
5:16
сожалению не получилось и осталось 20
5:19
секунд и у нас уже есть семь кубов это
5:23
вон 3 хороший результат тем более для
5:25
этой модели kilburn штанов всего лишь
5:28
пять блоков а ходят как и ваще жесть
5:31
10 секунд успеет ли он добежать как
5:34
думаешь мне кажется не успеет хотя вот
5:36
этот приставной шаг в припрыжку 3 2
5:39
успел
5:40
10 это очень хороший результат тем более
5:44
для первого нашего персонажа как ты уже
5:47
понял их будет четыре я сделал такую вот
5:50
небольшую табличку следующий этап
Обучение нейросети черепахи
5:52
эволюции нашего искусственного
5:53
интеллекта
5:54
это вот такая черепаха ноги у нее теперь
5:57
h4 вращаются они по тем же осям по
6:01
которые вращались штаны и самое время
6:03
посмотреть будет ли нейросеть учится
6:05
ходить проще управляя вот таким вот
6:07
черепаха подобным существом первым делом
6:11
оставим только что за время на данный
6:13
момент прошло 600 тысяч шагов и у него
6:16
получается стоять на всех четырех лапах
6:19
кстати говоря для тех кто не понял
6:21
почему я назвал этого персонажа именно
6:23
черепахой думаю сейчас все стало более
6:27
чем очевидно хотя иногда при стечении
6:31
некоторых обстоятельств она даже
6:33
достигает цели
6:34
но такую ходьбу идеально не назовешь
6:38
совсем не назовешь поэтому чтобы наш
6:42
персонаж перестал переворачиваться я
6:45
добавил еще один штраф это минус один
6:47
балл при падении с моментальным
6:49
завершением эпизода и началом нового и
6:53
вот к чему пришла наша нейросеть спустя
6:56
три миллиона шагов в целом она
7:00
справляется со своей задачей правда
7:02
предпочитает бегать бокам возможно
7:06
поворачивать корпус для черепахи ещё
7:09
сложно и иногда получается вот такие вот
7:13
казуса с переворотами но в целом она
7:17
бегает уже гораздо круче поэтому мы
7:20
сразу переходим готовой модели которая
7:22
прошла 10 миллионов шагов 60 секунд для
Результат нейросети черепахи
7:26
нашего второго персонажа стартовали и
7:29
посмотри как эта черепаха летит самого
7:31
начала какая скорость напоминаю
7:36
все наши модели проходят по 10 миллионов
7:38
шагов это сделано для того чтобы была
7:41
какая-то знаешь ясность определенная и
7:43
вот сейчас очень хорошо повезло нашему
7:46
персонажу два рядом заспавнились плохо
7:50
он уже набивать 5 у него ещё 30 секунд
7:53
впереди и наши кибер штаны набили 10
7:58
очень опасный момент сейчас конечно был
8:01
на 7 есть 20 секунд нужно бить чем
8:04
минимум три я на самом деле ожидал что
8:08
черепахи будет получше результат 2
8:13
10 секунд и ещё нужно хотя бы одну
8:17
набить давай давай давай беги беги беги
8:21
2 секунды успеет успеет успеет 120
8:26
вообще на последних секундах просто
8:28
забрал это жесть
8:29
но получается теперь он на первом месте
8:31
на становится
8:32
разница всего лишь одно очко ну тем не
8:35
менее первое место теперь нам нужен
Обучение нейросети паука
8:38
новый персонаж так сказать следующий
8:41
этап эволюции который был бы кру
8:44
чем наша черепаха которая так любила
8:47
переворачивается на спину встречайте
8:50
новую разработку
8:51
это кибер паук отдельный привет
8:53
австралийцам ноги у нас теперь
8:55
расположены вот таким образом а также
8:58
само тело стало гораздо меньше по
9:00
сравнению с черепахой не развить все
9:02
также контролирует положение в
9:04
пространстве ног но теперь при касании
9:06
головой пола сразу будет терять один
9:09
балл и сцены перезагружаться как мне
9:11
кажется за счет более маленького тела и
9:14
нового более эффективного расположения
9:17
ног наш паук должен оказаться более
9:19
быстрым и результативным и сейчас
9:21
обратим внимание вот это результат всего
9:24
спустя 600 тысяч шагов
9:27
если сравнивать с тем к чему дошли наши
9:30
кибер штаны на данный момент то это
9:32
просто небо и земля даже вот эти попытки
9:35
доползти до цели гораздо лучше чем
9:38
падать падать и падать по ходу в нашем
9:43
мини соревнований появился новый лидер и
9:45
это искусный телег паука спустя еще
9:48
миллион шагов
9:48
звук стал себя чувствовать уже гораздо
9:50
более уверенно не разить учиться быстрее
9:53
с такой формой тела и расположением ног
9:56
если спустя всего лишь полтора миллиона
9:58
шагов бог может составить конкуренцию
10:00
черепахи то что будет когда пройдет 10
10:04
миллионов шагов вопрос отличное давай
10:06
сразу посмотрим что у нас получилось в
10:08
итоге наши 60 секунд стартовали и паук
Результат нейросети паука
10:12
бежит к своей первой целью между прочим
10:14
вот если мы сейчас посмотрим повезло как
10:17
ли он прям такие подпрыгивает когда
10:21
бежит и уже прошло только 15 секунд а он
10:26
собрал уже 4 интересно чтобы дальше
10:34
6 и у него ещё 30 секунд интересно
10:37
сможет ли он выйти на первое место ну
10:41
нет по-моему сейчас очень удачно
10:43
заспавнились ему далеко бежать но за
10:46
счет того что у него скорость просто
10:47
какая-то нереально он летит как
10:49
неизвестно кто вот уже девять собрал и
10:51
разворачивается и бегом сразу 10 брать
10:54
11 ну да очевидно что он занимает первое
10:58
место и отодвигает на вторую строчку
11:02
нашу черепаху смотри как летит в
11:04
припрыжку прям до его результат видимо
11:07
12 больше собрать не получится но тем не
11:10
менее это первое место как принципе
11:12
ожидалось жесть последняя модель которая
Создание робота
11:16
будет учиться ходить это человек ну как
11:20
можно делать персонажей которые учатся
11:22
ходить и пройти мимо человека здесь у
11:25
нас имеется сразу несколько частей тела
11:27
помимо ног также туловища руки и голова
11:31
все они соединены между собой и не раз
11:35
сеть контролирует поворот и положение
11:37
всех частей тела какой-то вам слишком
11:41
простой получается нужно дать человеку
11:43
лицо в качестве нашей головы я решил
11:46
вдохновиться вот этими старыми огромными
11:49
мониторами
11:49
которые со временем становились даже
11:51
желтыми и сделал вот это
11:54
а теперь осталось добавить лицом я решил
11:57
использовать пик сильные эмоции и в
12:00
итоге
12:01
глаза и рот у нашего персонажа состоят
12:03
из пикселей она фон я решил добавить
12:05
нули и единицы то бы добавить эффект
12:08
будто персонажа контролировать нейросеть
12:10
кстати сейчас уже на моменте монтажа я
12:13
понял что этот образ моей голове всплыл
12:15
возможно и за просмотр метался код
12:18
буллита но у него все же телевизор на
12:20
голове да и черты тело не не кубические
12:22
как принято у нас на канале а обычные
12:25
кстати идеи о том как можно назвать
12:28
персонажа
12:28
пиши в комментариях мы еще не раз будем
12:30
использовать этот кубический образ в
12:32
будущем так что именно твоя идея может
12:35
закрепиться на канале на очень долгое
12:37
время а теперь переходим к самой модели
Правила обучения робота
12:40
сначала в качестве правил мы сделаем
12:43
штраф за к
12:44
за ней головой и грудью пола и сделаем
12:46
его равным 0,1 за каждый шаг и сразу же
Обучение нейросети робота
12:50
спустя 500 тысяч шагов
12:52
нашего искусственного интеллекта
12:54
появилась первая тактика и это отжимание
12:59
очень результативная тактика и вам скажу
13:02
немножечко не похоже на то как ходят
13:05
люди в реальной жизни поэтому давай
13:08
дадим ему еще полтора миллиона шагов
13:10
может он как-то по-другому будет
13:12
двигаться и что это мы видим
13:15
он научился ползать на спине неужели это
13:19
самый удобный способ передвижения для
13:21
человека проверять я конечно не буду но
13:25
в любом случае это вообще не похоже на
13:27
то как ходят люди в реальном мире с
13:30
другой стороны он даже доцента бегает
13:32
таким способом он еще и даже
13:34
разворачиваться умеют ничего себе но
13:37
пришло время поменять правила для
13:39
нейросети
13:40
теперь падать будет запрещено при
13:43
касании руками либо головой земли
13:46
искусственный интеллект получает минус
13:48
один балл и эпизод заканчивается сможет
13:52
ли он прийти к чему-то новому вопрос на
13:54
самом деле хороший и вот так выглядят
13:58
первой попытки научиться ходить пьяный
14:02
мастер старается старается но все же
14:04
как-то не выходит но уже спустя пару
14:10
миллионов шагов нас появляется прогресс
14:13
поведение работает становится более
14:15
похож на реального человека хотя иногда
14:18
все же оставляет желать лучшего
14:20
однако еще чуть-чуть и он сможет
14:23
сразиться с черепахой но побьет ли
14:25
рекорд паука
14:26
узнаем прямо сейчас наши минута как раз
Результат нейросети робота
14:28
таки начинается и наш человек сразу жить
14:32
к первому кубу 1 куб есть 2 не так
14:35
далеко но по-моему щас упадёт не
14:37
смотрите выдержал баланс 2 есть сейчас
14:41
будет 3 до
14:45
на него смотришь и кажется вот но сейчас
14:48
он точно упадет но в целом получается и
14:52
косарь займи что он даже руками себе
14:54
помогает при беге как в принципе делает
14:55
и люди и
14:57
ты сейчас ладно не упал набрал уже целых
15:01
восемь еще впереди 20 секунд он может
15:04
знать вполне себе первое место и
15:08
немножечко не попал да зато куда то что
15:11
ты делаешь ты сейчас проиграешь
15:13
9 что он делает он мог вполне себе
15:19
занять первое место на в итоге вот
15:24
пробежал миф них упал
15:27
тут за бред он должен был выиграть по
15:30
сути он 8 разобрал за сколько секунд за
15:34
30 наверное 6 полных это не то
15:39
что я ожидал но победителям нашим
15:41
соревнований получается
15:43
оказался паук сейчас значит сижу
Нейросеть читер
15:46
монтирую и заметил что после в двух
15:49
кубов
15:49
сразу засчиталось почему-то 5 что
15:53
произошло почему что это за бак был
15:55
только что я не знаю честно в чем
Итоговые результаты
15:57
причина на получается мы должны снять 2
15:59
балла у нашего персонажа потому что они
16:02
как бы не заслужены должны быть 3 4 5
16:05
получилось два пять шесть семь восемь и
16:08
что получается самое худшее из всех с 6
16:12
почему это я вообще такого не ожидал
16:15
на что если всех этих персонажей взять и
Что в следующем видео?
16:17
заставить сражаться за эти кубики на
16:19
одном поле кто будет успешнее а если еще
16:23
добавить какие-нибудь препятствия
16:25
интересны тогда подписывайся на канал
16:27
чтобы не пропустить новое видео которое
16:30
выйдет между прочим очень скоро
16:32
не забуть поставить лайк это очень
16:34
поможет продвижение видео с ты вопил
16:37
крашер удачи тебе и до встречи в новом
16:39
видео пока
16:41
[музыка]