Обзор на видео
Видео рассказывает о последней амбициозной цели Google в области искусственного интеллекта — создании системы, способной моделировать весь физический мир.
В Google DeepMind сформирована команда под руководством Тима Брукса, ранее работавшего в OpenAI, которая занимается разработкой модели, способной понимать и воспроизводить физические законы планеты. Это достигается с помощью обучения на огромных потоках мультимодальных данных — видео, аудио, данных с датчиков и прочего.
Цель — создать основу для общего искусственного интеллекта, способного мыслить с точки зрения физики реального мира.
Видео также затрагивает новые проекты Google, такие как G20 — большая языковая модель нового поколения, а также инструменты для создания видео и 3D-миров, которые могут быть объединены в единую систему.
Google продолжает верить в гипотезу масштабирования, предполагающую, что увеличение данных и параметров моделей ведет к прогрессу, хотя критикуется за экологические и технические ограничения.
Практическое применение таких симуляций огромно: обучение роботов в виртуальной среде, создание реалистичных игровых миров, научные эксперименты и моделирование сложных процессов, например, распространения вирусов.
Google также меняет стратегию, делая функции ИИ более доступными для пользователей Workspace, что усиливает конкуренцию с Microsoft.
В целом, видео показывает, что Google движется к созданию ИИ, который не просто анализирует данные, а понимает и моделирует физическую реальность, что может стать прорывом в развитии искусственного интеллекта в ближайшем будущем.
Сделай обзор видео на 1000 символов https://www.perplexity.ai
Расшифровка видео
0:00
Итак последняя цель Google в области
0:01
искусственного интеллекта создать
0:03
систему способную моделировать весь
0:04
физический мир это реально и это
0:05
происходит прямо сейчас в Google Deep
0:06
Mind мы поговорим о том что это значит
0:07
Почему Google считает что это критически
0:09
важно для общего искусственного
0:10
интеллекта и как это связано с их более
0:11
широкой стратегией в области включая их
0:12
новый проект G 20 Мы также рассмотрим
0:14
несколько важных объявлений о том что
0:15
Google делает и более доступным в
0:16
workspace и как это вписывается в общую
0:18
гонку и особенно в сравнении с Microsoft
0:19
начнём с главного Team БКС ранее
0:21
работавший в Open ai прошлой осенью
0:22
покинул эту компанию и перешёл в Google
0:23
Deep Mind теперь он возглавляет новую
0:25
команду занимающуюся моделированием мира
0:26
по сути они хотят создать ей модель
0:27
которая сможет понимать и воспроизводить
0:28
физические законы нашей планеты Это
0:29
довольно амбициозная задача если вам
0:31
интересно что значит моделирование мира
0:32
то это по сути обучение и системы на
0:33
огромных потоках мультимодальных данных
0:35
видео аудио Возможно с датчиков работо
0:36
техники в общем всего что поможет и
0:37
предсказывать Что произойдёт в той или
0:38
иной среде также как мы люди полагаемся
0:40
на наши знания о физических законах
0:41
чтобы ориентироваться в посевной жизни
0:42
конечная цель – сделать эти системы
0:43
настолько продвинутыми что они станут
0:44
основой для общего искусственного
0:45
интеллект по словам брукса Они не
0:46
преувеличивают масштаб этой задачи они
0:48
тесно сотрудничают с другими проектами
0:49
Google в области и G w и дни теперь G
0:51
уже некоторое время находится в центре
0:52
внимания Это большая языковая модель
0:54
нового поколения от Google WoW – это
0:55
инструмент для создания видео Ани – это
0:56
базовая Модель которая может создавать
0:57
трёхмерные миры из одного изображения
0:59
если объедините технологии мощные
1:00
языковые модели продвинутое создание
1:01
видео и возможность создавать целые
1:02
трёхмерные миры то можно увидеть как
1:03
кусочки пазла начинают вкладываться в
1:04
единую картину искусственного интеллекта
1:06
который может мыслить с точки зрения
1:06
физики реального мира всё это связано с
1:08
тем что Google продолжает верить в так
1:09
называемую гипотезу масштабирования
1:10
которая гласит что если мы будем
1:11
добавлять больше данных и параметров в
1:12
модели искусственного интеллекта то
1:13
сможем добиться значительного прогресса
1:14
в развитии интеллекта Однако критики
1:15
утверждают что мы мо можем достичь
1:16
предела возможной масштабирования данные
1:17
ограничены а воздействие на окружающую
1:18
среду при обучени огромных моделей
1:20
довольно велико некоторые эксперты
1:21
утверждают что нам нужны новые
1:21
архитектуры а не просто увеличение
1:22
размера но пока Google продолжает
1:24
наращивать мощности в объявлениях в
1:25
приёме на работу в команду по созданию
1:26
симуляции Нового Мира прямо говорится
1:27
что они считают масштабирование видео и
1:28
мультимодальных данных критически важным
1:29
для достижения и общего назначения они
1:30
также ищут инженера исследователя для
1:31
моделирования мира в своём главном офисе
1:32
в маун viw подчёркивая что хотят довести
1:34
симуляторы мира до предела доступной
1:35
вычислительной мощности Но зачем нам
1:36
вообще нужно моделировать весь реальный
1:37
мир Ну есть несколько причин во-первых
1:39
Если вы можете точно моделировать
1:40
реальную физику Вы можете обучать
1:41
роботов в виртуальной среде что намного
1:42
безопаснее и дешевле чем в реальной
1:43
жизни представьте себе робота которому
1:45
нужно научиться ходить вместо того чтобы
1:47
учиться ходить в реальной жизни он может
1:48
тренироваться в виртуальной среде пока
1:49
не научатся ходить по-настоящему полу
1:50
Кроме того разработчики видеоигр
1:51
интерактивных развлечений могут
1:52
использовать эти суперсовременные
1:53
физические симуляторы для создания
1:54
игровых миров которые кажутся невероятно
1:56
реальными только представьте себе игру в
1:57
которой объекты и окружение ведут себя
1:58
почти как реальной жизни и всё это
1:59
благодаря искусственному интеллекту
2:00
который изучает законы физики но это не
2:01
только игры и Робототехника
2:03
исследователи могут использовать эти
2:04
продвинутые симуляторы для научных
2:05
экспериментов например для моделирования
2:06
погодных условий или даже
2:07
распространения вирусов среди населения
2:08
не проводя эксперименты в реальном мире
2:10
и самое главное эти системы могут помочь
2:11
в создании интерактивных сценариев в
2:12
реальном времени где искусственный
2:14
интеллект должен понимать контекст
2:15
окружения и даже язык тела в
2:17
пространстве это действительно похоже на
2:19
фантастический фильм кстати разработках
2:21
ближайшего будущего ходят слухи что
2:22
Google собирается выпустить крупное
2:23
обновление своей модели Gemini под
2:24
названием Gemini 20 Flash thinking
2:26
expense 123 которое должно выйти 23
2:28
января 2 пго года это информация
2:30
просочилась во время прямой трансляции
2:31
Google haan где парень по имени повен
2:33
заметил некоторые детали название шф
2:34
thinking подразумевает более быстрое или
2:36
динамичное мышление что может помочь в
2:37
принятии решений в таких задачах как
2:38
моделирование в реальном времени Если
2:39
это так то это хорошо вписывается в
2:40
Новую миссию по моделированию мира
2:42
возможно Google планирует интегрировать
2:43
эти возможности фнн в свою платформу A
2:45
Studio предоставляя разработчикам
2:46
простой интерфейс для создания
2:47
продвинутых симуляций или иммерсивный
2:48
опытов Теперь давайте вернёмся к
2:49
объявлению о вакансии которое
2:50
опубликовал Google инженер исследователь
2:51
моделирования мира Если Вы внимательно
2:52
Изучите то поймёте что основной внимание
2:54
уделяется созданию инфраструктуры для
2:55
гиганских генеративных моделей
2:55
физического мира в этой должности упор
2:57
делается на решение самых сложных задач
2:58
с помощью масштабирования обучения этих
2:59
симуляторов на большом уровне создание
3:00
метрик для того что они называют
3:01
физическим интеллектом работу с
3:02
генерацией в реальном времени и
3:03
выяснение того как интегрировать всё это
3:04
с мультимодальный языковыми моделями это
3:05
огромная проблема потому что вы не
3:07
просто анализируется текст или
3:08
изображение вы создаёте динамическую
3:09
четырёхмерное реальности Кроме того
3:10
реклама ссылается на так называемый
3:12
горкий опыт концепцию и которая гласит
3:13
что простые методы которые хорошо
3:14
масштабируется часто превосходит более
3:16
сложные разработанные вручную решения
3:18
Это означает что архитектура должна быть
3:19
максимально простой и понятной чтобы
3:21
можно было масштабировать её без сложных
3:22
ограничений но есть ещё один важный
3:24
элемент головоломки Google также меняет
3:25
свою корпоративную стратегию делая
3:26
функции и бесплатными для всех
3:27
подписчиков workspace раньше за доступ к
3:29
бизнес нужно было доплачивать 20
3:31
долларов за пользователя в месяц теперь
3:32
Google включил эту стоимость в обычную
3:33
подписку на workspace которая поражала с
3:34
12 до 14 долларов за пользователя То
3:36
есть всего за два дополнительных доллара
3:37
компании получают все эти преимущества и
3:38
такие как автоматическое создание таблиц
3:40
юме встреч средства для создания заметок
3:41
с помощью и редактирования видео и
3:42
многое другое без необходимости платить
3:44
тем временем Microsoft тоже участвует в
3:45
этой гонке запустив бесплатную версию
3:46
свого Чак Бока ко для Microsoft 365 с
3:48
возможностью оплаты по мере
3:49
использования Microsoft по-прежнему
3:50
предлагает своё решение премиум-класса
3:51
за 30 долларов за пользователя в месяц
3:52
Для тех кто хочет получить все
3:53
возможности Но тот факт что Google и
3:54
Microsoft делают ей более доступным
3:56
говорит о многом об этой гонке каждая
3:57
компания пытается привлечь как можно
3:58
больше пользователей в свою системы
4:00
Похоже что стратегия заключается в том
4:01
что если все пользуются вашим
4:02
искуственным интеллектом то вы повышаете
4:03
лояльность к бренду собираете больше
4:04
пользовательских данных что позволяет
4:05
усовершенствовать вашу модель и целом
4:06
остаётесь переди гонки за создание
4:07
искуственного интеллекта нового уровня
4:08
Джерри Диш президент Google по облачным
4:09
приложения рассказал о том что главны
4:10
препятствием для вни искуственного
4:11
интелекта в бизнес является стоимость
4:12
снизив Дополнительные расходы и немного
4:13
поси базовую стоимость попис рабочее
4:14
пространство Google по сути говорит Мы
4:15
хотим чтобы вы сразу увидели ценность
4:16
искуственного интеллекта без больших
4:17
финх затрат точки зрения Google Объедини
4:19
фун искуственного интеллекта в существу
4:20
пакет может уметь соление привлечь
4:21
больше людей е использованию и помо им
4:22
Понять насколько мощны могу быть эти
4:23
имен быть кос более иние ресов и
4:25
пользователе кожен иве инк буду чува они
4:27
суру те кому нуно точ зре об картины это
4:29
смел ускорение вве инле теперь от иле
4:32
для Боль польва прий просто бо Поль
4:36
Далекое понимание того как лю на самом
4:37
деле работ бу написание элероны писем и
4:39
обработка данны добавьте это ороно бите
4:40
видео провину ние с помою инструментов
4:42
как и данны тех реально вре вы получите
4:43
искусственный Интек который просто
4:45
анализирует тек А предсказывает как
4:45
объекты должны вести себя смолиной седе
4:47
конечно создание настоящей модели мира
4:48
сопряжено с серьёзными трудностями
4:49
законы физики сложны данных очень много
4:50
и нельзя игнорировать этические вопросы
4:52
Тим Брукс из Google Deep Mind
4:53
подчёркивает важность междисциплинарной
4:54
командной работы именно по этой причине
4:55
тем временем слухи о том что Google
4:56
разрабатывает G 20 намекают на Большой
4:58
прорыв в области искусственного особенно
5:00
в 2025 году когда гонка и с Microsoft
5:02
разгорится ещё сильнее Так что же мы
5:03
приближаемся к будущему в котором и
5:05
действительно понимает физический мир
5:06
или это просто Хай Расскажите что вы
5:07
думаете об этом Если вам интересно Не
5:08
забудьте поставить лайк подписаться и
5:10
ждать новых обновлений в области и