Быстрее пули! Бесплатная нейросеть GROQ - прямой конкурент GPT4! на базе Mixtral8x7b

Оценили: 93

Краткое содержание видео(ии почему то заменил GROQ на Neuro.ink)

Нейронная сеть Neuro.ink, работающая на базе моделей LaMDA 2 и Lama, произвела фурор в интернете благодаря своей высокой скорости генерации ответов.

Видео сравнивает Neuro.ink с ChatGPT3, оценивая их по следующим параметрам:

Скорость генерации: Neuro.ink генерирует ответы в считанные секунды, в то время как ChatGPT3 может тратить на это до 30 секунд.
В тесте на логическую задачу Neuro.ink справился за 1,8 секунды, а ChatGPT3 — за 40 секунд.
Качество ответов: Neuro.ink корректно ответил на все тестовые вопросы, включая логические задачи.
ChatGPT3 допустил ошибки в некоторых ответах, в том числе в логической задаче.
Функциональность: Neuro.ink позволяет переключаться между моделями, использовать ассистента, задавать системные промты и настраивать параметры.
ChatGPT3 обладает схожим набором функций, но Neuro.ink работает значительно быстрее.
Доступность: Neuro.ink бесплатен для использования.
ChatGPT3 имеет платную подписку.
Аппаратные требования: Neuro.ink требует меньше вычислительных ресурсов, чем ChatGPT3.

Вывод: Neuro.ink является достойным конкурентом ChatGPT3 и предлагает ряд преимуществ, включая более высокую скорость генерации, точность ответов, бесплатное использование и меньшие аппаратные требования.

Дополнительные сведения:

Neuro.ink предлагает API для интеграции с программными решениями.
Автор видео предлагает курсы по разработке чат-ботов и программных решений на базе ИИ.

В целом, Neuro.ink является мощным инструментом, который может быть полезен для различных задач, связанных с генерацией текста.

Расшифровка видео

0:01
друзья Привет меня зовут Романов
0:03
Александр и я Рад приветствовать вас на
0:05
моём канале Нейро инжениринг сегодня с
0:09
вами разберём
0:10
Нейрон новую к
0:14
которая работает на базе моделей ль и
0:18
Lama 2 и она на самом деле просто
0:22
взорвала Интернет тем что она очень
0:26
быстро генерирует ответы я
0:28
МКА
0:31
gpt чей версии как она работает мы
0:34
сравним с вами ответы которые она
0:36
генерить и собственно говоря увидим её в
0:39
деле есть несколько
0:42
плюсов Почему её стоит использовать и
0:45
стоит обратить на неё внимание первый
0:47
плюс то что она бесплатная На
0:49
сегодняшний момент для того чтобы ей
0:51
воспользоваться достаточно пройти
0:54
регистрацию второй плюс её можно
0:57
использовать с пром
1:00
То есть у не есть здесь возможность
1:02
прописать системный промт То есть кем
1:04
она будет в данный момент Какие роли
1:06
выполнять то есть также как мы например
1:08
используем это в блоке кода когда мы
1:10
задаём роль ассистента нашего и причём
1:12
что это бесплатно базовая например
1:14
модель gpt 3 с по такого не может
1:18
и здесь ещё какой один из плюсов мы
1:21
можем её использовать по а запросам то
1:23
есть мы можем создавать про
1:25
решени запросы на данный момент
1:28
бесплат поэтому Для нас это будет не
1:31
стоить ровным счётом ничего Итак поехали
1:34
Давайте возьмём с
1:35
вами какой-то тестовый промт но я вот
1:38
здесь делал генератор холодных писем
1:44
и Давайте посмотрим на скорость ответа
1:47
вот вопрос у нас такой ты эксперт по
1:50
написанию холодных писем на электронную
1:51
почту твоя задача написать письмо не
1:53
менее 400 слов по технологии шимана
1:55
использовани форматирования текста и на
1:58
русском языке использую следующую водные
2:00
данные и у нас здесь вводных данных
2:02
Давайте посмотрим как быстро она сейчас
2:04
будет генерить ответ смотрите оп У нас
2:08
ответ сгенерирован за 2 секунды вы
2:10
представляете эту скорость просто
2:12
невероятно это очень круто Теперь
2:15
Давайте сравним результат нашем чате gpt
2:19
че мы закидываем туда тот же вопрос
2:22
отправляем и начинаем
2:25
ждать gpt у нас
2:28
медленно
2:30
сгенерировать нам ответ ну уже считаем 4
2:35
5 6 7 8 9 10 11
2:43
12 13 14 Дальше можно не считать то есть
2:48
вы понимаете этот ответ будет сейчас
2:50
генерироваться около 30 секунд минимум 2
2:54
секунды и 30 секунд То есть
2:58
реально
3:00
минимум в 20 раз быстрее уже 40 секунд
3:05
мне генерирует да в 20 раз быстрее ответ
3:09
чем чат же пяти четвёрка причём по
3:12
качеству ответов я вам могу сказать что
3:15
для таких задач он делает это не
3:19
хуже Вот то есть по сути вот Ну давайте
3:23
почитаем Меня зовут Романов Александр я
3:26
Генеральный директор компании специали
3:30
рамы ищем возможности для установления
3:33
партс отношений наш опыт преимуществе
3:35
связа с разработкой предлагаем обсудить
3:39
сотрудничество открываем
3:41
грок смотрим
3:44
Здравствуйте представленных программных
3:47
решений обладая более чем десятилетним
3:48
опытом наш опыт заключается в разработке
3:50
по програмного обеспечения ваша
3:53
компания
3:58
про областях то есть очень крутой ответ
4:02
на самом деле Ну вот в этой сфере он
4:04
ничем не хуже Давайте посмотрим теперь
4:06
как он будет отвечать на логические
4:09
задачки То есть как он решит логическую
4:14
задачу вот к примеру такую Единственный
4:19
минус здесь Ну нету истории ответов Ну
4:22
что же поделать
4:24
Вот Итак логическая задача а кто-то
4:28
подарил златовласки подарок положив него
4:30
На него его на крыльцо у дома Злато лас
4:34
что это был один из его друзей стрекоза
4:35
Огонёк или Ушастик Но как это узнать
4:38
когда каждый из них указывает на одного
4:41
из двух других правду сказал только
4:43
стрекоза Если вы если бы каждый указывал
4:46
не на того на кого указывает А на
4:49
второго ТО Ушастик был бы единственным
4:51
Кто сказал правду так кто же подарил
4:56
подарок Ага давайте е раз просим на
4:59
русском
5:06
языке потому что он не понимает что надо
5:09
отвечать на русском если ему задали
5:10
вопрос на русском ответ стрекоза
5:13
подарила подарок
5:15
златовласки и этот Ответ
5:19
неправильный Давайте зададим этот вопрос
5:22
чату
5:28
gpt Что же он нам
5:40
ответит Угу То есть он нам раскладывает
5:43
всё по полкам то есть трикоза говорит
5:49
правду кто же подарил подарок у нас
5:52
вопрос кто же подарил
5:58
подарок
6:07
Ну Огонёк не даритель надо было просто
6:11
сказать Дай
6:12
ответ Он указывает на стрекозу реально
6:16
подал Ушастик подарок подарил Ушастик И
6:19
это тоже неправильный ответ подарок
6:22
подарил Огонёк то есть и G провалился в
6:26
логике
6:28
и в логике Давайте следующий
6:34
вопрос кто из трёх друзей таким же
6:37
образом подарил подарок
6:39
синеглазки на вопросы синеглазки Огонёк
6:42
отвечал что это Ушастик та-та-там и так
6:47
далее правильный ответ здесь у нас
6:49
стрекоза с
6:54
вами давайте пока он отвечает мы здесь
6:57
проверим грог
7:04
[музыка]
7:09
Судя по
7:12
всему ответ Синеглазка не может узнать к
7:15
спросив у каждого из них сказал правду
7:17
кто это
7:19
сделал то есть вообще мимо темы Исходя
7:24
из этого подарок синеглазки сделала
7:28
стрекоза
7:30
Вот и этот ответ правильный чат gpt
7:33
здесь ответил правильно грог промахнулся
7:37
но отвечает конечно Он
7:40
просто молниеносно Давайте ещё
7:47
вопрос только мы сократим эту историю
7:50
чтобы он нам не расписывал
7:55
логику Ответ дай на русском не
8:00
расписывать логику ответа Просто напиши
8:08
результат
8:12
О’кей
8:13
Итак
8:16
Тестируем Давайте откроем новый чат для
8:19
чистоты
8:23
эксперимента так рок нам Стопудово уже
8:26
дал ответ да Парис реши
8:29
Согласно предположения Афродита являтся
8:31
прекраснейшей
8:33
богине таким образом парень сможет
8:35
выбрать Афродиту Как самую прекрасную
8:39
богиню ответ
8:45
Афродита Афродита Ну смотрите здесь
8:48
ответ
8:52
правильный А чат GP ответил
8:56
неправильно вот вам и весь результат
9:00
Так что ребят при всм при этом у нас
9:02
получается ничья то есть два ответа были
9:05
неправильных у обоих
9:08
нейроном варианте у нас ответила одна
9:11
правильно чат GP грок неправильно здесь
9:13
грок ответил правильно чат gpt
9:15
неправильно Ну то есть при том что грок
9:18
отвечает за буквально секунды смотрите
9:21
то есть Меньше меньше секунды у него
9:23
потребовалось для этого ответа и при
9:25
этом G Дат
9:28
ответы в раз дольше Я считаю что это
9:31
достойный конкурент Давайте теперь
9:33
рассмотрим следующий момент во-первых
9:36
здесь можно переключаться между моделями
9:38
второй момент смотрите здесь можно
9:40
использовать ассистента здесь есть такая
9:42
же история как
9:44
граун песочница в которой мы можем
9:47
задавать параметры на самом деле мы и
9:49
здесь можем задать наши
9:51
параметры например количество
9:53
максимально ответо в токенах
9:56
температуру это креативность Чем ниже
9:59
температура тем менее креативен будет
10:02
наш и
10:04
ассистент То есть это всё мы здесь можем
10:06
задавать мы можем здесь задать также
10:09
системный промт то есть Можем не
10:11
прописывать к примеру А вот эту историю
10:13
когда мы а Пишем письмо
10:17
э
10:19
для холодно электронного холодной
10:23
электронной почты мы можем например
10:24
Здесь часть вопроса сразу сделать промто
10:29
а например
10:30
непосредственно вводные данные то есть
10:33
промто именно системным а вводные данные
10:36
такие например как цель задавать здесь и
10:39
получится что у нас здесь системный
10:40
промт уже будет содержать а стартовую
10:43
уже данные
10:45
и основные параметры будут меняться в
10:48
теле письма перво подсказки которые мы
10:51
уже задаём и собственно вот тот же самый
10:54
у нас ответ буквально за 1,8 секунды Вот
10:59
и он понимает что нужно сделать То есть
11:01
ВС отлично то есть здесь в песочнице
11:05
можно делать тоже самое то есть здесь
11:07
можно задавать системный промт таким же
11:11
образом
11:12
и здесь уже
11:15
непосредственно прописывать свою
11:18
подсказку вот в
11:20
этом в этой всей истории здесь можно
11:23
выбирать модель тестировать также
11:25
задавать температуру двигать только
11:26
здесь можно ровать
11:29
режиме вот такого диалога также
11:33
настраивая модель тонко под себя то есть
11:36
обучая так скажем подсказками и
11:38
системным промпто для своих задач
11:43
а соответственно здесь можно прописать
11:47
роль пользователя роль ассистента
11:48
пользователя ассистента то есть тем
11:50
самым задав диалог контекст то есть мы
11:52
можем сразу прописать как должен
11:54
ответить ассистент в этом случае задать
11:56
вопрос прописать вопрос ассистента потом
11:59
Написать сообщение и с учётом вот этого
12:02
контекста и нашего системного
12:06
промтайм образом мы можем его добу это
12:09
очень круто на самом деле это такая же
12:11
история как и с использованием чата gpt
12:15
Вот посмотрите здесь происходит тоже
12:18
самое вот в этой всей части
12:21
ассистенты вот мы можем здесь создать
12:24
нового Ассистента Так давайте ГРАУ
12:26
откроем вот наша площадка ГРАУ мы можем
12:29
также создавать здесь ассистента то же
12:32
самое прописываем здесь такой же
12:34
системный промт вот
12:37
базовый Так давайте его здесь сюда ответ
12:41
Наш здесь у наш у нас будет системный
12:43
промт базовый который мы используем
12:48
А в нашей стартовой подсказке в начале
12:53
текста Вот то есть сюда и здесь мы можем
12:57
выбирать модель также здесь у нас
12:59
функции кода интерпретатора можем здесь
13:02
подшивать файлы но в грог пока мы не
13:04
можем это делать и здесь Мы также можем
13:06
делать
13:09
варианты также Вот подшивать здесь
13:13
инструкции ассистента
13:17
и добавлять их в качестве
13:22
ответов Вот то есть на самом деле по
13:25
функционалу у нас достаточно рута
13:28
история в грок и смотрите здесь у нас
13:31
есть а запросы а ключи то есть мы можем
13:34
бесплатно получить Здесь нам ничего не
13:36
надо платить то есть это тоже очень
13:39
крутая история вот мы получаем наш ключ
13:42
и мы можем его использовать в наших
13:43
программных решениях и на сегодняшний
13:46
момент чтобы например установить
13:49
модель до сих пор даже смотрите ничего
13:52
не сделал то есть как бы совсем
13:57
прям очень медленно вот на сегодняшний
14:01
момент чтобы
14:02
нам
14:04
получается установить например эту
14:06
модель локально вот
14:10
эту историю всю с Мистраль например вот
14:14
8X 7b то нам минимум нужно от 20
14:19
по-моему 4 гиб оперативной памяти на
14:22
компьютере на нашем локальном сервере
14:24
плюсом достаточно мощную видюху то есть
14:25
здесь мы можем это использовать
14:27
бесплатно То есть я вам рассказывал
14:28
предыдущих видео о возможности
14:30
распаковать например некоторые модели на
14:32
свой локальный компьютер на ноутбук даже
14:35
можно ставить на Macbook А с стю гигами
14:38
модели восьми гогова например
14:40
которые сделаны с по принципу
14:44
квантизация то есть там они достаточно
14:46
хорошо устанавливаются и mistr например
14:48
очень хорошо работает на локальных
14:50
машинах но Mix tril конечно она не
14:53
устанавливается для неё очень мало
14:54
памяти она не ну не ставится на машины с
14:57
16 гигами вот здесь пожалуйста вы можете
15:01
тестировать эту модель бесплатно очень
15:03
крутое Решение вот а Я рекомендую
15:06
обязательно
15:11
попользоваться
15:15
решение для Telegram бота на базе Рог и
15:19
протестируем с вами вместе как это будет
15:21
работать насколько это будет реально
15:23
более скоростное решение по ответам то
15:25
есть мы сравним два Telegram Бота один
15:27
будет работать на ассистенте с чатом gpt
15:31
с одинаковыми причём
15:33
промтайм работать на базе грок и мы
15:36
мираль модель 8X 7b мы сравним с вами
15:39
как это будет реально в деле насколько у
15:42
нас модели будут конкурировать между
15:45
собой и Стоит ли сегодня платить за чат
15:48
gpt вот когда есть такие крутые решения
15:52
которые абсолютно бесплатны Я думаю что
15:55
вывод каждый для себя сделает сам Ну я
15:58
уверен что если вы попробуете найдёте
16:01
свои плюсы массу плюсов для
16:02
использования этой нейронки Итак друзья
16:05
Надеюсь что был Вам полезен ставьте
16:08
лайки комменты будем делать с вами ещё
16:10
разборы Вот и до новых встреч Кстати
16:13
если вам интересно какие-то обучения по
16:16
нейронка Если вы хотите для себя
16:18
осваивать другие более сложные решения
16:23
то вы можете написать мне в личку У меня
16:25
есть Достаточно уже такие
16:29
глобальные уроки по разработке чат-ботов
16:32
по разработке программных решений на
16:34
базе искусственного интеллекта которые
16:36
вы можете применять и пройдя это
16:38
обучение Можете даже очень круто а
16:41
использовать Это для монетизации всех
16:44
рад был видеть Всем пока До новых
16:46
встреч

Расшифровка видео

Похожие записи