Таймкоды
00:00:00 Обвинения в адрес DeepSic
- OpenAI утверждает, что китайская компания DeepSic использовала их модель для обучения конкурирующего продукта.
- В интервью Financial Times OpenAI заявил о наличии доказательств дистилляции данных.
00:00:42 Суть дистилляции
- Дистилляция позволяет переносить знания из больших моделей в меньшие, достигая схожих результатов за меньшие деньги.
- OpenAI считает, что DeepSic нарушила их пользовательское соглашение, используя ответы ChatGPT для обучения своей модели.
00:01:41 Нарушение авторских прав
- Автор видео указывает на то, что почти все сайты в интернете устанавливают запреты на коммерческое использование данных.
- OpenAI неоднократно признавал, что использует ворованные данные для обучения своих моделей.
00:04:20 Пример с Google
- Google продвигал свои «любимые сайты», используя данные издателей, что привело к снижению трафика у сотен тысяч сайтов.
- Автор сравнивает ситуацию с OpenAI, подчёркивая двойные стандарты в отношении использования данных.
00:05:25 Реакция на обвинения
- Автор выражает надежду, что другие компании последуют примеру DeepSic и начнут использовать данные OpenAI.
- Подчёркивается символичность ситуации: OpenAI сначала использовал данные всего интернета, а теперь жалуется на использование своих данных другими.
00:06:12 Поддержка техногигантов
- У OpenAI есть поддержка среди техноблогеров, которые оправдывают использование ворованных данных.
- Автор критикует правительства за поддержку техногигантов и отсутствие защиты авторских прав.
00:07:40 Заключение
- Автор призывает зрителей следить за развитием событий и надеется на появление новых конкурентов у OpenAI.
- Завершает видео призывом подписаться и поставить лайк.
Расшифровка видео
0:00
AV coder поехали без реверан сов Open
0:03
утверждаю что у них есть доказательства
0:04
что китайская компания deeps нагло
0:06
воспользовалась их моделью чтобы обучить
0:09
конкурирующий продукт в интервью для
0:10
financial Times они возмущённо сообщили
0:13
что Deep seek стартап из поднебесный
0:15
будто бы взял данные Open ai для
0:17
собственного обучения у меня на это есть
0:19
что сказать несколько неофит их мнений
0:22
об Open ai и обо всех прочих Техно
0:25
гигантах которые делают то же самое если
0:27
вы легко обижаетесь или рядом дети лучше
0:30
вернитесь к этой теме когда маленькие
0:32
уши уснут Итак создатель Chat gpt из
0:34
сан-франциско заявил financial Times что
0:37
у них есть доказательство дистилляции то
0:39
есть приёма который они приписывают EPS
0:42
Суть дистилляции в том чтобы снять
0:43
знания с больших и мощных моделей и
0:46
влить их в модели поменьше добиваясь
0:48
схожих результатов но на значительно
0:51
меньшие деньги проблема по мнению Open
0:53
ai в том что кто-то взял эти ответы с их
0:56
платформы Да ещё и пустил на создание
0:59
собственного коммерческого проекта то
1:01
есть openi явно обиделись кто-то посмел
1:04
обучать свою Нейрон гоняя её по ответам
1:06
Chat gpt вместо того чтобы парсить тонны
1:09
сайтов люди просто спрашивали Chat gpt
1:11
миллионы вопросов и таким образом
1:13
обучали модель openi кстати говорит что
1:15
их пользовательское соглашение запрещает
1:18
копировать что-либо из их сервиса или
1:20
использовать полученные ответы для своих
1:22
продуктов способных особенно составить
1:24
конкуренцию CH gpt А если вы хотите
1:27
стать наконец и сервисами наты то я
1:29
Рекомендую вам отличный курс по промт
1:31
инжинирингу Где вы освоите не только
1:33
работу с текстовыми моделями для
1:35
написания продающих текстов маркетинга
1:38
инструкции к чему-либо и даже прозы с
1:40
поэзией это позволит например вам
1:42
зарабатывать на первоклассных промпто
1:44
которым мы вас кстати и обучим но также
1:46
и создавать иллюстрации аудио и
1:48
видеоматериалы которые затем можно
1:50
продать если вы новичок в этом деле либо
1:53
пробовали и у вас не получалось внятного
1:55
результата либо уже давно этим
1:56
увлекаетесь курс вас точно не разочарует
1:59
и по стилю изложения материала и по
2:01
наполнению и даже продвинутые техники
2:04
разберём В общем всем кто смотрит
2:06
весомая скидка по ссылке в описании так
2:08
вот Open ai утверждает что это нарушение
2:11
их правил мол другим нельзя брать их
2:14
контент чтобы делать свои коммерческие
2:15
модели вот э неожиданность у меня между
2:18
прочим шокирующая новость для вас Мистер
2:20
альтман почти все сайты в Интернете
2:23
устанавливают те же запреты Дада те
2:25
самые которые вы с упоением парсли все
2:28
они тоже защищены авторским правом и там
2:31
везде написано что Нельзя просто так
2:33
взять оттуда данные и коммерчески их
2:35
использовать Однако это никогда не
2:38
останавливало openai они свистнули
2:40
столько информации явно не
2:42
предназначенной для свободного
2:44
коммерческого использования потом
2:46
загрузили её в свою большую языковую
2:48
модель и стали зарабатывать миллиарды то
2:51
есть весь их бизнес весь их продукт по
2:53
сути построен на краже чужих данных
2:56
буквально например вы могли неделями
2:58
собирать материалы и выкладывать на сайт
3:00
а openi приходили парсли всё под частую
3:04
впихнуть
3:07
переработанные знания вашим же
3:09
потенциальным клиентам без этих
3:11
ворованных данных Open ai пришлось бы
3:13
потратить триллионы чтобы легально
3:15
выкупить их Кстати сам Альма сам
3:18
неоднократно это признавал А ещё в
3:20
прошлом году сатья надела Надеюсь
3:23
произношу правильно из Microsoft у них
3:25
если кто не знает 50% в Open ai он
3:28
заявлял что всё что доступно в открытом
3:31
интернете — это Fair Gain то есть бери
3:33
не хочу хотя Согласно законам об
3:36
авторском праве это полная чушь во всех
3:38
развитых странах Нельзя просто
3:40
копировать чужой контент и наживаться на
3:43
нём но господину надели Видимо всё равно
3:46
лишь бы обогащаться самому и радовать
3:48
акционеров Microsoft Зато как только
3:51
кто-то проделал то же самое но уже с
3:53
Open всё крики и возмущения китайцы из
3:57
ПК выложили свою модель утверждая что
3:59
обучили её всего за 6 млн долларов и на
4:03
куда более слабом железе чем у openai
4:06
получилось по их словам сопоставимо даже
4:09
с лучшими моделями серии O естественно
4:11
теперь openi Пит что вложили огромные
4:14
деньги в Chat gpt А китайцы просто взяли
4:16
эти данные сделали свой продукт и
4:18
продают дешевле
4:21
ой-ой-ой Какой кошмар А вы не думаете
4:24
что точно тоже самое испытывали сайты и
4:26
издатели когда вы воровали их данные в
4:29
качестве примера за последний год Google
4:31
прикончил трафик сотен тысяч издателей
4:33
продвигая так называемые любимые сайты с
4:36
коммерческими
4:38
договорённостей
4:41
так вот они были обучены на данных тех
4:44
же издателей те сайты годами трудились а
4:46
теперь фактически стёрты из поисковой
4:48
выдачи весь Google показывает только
4:51
свои решения и зарабатывает ещё больше
4:53
Open ai ничем не лучше оно поступило
4:56
ровно так же То есть когда Open ai
4:58
Microsoft и Google и прочие заходят и
5:01
беззастенчиво копируют чужие данные это
5:03
ок раз в открытом доступе значит
5:05
пользуйся но когда кто-то другой решил
5:07
провернуть тот же трюк против них это
5:10
вдруг чудовищное злодеяние Да как
5:12
посмели знаете что это Это самая
5:15
маленькая скрипка которая играет самую
5:17
грустную мелодию для управленцев из Open
5:20
ai сочувствия у меня к ним Нет вообще
5:23
живёшь с мечом умрёшь от мяча и я
5:25
надеюсь что произойдёт Это довольно
5:27
быстро Если вы сами считаете что
5:30
общедоступные данные можно брать
5:32
бесплатно и богатеть на них не платя
5:34
авторам то почему другие не могут взять
5:36
ваши это логично и справедливо надеюсь
5:39
так дальше всё и будет Возможно дипси
5:42
даже купили у них токенов чтобы получить
5:44
все эти данные А может быть это же
5:47
китайцы может быть они наклепа миллионы
5:49
аккаунтов и пользовались бесплатными
5:51
квотами честно говоря второй вариант мне
5:53
даже милее потому что тогда они вообще
5:55
ничего не заплатили openi за эти данные
5:58
как собственно и openi согласитесь это
6:00
особенно символично те кто сперва
6:02
позаимствовал контент всего интернета
6:05
теперь жалуются что кто-то позаимствовал
6:07
у них это как заявлять в полицию о краже
6:10
машины которую вы сами вчера угнали меня
6:12
ещё корёжит что у openi и всего движения
6:15
вокруг больших языковых моделей есть
6:17
целая фанатская армия Техно братишек и
6:21
прочих
6:23
инфоцигане стоит кому-то пожаловаться на
6:26
воровство данных Они тут же заявляют так
6:28
устроен интернет авторское право
6:30
устарело твои условия никому не нужны
6:33
если ты не согласен Значит ты отстал от
6:35
жизни Ну что Каково вам когда всё
6:38
повернулось против вас самих когда
6:40
кто-то тоже говорит скажи Прощай своему
6:43
авторскому праву и выпускай дешёвую
6:45
копию добивая ваш бизнес неприятно
6:47
правда Какое горе хотите защитить свои
6:50
авторские права хотите чтобы нарушители
6:53
наказывали по закону и чтобы вам платили
6:55
компенсацию есть весьма Точное слово
6:58
которое ёмко описывает то что сейчас
7:00
происходит с ними это карма карма пришла
7:03
и приложила openi прямо по самодовольно
7:06
физиономии я действительно Надеюсь что
7:08
ещё дюжина китайских индийских
7:10
филиппинских или даже казахских контор
7:13
поступит также и сведёт весь этот LM
7:15
гешефт к нулю Грустно что правительство
7:18
США Британии и многих других стран стоят
7:20
горой за Техно боссов в Америке
7:22
запустили какой-то проект stargate в
7:25
Британии собираются переписывать законы
7:27
об авторском праве существу
7:30
веками лишь бы разрешить и компаниям
7:32
тянуть чужие данные ведь это же будущее
7:36
чувак конечно никакой коррупции и
7:38
личного интереса здесь нет Что ж друзья
7:41
запасаемся попкорном и наблюдаем как
7:43
стареющего гегемона надавали по щам ещё
7:46
в одной отрасли а о том какая ещё страна
7:48
выпустит подобную модель можно поспели в
7:52
комментариях смело с вами был ви
7:54
подписывайся ставь императорский палец
7:56
вверх чтобы не пропустить ещё выпуск о
7:59
том как китайцы проверяют своим
8:01
императорским пальцем простату Сэма
8:03
альтмана и прочих техно

