Николай Никитин | Open Source в ИИ: положение дел. Вступительное слово.

Пересказ видео(Perplexity)

Николай Никитин, руководитель научной группы в университете ИТМО, представил состояние сообщества открытого кода в области искусственного интеллекта. Он отметил, что ИТМО активно развивает проекты в сфере искусственного интеллекта и автоматического машинного обучения, а также занимается поддержкой сообщества open source.

В своем выступлении Никитин подчеркнул важность открытых разработок, таких как библиотека CatBoost от Яндекса и проекты от Тинькофф и Сбера, которые активно участвуют в создании инструментов для машинного обучения. Он также упомянул о значительных усилиях академических учреждений, таких как Высшая школа экономики и МФТИ, которые публикуют свои научные разработки в открытом доступе.

Однако Никитин указал на недостаток культуры открытого кода в России. Он призвал к улучшению взаимодействия между учеными и пользователями, а также к созданию более доступных примеров использования открытых проектов. Важным аспектом является поддержка сообществ и энтузиастов, так как большинство open source проектов существуют на энтузиазме их разработчиков.

Никитин предложил несколько способов поддержки открытых проектов: ставить звёздочки на GitHub, упоминать авторов в публикациях и делиться опытом использования инструментов. Он также акцентировал внимание на необходимости обратной связи с разработчиками для улучшения их продуктов.

Расшифровка видео

Поиск по видео
0:00
Начну с того собственно что представлюсь
0:02
меня зовут Николай
0:04
Никитин моя основная деятельность я
0:07
руковожу научной группой в университете
0:10
ИТМО мы занимаемся различными
0:11
разработками в сфере искусственного
0:13
интеллекта автоматическим машинным
0:15
обучением генеративным дизайном и так
0:17
далее но сейчас на самом не об этом
0:19
сейчас я скорее в своей ипостаси о
0:21
Source энтузиаста поскольку я в ИТМО
0:25
занимаюсь
0:27
развитием сообщества открытого кода
0:30
решений связа с открытым кодом Ну и
0:32
собственно по этой причине выступая в
0:34
качестве чера данной Open Source сессии
0:38
на
0:39
дафе которой сейчас я попробую сделать
0:41
небольшую подводок то есть описать какое
0:44
сейчас вообще состояние осор в
0:46
искусственном интеллекте что хорошо что
0:48
плохо кто этим занимается Перед тем как
0:50
мы непосредственно перейдём к
0:53
выступлениям уважаемых докладчиков
0:55
собственно кто сейчас из бизнеса из
1:00
корпорации в первую очередь занимаются и
1:02
для искусственного интеллекта для
1:04
машинного обучения для Data Science
1:06
вернём всё это в одно понятие и в России
1:09
ну невозможно не вспомнить в первую
1:11
очередь про Яндекс наверное его
1:14
известнейшие библиотека которой очень
1:15
многие пользуются для ML задач – это
1:18
catboost Но тем не менее у них много
1:20
очень других открытых разработок и что
1:22
очень приятно мероприятий посвящённых
1:26
оссу есть проект от теньков
1:30
этно связанный с прогнозированием
1:32
временных рядов множеством других задач
1:34
Есть множество открытых проектов от
1:36
сбера наверное один из самых известных
1:39
это Light fml fml фреймворк который
1:41
буквально на днях набрал 1.000 звёздочек
1:44
Ари от сбера также делает очень
1:48
интересные именно наукоёмкие решения
1:51
которые решают и насущные задачи так
1:54
сказать обычных людей и решают задачи
1:57
учёных специалистов в и для того чтобы
2:00
им жилось лучше и у всех у всего этого
2:03
бизнеса в общем-то отличные сильные
2:05
опенсорс проекта очень приятны такие
2:07
речь это что такие есть речь идёт о
2:10
сотнях тысяч скачиваний Как вы видите
2:13
это и целые экосистемы и отдельные
2:16
репозитории Но что есть помимо этого
2:19
наверное про таких больших игроков то в
2:21
общем-то все так или иначе слышали А вот
2:25
в Академической среде которой я в
2:27
общем-то принадлежу с одной стороны тоже
2:30
есть очень много всего интересного С
2:32
другой стороны про это часто плохо
2:35
слышно поэтому вот
2:37
отдельно хочу показать некоторые
2:40
результаты нашего исследования
2:42
фактически этой сферы
2:44
Ну первым не постеснялись поставить себя
2:48
как сообщество университета ИТМО у
2:50
которых есть более трёх десятков
2:53
различных репозиториев
2:56
созданных научными командами для того
2:59
чтобы результаты исследований облечь в
3:01
какой-то материальный формат которым
3:03
могли бы пользоваться другие люди и
3:06
здесь реворк автоматического машинного
3:08
обучения
3:10
Федот
3:12
более узкоспециализированный инструмент
3:14
для работы с бое соски сетями для
3:16
построения моделей на основе их
3:18
расширения Федота для промышленных задач
3:21
не стал
3:22
перечислять всю кучу потому что
3:23
мероприятие это в общем-то не об этом но
3:25
много всего полезного и интересного
3:27
аналогичного Высшей Школы Экономики
3:29
также по итогам их научных проектов они
3:32
опубликовали достаточно много открытых
3:35
решений у МФТИ есть флагманский продукт
3:39
де палов также чрезвычайно известный уже
3:43
много лет Есть множество интересных
3:45
проектов центра научного
3:46
программирования фти spc у них на на
3:51
котлине на Джаве много таких вот научных
3:55
инструментов которые могут позволить
3:57
решать те задачи которые возникают
3:59
исследователей быстрее и лучше у
4:02
сколтеха также
4:04
есть ряд интересных репозиториев причём
4:07
интересно что это форки потому что к
4:08
сожалению их основной репозиторий на
4:10
гитхабе несколько пострадал от так
4:12
сказать ционного
4:14
давления и вроде бы много всего есть Ну
4:17
вот четыре крупных центра в России из
4:20
исследо из академических занимаются
4:22
много корпораций и в целом-то в
4:25
сфере для искусственного интеллекта даже
4:28
таго Наум есть много всего хорошего есть
4:31
статьи где не ложишь код не пройдёшь
4:33
есть агрегаторы где-то есть журналы и
4:36
треки посвящённые только опенсорс у пор
4:39
не на научную новизну А на качество
4:41
реализации есть репозитории научных
4:43
данных потому что открытые данные это не
4:45
менее важны чем открытый код может даже
4:47
и более но чего не хватает на мой взгляд
4:50
особенно не хватает в России это
4:51
внедрение некоторой культуры открытого
4:54
кода данных моделей документации чего бы
4:57
то ни было в научную среду потому что
4:59
всё
5:00
слишком многие интересные исследования
5:02
затирают просто потому что они
5:04
существуют Ну в таком формате что есть
5:06
артефакт тех статьи с картинками и
5:08
графиками и к сожалению часто на этом и
5:12
происходит остановка максимум
5:13
выкладывается какой-то код но не такой
5:15
которой реально можно было
5:16
использоваться и вот на мой взгляд одно
5:18
из важных направлений сейчас это
5:22
поддерживать и развивать именно вот
5:25
такое сообщество и на внутри российском
5:27
и на международном уровне это об для
5:30
воспроизводимости для реальной использу
5:32
и по факту речь не о том чтобы все
5:34
выложили код Дело не в этом Потому что
5:37
открытые по – это не только код код это
5:40
даже не половина
5:42
дела нужны примеры причём примеры
5:45
наглядные легко сделать наглядный пример
5:47
для какого-то простенько
5:59
но к сожалению учёные не очень любят
6:02
пытаться доносить свои результаты до
6:04
Широкой публики но к сожалению та же
6:06
проблема И в опенсорс которые
6:08
по-хорошему нужно преодолеть потому что
6:10
иначе все инструменты остаются
6:12
чрезвычайно нишевым и даже про отличные
6:14
проекты никто ничего не знает
6:16
всевозможные практики из области
6:18
разработки по тесты архитектура и так
6:22
далее Это тоже сложно муторно и часто не
6:25
профильна не профильная деятельность для
6:27
детистов для воро других исследователей
6:31
Но вот к сожалению без этого невозможно
6:33
привлечь реальных пользователей даже
6:35
других учёных к своему опыту
6:37
собственного проекту и Последний пункт
6:39
про общение по факту одна из тяжёлых
6:44
объективно тяжёлых обязанностей тенера о
6:47
Source проектов – это общаться с
6:48
пользователями часто с неблагодарным
6:50
пользователями которые требуют
6:52
реализовать какую-то функцию но сами
6:54
ничем не помогают которые заносят
6:56
реквесты где дольше разбираться с ревью
6:59
чем самому тоже самое сделать и так
7:00
далее но к сожалению весь опыт
7:03
накопленный на данный момент показывает
7:05
что без всего этого абсолютно никак И
7:08
если с пользователями не общаться то
7:10
просто они будут пользоваться чем-то
7:12
другим Поэтому вот как одна из частей
7:14
сообщества необходимо вот такое
7:16
пространство где и авторы могут
7:19
рассказать о своей разработке и
7:21
пользователи могут немножечко помучить
7:23
авторов Ну в более дружелюбном формате
7:24
чем просто перекидывание иш и вот чем
7:29
сою можем похвастаться тем что мы на
7:31
базе ИТМО создали такое сообщество
7:33
посвящённое именно открытому научному
7:35
коду и где уже более восьми сотен
7:38
участников порядка десятка
7:41
мероприятий в уютном барном формате мы
7:43
уже провели даже Вот поставил QR код
7:47
потому что Приглашаю всех кому это
7:48
интересно присоединиться Разумеется этим
7:50
занимаемся не только мы вот уже
7:52
упомянутое сообщество центра научного
7:54
программирования МФТИ также собрало
7:57
отличный дружный коллектив где
8:00
самое главное что можно лично задавать
8:03
вопросы тем кто делает что-то сложное и
8:06
как правило это
8:10
вкатывается такой эффект который Никакое
8:13
разглядываем RM никогда не
8:16
даст так как многие в этой сфере и в
8:20
таком Академическом искусственном
8:21
интеллекте даже в прикладном Science СТО
8:24
вкатываются в разработку Особенно оную с
8:27
нуля обектив привыкли
8:31
работать в Юпитер ноутбуках накидывать
8:35
скрипты и больше никому их не
8:37
показывать Мы создали набор рекомендаций
8:40
с чего начать Как писать redmi про что
8:43
они должны быть Как настраивать C CD
8:46
ботов шаблоны лучшие практики и так
8:48
далее Есть ли в этом что-то невероятно
8:50
новое по содержанию да по-честному Нет
8:52
пра это с 70х годов кажется пишут но мы
8:55
попытались это всё сформулировать так
8:57
чтобы было максимально полезно И
8:59
наглядно тем кто раньше этим не
9:01
занимался Вот возможно пригодится опять
9:04
же мы открыты для любого фидбека
9:08
добавления убавления и так далее И один
9:12
из с одной стороны вопросов с другой
9:15
стороны предложение которое хочется
9:17
закинуть в сообщество это Как поддержать
9:19
открытые проекты Потому что всегда старт
9:21
нового проекта – это стресс Ну вот
9:23
создали его на гитхабе Ну рассказали
9:25
коллегам друзьям А вот а что дальше
9:29
вот если вы увидели такой проект который
9:31
вроде бы классный а вроде бы Выглядит
9:33
как будто им никто не пользуется чем вы
9:35
можете ему помочь Ну первый пункт
9:38
звёздочки многие к ним справедливо
9:40
относятся скептически изначально Это был
9:42
на гитхабе вообще инструмент для
9:44
добавления в Избранное А сейчас
9:46
становится таки такой универсальной
9:49
метрикой для оценки качества Ну конечно
9:51
по-хорошему Это неправильно
9:54
естественно аудитори
9:59
что второй
10:00
проект лучше в 100 раз и даже в два раза
10:04
но в то же время звёздочки существует и
10:07
с ний приходится считаться Поэтому если
10:09
увидели проект который хотите поддержать
10:12
Не поленитесь потратьте полсекунды и
10:15
поставьте лучше потом Если не понравится
10:17
то обратно снимите пото что авторов это
10:19
очень мотивирует и поддерживает не
10:22
требуя абсолютно ничего от
10:26
проставляется так сказать высокой наукой
10:28
и пишет статьи или хотя бы при принты Но
10:31
если вы пользуетесь открытыми
10:32
инструментами вот особенно такими не
10:35
очень массовыми не забывайте ставить
10:38
ссылочки на репозитории их на статьи
10:40
обычно вми авторы указывают когда есть
10:42
какая-то статья процитировать вроде бы
10:44
мелочь но объективно это может помочь
10:48
автору такой открытой библиотеки
10:50
получить например научный Грант Потому
10:52
что его статьи много цитируют и
10:54
продолжит развивать эту библиотеку
10:56
Понятно что так или иначе всё очень
10:58
сильно вязана на явное неявное
11:00
финансирование и если вам что-то помогло
11:04
то всегда полезно поискать способ как вы
11:07
можете помочь авторам упоминания в
11:10
обзорах подборках и так далее сейчас
11:12
Очень модно вести Telegram каналы делать
11:15
подборки ссылок блоги и так далее тоже
11:19
если что-то понравилось особенно если
11:20
чем-то воспользовались даже если оно не
11:23
особо Вам понравилось там что-то не
11:25
заработало Расскажите про этот опыт
11:27
лучше знать что пользо
11:30
возмущаются что какая-то функция
11:31
работает плохо Чем ощущать Что ты что-то
11:35
делаешь А это вообще уходит в никуда и
11:39
часто по факту это не так люди
11:41
пользуются и бывает Очень неожиданно
11:42
увидеть там на юту обзор своего свого
11:45
проекты от вообще незнакомых людей но
11:47
для этого эти обзоры кто-то должен
11:48
делать тоже тяжёлая работа со стороны
11:51
пользователей Понятно времени у кого не
11:52
хватает Но это нужно делать обратная
11:55
связь опять же чтото неработает даже
11:58
вобще пустить там где-то функция
12:01
неправильно названа в примерах Напишите
12:03
разработчикам одно дело если людям пишут
12:05
и они их игнорируют таких никто не любит
12:08
с другой стороны часто авторы отвечают
12:11
за 10 минут дают подробнейший фидбек
12:15
чинят улучшают разработку Ну в такой
12:18
некоммерческой сфере понятно что тяжело
12:20
ожидать идеала с самого начала поэтому
12:23
Старайтесь помогать разработчикам если
12:25
они сами готовы идти навстречу Ну и
12:27
последнее по значению так сказать не по
12:29
важности поддерживайте сообщество и
12:32
конкретных людей Энтузиастов потому что
12:35
практически никакие сообщества осор что
12:38
в России что в мире не имеют устойчивого
12:41
финансирования какой-то господдержки и
12:43
так далее Это всегда на энтузиазме людей
12:46
и энтузиазм не бесконечен поэтому
12:50
Выступай на мероприятиях беритесь за
12:53
помощь в организации опять же если
12:56
видите что кто-то Эксперт в какой-то
12:58
теме при е выступить к себе Если у вас
13:00
есть своя площадка вот такой нетворкинг
13:03
обмен контактами знакомствами он
13:05
цементирует эту среду и позволяет
13:08
какому-то вообще незнакомому человеку
13:09
который может быть е ещё в школе там
13:11
Через пару лет выкатить свою Open
13:14
библиотеку в 100 раз легче потому что
13:16
можно будет просто выйти на сцену
13:17
рассказать все на неё посмотрят начнут
13:19
пользоваться а они проделывают тот путь
13:22
который уже 10 раз проделан до них и
13:23
которы и завязнуть просто потому что
13:27
сколько можно закончили силы

Поделиться: