Нейросеть сделала анализ за меня. Аналитики данных будут не нужны?

Может ли нейросеть ChatGPT делать анализ как аналитик данных и будут ли нужны аналитики в будущем? Сегодня я протестирую нейросеть и мы узнаем это и постараемся сделать выводы.

Читаемый текст по видео про анализ нейросетью работы аналитика данных:

Вступление:

Автор видео - Маша, аналитик данных.
Цель видео - протестировать нейросеть ChatGPT и ответить на вопрос, может ли она заменить аналитиков данных в будущем.

Тестирование навыков нейросети:

  1. SQL-запросы: Нейросеть успешно справилась с простыми SQL-запросами.
    Для более сложных задач ей потребовалась помощь человека.
  2. Визуализация данных: Нейросеть смогла сгенерировать базовые визуализации (гистограммы, круговые диаграммы) по данным из Яндекс.Метрики.
    Она также предложила код для создания более сложных визуализаций в Python.
    Автору видео пришлось самостоятельно корректировать некоторые визуализации и интерпретировать данные.
  3. Ответы на вопросы собеседования: Нейросеть дала разумный ответ на вопрос собеседования в компанию Lift.
    Однако ответ был практически идентичен одному из решений, найденных на форуме, что ставит под вопрос ее оригинальность.
    Нейросеть хорошо справилась с текстовыми вопросами, но для более глубокого анализа ей не хватало контекста.
  4. Тестовое задание Яндекса: Нейросеть не смогла выполнить тестовое задание Яндекса из-за недостатка данных.
    Она correctly identified the need for more information and suggested additional data sources.

Заключение:

Нейросеть ChatGPT может автоматизировать некоторые задачи аналитика данных, такие как подготовка данных, очистка данных и генерация простых визуализаций.
Однако она не может заменить человека в решении более сложных задач, требующих critical thinking, domain expertise, and creativity.
В ближайшем будущем профессия аналитика данных будет трансформироваться, но вряд ли будет полностью заменена ИИ.

Дополнительные мысли:

Автор видео считает, что нейросеть может быть полезным инструментом для начинающих аналитиков, помогая им осваивать базовые навыки.
Опытные аналитики могут использовать нейросеть для автоматизации рутинных задач, высвобождая время для более важных задач.
Автор видео призывает аналитиков stay up-to-date with the latest advancements in AI and use it to their advantage.

Ссылки:

Telegram-канал автора: [неправильный URL удален] (ссылка будет в описании видео)

P.S.

Видео было записано 21 апреля 2024 года.
Автор видео находится в Великобритании.

Расшифровка видео


0:00
Может ли нейросеть делать анализ как
0:02
аналитик данных и будут ли нужны
0:04
аналитики в будущем Меня зовут Маша Я
0:07
аналитик данных и сегодня мы
0:09
протестируем нейросеть и постараемся
0:12
ответить на этот вопрос последовательно
0:14
я проверю как нейросеть справляется с
0:17
несколькими задачами связанными с
0:19
аналитикой данных с написанием SQL
0:22
запросов разность сложности задачи
0:25
визуализации данных и получения инсайтов
0:28
из данных Как нейросеть ответит на
0:31
вопрос собеседования на аналитика данных
0:33
в компанию лифт и как решить тестовые
0:36
задания в Яндекс на должность
0:37
маркетингового аналитика в первую
0:40
очередь проверим навыки SQL любой
0:43
аналитик должен знать SQL и пользоваться
0:46
этим инструментом но Умеет ли это
0:49
нейросеть Давайте проверим Для начала я
0:52
спросила у самой нейросети может ли она
0:54
вообще писать SQL запросы на что они
0:57
Евросеть ответила что Да она может
0:59
написать SQL запросы проверять нейросеть
1:03
на знание SQL будем с помощью сайта
1:05
хакер ранг это сайт на котором можно
1:07
решать задачи бесплатно причем различные
1:10
сложности легкие средние сложности и
1:14
сложные Итак выберем легкие вопрос Ну
1:18
например выберем вот эту задачу на сайте
1:21
хакеранг у меня уже подготовлен запрос
1:24
для нейросети и я его Вставляю вот сюда
1:28
На что нейросеть быстро выдает сам
1:31
запрос я его Вставляю на хакеранг и так
1:35
мы видим что кот сработал верно Однако
1:38
это очень легкая задача начального
1:41
уровня но Давайте перейдем к более
1:43
сложной задаче например вот этой также я
1:47
уже подготовила условия задачи для Чад
1:50
gpt они выглядят вот в таком формате
1:54
а чат же пить и не может принимать
1:56
никакие скрины таблицы и так далее
1:59
только текст То есть все условия задачи
2:01
нужно переводить в текст здесь уже
2:04
подольше так как кот Более сложный и
2:07
даже дает какой-то пояснение в конце
2:09
смотрите код и здесь выполнен правильно
2:13
В данном видео я не буду проверять решит
2:17
ли нейросеть сложные задачи давайте я
2:19
оставлю это на проверку вам шаг второй
2:22
проверяем как нейросеть может
2:24
визуализировать и делать выводы из
2:26
данных оно перед тем как работать сейчас
2:29
gpt я опять же у нее спросила может ли
2:32
она проанализировать данные на что
2:34
нейросеть ответила утвердительно и
2:37
выдала целый список того что она может
2:39
делать с данными она может и очищать
2:42
данные подготавливать данные и делать
2:45
трансформацию данных
2:48
визуализацию
2:50
интерпретацию
2:51
Давайте некоторые вводные по текущей
2:55
задаче на визуализацию интерпретацию
2:57
данных допустим у меня малый бизнес и у
3:00
меня нет аналитика но у меня есть чат
3:03
gpt и я могу проконсультироваться с ней
3:06
у меня есть некоторые данные из Яндекс
3:08
метрики по моему трафику и я хочу чтобы
3:13
нейросеть сделала визуализацию и инсайты
3:17
но перед этим шла в Яндекс метрику
3:20
грузила оттуда CSV файл и уже СВ файла
3:23
скопировала данные и Вставляю
3:27
в нейросеть кстати
3:29
нейросеть сразу
3:33
пытается сделать выводы то есть я ее
3:36
даже еще и не просила но она уже делает
3:38
какие-то выводы Итак она пишет что в
3:41
этой таблице собраны данные посещаемости
3:42
веб-сайты из различных источников данные
3:44
включает информацию о количестве сеансов
3:46
пользователей процента роботов
3:47
показатели отказа в глубине страницы и
3:48
времени на сайте дальше Она говорит что
3:50
крупнейшим источником трафика является
3:51
прямой трафик который приходится
3:52
примерно 78 и 3 процента сеансов и 812
3:55
процентов пользователей с другой стороны
3:56
наименьший источник трафика это трафика
3:58
социальной сети Facebook и далее Далее в
4:00
таком же духе это достаточно простые
4:02
выводы в принципе их можно увидеть и так
4:05
из данных скажете вы но я точно знаю что
4:09
начинающие аналитики этим занимаются и
4:11
делают такие простейшие выводы мы хотели
4:14
еще сделать визуализацию поэтому Давайте
4:16
попросим
4:19
сделать визуализацию она не может
4:22
сделать визуализацию Однако имеется
4:25
ввиду что она не может сделать самого
4:28
визуальное представление но она может
4:30
например написать код для визуализации
4:32
Да кстати я не просила ее сделать
4:36
конкретно визуализацию в питоне но она
4:39
делает в питоне можно было уточнить
4:42
табло например powerbi тон Ар или что-то
4:48
другое Итак она нам сделала гистограмму
4:51
и круговую диаграмму
4:55
Также сейчас делает линейный график мы
4:59
можем самостоятельно сделать
5:01
визуализацию используя эти данные
5:05
для этого достаточно использовать любую
5:07
среду разработки я копирую код и
5:11
Вставляю его
5:13
на когл запускаем Так мы видим круговую
5:18
диаграмму отношения роботов и не роботов
5:20
можно было здесь за основу взять
5:23
например не роботов а виды трафика к
5:26
примеру которые там были Я считаю что
5:29
нейросеть в принципе в целом справилась
5:32
с этой задачей какие-то были недочеты
5:35
которые можно было исправить опять же
5:37
другое дело что все равно даже в этой
5:40
задаче не обойтись без человека
5:42
попросить ее исправить текст например
5:46
чтобы он не слипался либо же исправить
5:49
это самостоятельно
5:50
Также
5:52
нейросеть можно попросить сделать
5:54
дополнительные какие-то графики потому
5:56
что она сделала всего три визуализации и
5:59
но основываясь на тех данных которые у
6:02
нее были можно было сделать и другие
6:04
визуализации об этом ее просто можно
6:06
было попросить но с другой стороны это
6:09
хороший способ для тех кто особо не
6:12
владеет аналитикой самостоятельно
6:14
какой-либо анализ это во-первых а
6:17
во-вторых для тех кто владеет аналитикой
6:19
автоматизировать
6:21
рутинные задачи не тратить на них время
6:24
А высвободить время для чего-то более
6:27
стоящего и ценного третий шаг проверим
6:30
Сможет ли нейросеть ответить на вопросы
6:33
собеседований в компанию лифт вводные
6:36
данные этот вопрос был взят С платформы
6:39
стратос кратча Это сложный вопрос
6:42
лиф внедряет совместные поездки И
6:46
рассматривает возможность добавления 30
6:49
секундного периода ожидания для нашего
6:51
алгоритма для определения дополнительных
6:53
совпадений какие показатели вы бы
6:56
использовали для оценки этого и как бы
6:58
вы провели этот эксперимент Итак мы
7:00
видим что нейросеть нам пишет чтобы
7:02
оценить влияние внедрение совместных
7:04
поездок можно использовать следующие
7:06
показатели это частота совпадения
7:07
процент поездок которые приводят к
7:09
совместным поездкам То есть как часто
7:10
алгоритм успешно находит дополнительные
7:12
совпадение в ожидании то есть среднее
7:14
время которые пассажиры тратят на
7:15
ожидание дополнительных совпадений
7:16
включая первоначально 30-секундный
7:18
период ожидания уровень принятия процент
7:20
пассажиров который соглашаются
7:22
участвовать совместных поездках когда им
7:23
предлагают
7:24
продолжительность поездки средняя
7:26
продолжительность совместных поездок по
7:27
сравнению с отдельными поездками
7:30
и удовлетворенность пассажиров
7:31
общеудовлетворенность пассажиров
7:32
совместными поездками измеряемая
7:34
опросами и рейтингами также нейросеть
7:37
пишет что можно провести эксперимент и
7:39
описывает как его можно провести можно
7:41
рассуждать относительно некоторых
7:44
деталей но в целом ответ разумный Но что
7:47
здесь я хочу отметить вот здесь вот на
7:50
форуме есть решение от пользователей это
7:54
решение было 1 февраля 2023 года
7:58
смотрите вот этот ответ Он практически
8:02
идентичен ответ у нейросети кроме за
8:06
исключением нескольких показателей из
8:09
чего мы Делаем выводы что
8:11
первое либо нейросеть вот отсюда могла
8:16
найти вот этот ответ как ты его
8:19
чуть-чуть видоизменить добавить туда
8:21
другие метрики вот из этих ответов
8:23
возможно из чего-то другого
8:26
Это первый вариант
8:28
второй вариант вот этот человек
8:31
статья он мог спросить у нейросети и
8:35
соответственно сюда этот ответ запихнуть
8:39
не полностью Как вы думаете какой из
8:42
этих вариантов более вероятный а вывод
8:47
такой по этой задаче что с текстовыми
8:49
вопросами нейросеть справляется хорошо я
8:53
задавала ей много различных вопросов и
8:56
получала вполне допустимый ответ и
8:59
четвертый шаг проверим как нейросеть
9:01
справиться с задачей на должность
9:03
маркетингового аналитика от Яндекса
9:05
уровень вакансии кстати был задан Middle
9:08
или даже чуть выше метла между мидолом
9:11
синер Однако само задание Как мне
9:14
кажется оно больше к уровню Junior
9:17
раньше звучит так команда перформанс
9:20
маркетинга подготовила для вас выгрузку
9:22
результатов рекламных кампаний какие
9:24
выводы Вы можете сделать в работе
9:26
рекламных кампаний запущенных в январе
9:29
сформулируйте документы исследования где
9:31
презентуете вашу выводы Вот в тестовом
9:35
задании вот за январь выглядели данные
9:39
данных не так много их мало Итак мы
9:43
видим что нейросеть ответила нам что она
9:45
не может сделать какой-либо анализ
9:47
поскольку предоставленные данные
9:48
содержит результаты только некоторых
9:50
рекламных кампаний я не могу сделать
9:52
однозначных выводов об эффективности
9:53
рекламных кампаний запущенных в январе
9:55
Для этого мне нужно больше информации
9:57
контекста Однако если вы предоставите
9:59
мне дополнительную информацию рекламных
10:00
кампаниях бизнес целях я смогу помочь
10:02
вам проанализировать данные получить
10:04
представление об эффективности этих
10:05
компаний Кроме того наличие данных за
10:07
предыдущие месяцы или периоды было бы
10:08
полезно для понимания тенденции
10:09
сравнения эффективности этих компаний с
10:11
течением времени я здесь полностью
10:12
согласна когда я увидела Это задание но
10:16
мне кажется это задание какое-то с
10:18
подвывертом потому что явно данных
10:20
недостаточно Ну Какой анализ мы можем
10:22
сделать на вот этих данных
10:26
что здесь можно было бы сделать я и
10:28
написала что Представь что у тебя эти
10:30
данные есть какие ты выводы тогда
10:32
сможешь сделать И получаю следующий
10:35
ответ цена за действия для различных
10:37
компаний значительно различается причем
10:39
некоторые компании имеют более высокую
10:40
себе чем другие например компания такая
10:42
компания такая-то например такая-то
10:45
компания 85 какая-то 484 эта информация
10:48
может быть полезна для определения того
10:50
какие компании являются более
10:51
рентабельными с точки зрения увеличения
10:52
числа конверсий
10:55
существует разница в коэффициенте
10:56
конверсии для разных компаний причем в
10:58
одних компаниях коэффициент конверсии
11:00
выше чем других и приводится пример и
11:03
так далее и тому подобное то есть да Мы
11:06
также как аналитики данных например
11:08
выполняя Это задание мы не можем делать
11:11
какие-то однозначные выводы из этих
11:13
данных потому что их явно недостаточно
11:16
Однако же мы можем сделать некоторые
11:19
предположения что сделала нейросеть так
11:23
Сможет ли чат gpt заменить в будущем
11:25
аналитиков Я хотела бы спросить об этом
11:28
чат gpt как языковая модель
11:31
разработанная Open я не могу заменить
11:34
аналитиков данных
11:36
Привет я создан чтобы помогать с
11:39
языковыми задачами такими как ответы на
11:42
вопросы и генерация текстом аналитики
11:44
данных играют важную роль в анализе
11:46
интерпретации данных для поддержки
11:48
принятия решений у них есть уникальный
11:51
набор навыков включая статистический
11:54
анализ визуализацию данных и
11:55
рассказываний историй которые необходимы
11:58
для преобразования необработанных данных
12:00
в осмысленные идеи да мы видим что Этот
12:03
уникальный набор сейчас
12:06
был продемонстрирован чат gpt
12:10
мы увидели что чат gpt тоже может быть с
12:15
таким уникальным набором и делать те же
12:17
самые задачи
12:20
Хотя такие инструменты на основе И как я
12:23
и могут автоматизировать определенные
12:25
задачи такие как подготовка и очистка
12:27
данных они еще недостаточно совершенны
12:29
чтобы заменить людей аналитиков данных
12:32
ключевое слово здесь недостаточно
12:34
совершенно На текущий момент то есть вот
12:37
это вот несовершенная модель которая
12:39
была только-только выпущена на рынок Это
12:42
можно сказать первая версия этой модели
12:45
она уже справляется хорошо с задачами Ну
12:49
по крайней мере уровня Junior точно а
12:52
что же тогда будет дальше аналитики
12:55
данных привносят Творческий подход
12:57
критическое мышление и опыт в предметной
12:59
области Что необходимо для осмысления
13:01
сложных данных и извлечения значимых
13:04
идей в будущем такие инструменты на базе
13:06
И как я могут расширить работу
13:08
аналитиков данных предоставляем более
13:11
быструю точную информацию высвобождая
13:13
время для более высокоуровневого анализа
13:16
и принятия решений Однако маловероятно
13:18
что в ближайшем буду аналитики данных
13:21
будут полностью заменены искусственным
13:23
интеллектом опять же ключевое слово в
13:26
ближайшем будущем
13:29
Ну я не верю либо хочется верить в это
13:33
Слабо что в принципе людей заменят
13:36
машины
13:38
если и заменят то в любом случае я
13:43
надеюсь что найдется людям какое-то
13:45
применение то есть люди будут что-то
13:47
делать но не служить машину
13:52
но в ближайшем будущем Мне кажется что
13:54
профессия аналитик данных точно
13:56
видоизменятся частично
13:59
задачи будут автоматизироваться
14:03
рутинные высвобождаться время для более
14:07
каких-то задач на подумать кстати в
14:10
своем Telegram канале я скинула из
14:13
статьи как еще можно использовать чат
14:16
gpt в работе аналитика Поэтому если
14:18
интересно переходите ссылка будет в
14:20
описании

Поделиться: