Искусственный интеллект | DIY или Сделай сам | Лайфхаки для гиков
Обычно Google translate используют для перевода речи транслируемой микрофоном.
Но в один момент, автору потребовалось перевести подкаст Медузы в текст.
Идея лежала на поверхности и наверняка программы для этого должны были присутствовать. Так -же как сделано в Gogle translate.
Но, гуглением, программы не нашлось, кроме двух сайтов. Которые использовали по уверениям их авторов всю мощь искусственного интеллекта Google.
Первый нашелся русскоязычный сайт https://speechpad.ru/blog/windows-integration/
Но, как бы не было обидно, магия не сработала…
Был найден англоязычный сайт: https://speechlogger.appspot.com/ru/
Результат — тот же. Но, было в отличие от предыдущего — объяснение.
Там было показано, как реализовать, казалось бы, простую идею: пустить в качестве сигнала микрофона — аудио файл.
Для этого необходим драйвер VB-CABLE Virtual Audio Device Он OpenSourse.
Искренняя благодарность “прогнившим западным” альтруистам!
Устанавливаем (проверено под Win 10) и настраиваем микрофонный вход в системе, на этот драйвер.
Открываем Gogle translate, нажимаем кнопочку с изображением микрофона и запускаем любой плейер с аудио — файлом.
И — Вааля! Магия работает, на ваших глазах появляются строки текста.
Точность распознавания, на глаз 85-97 %. Но, есть ограничение — 5 тыс. символов, что немало. Поэтому приходиться останавливать запись, копировать текст и продолжать далее.
Заодно происходит перевод на второй выбранный язык. О боже, сколько странных переводов появится!
Дополнение: есть способ без ограничений на количество символов. — это Google Docs, он так-же работает но, только без перевода на второй язык. Спасибо dioneo
Как мне кажется, Google блокирует постоянные подключения с одних IP. Поэтому ценность этого способа — в том, что все IP не заблокируешь и соответственно, этот способ более работоспособен. Тут уже слово разработчикам и большим “гуру”, чем автор.
Всем добра и удобства.