С помощью HomoGlyphs делаем невозможным поиск в тексте при этом сохраняем читаемость

С помощью HomoGlyphs делаем невозможным поиск в тексте при этом сохраняем читаемость

Расшифровка видео
0:00
Привет Сегодня обработаем текст таким
0:02
образом чтобы сделать поиск по нему
0:04
невозможным или почти невозможным Итак
0:07
на экране вы видите
0:10
два открытых файлика
0:13
слева исходный текст справа
0:16
текст обработанный с помощью алгоритма
0:19
Homo rips
0:21
поиск по исходному тексту у нас возможен
0:25
берем первый попавшийся слово например
0:27
модели
0:33
вызываем поиск и ищем сразу же находится
0:38
это слово
0:40
в обработанном же тексте
0:43
пытаемся искать это же самое слово
0:47
[музыка]
1:00
и блокнот не находится это слово Хотя
1:03
глазами я вижу Вот оно это слово
1:07
Итак чем же прикол А дело в том что в
1:11
кириллице и латинице есть символы
1:13
которые похожи друг на друга но имеет
1:16
разный код для человека например это
1:19
буква О
1:21
и вот это буква О
1:23
абсолютно одинаково выглядят Хотя здесь
1:26
кириллическая буква О Здесь латинская
1:29
буква О ну и та же самая история с
1:32
буквой у слева к юридическая буква у
1:36
справа
1:38
латинский символ Ирик
1:41
и так по всему тексту
1:45
текст обрабатывал с помощью
1:47
скрипта которые написал на питоне
1:52
в этом скрипте нужно поменять только два
1:55
параметра это файл в котором находится
1:58
исходный текст и файл куда будет
2:01
писаться обработанный текст
2:04
также нужно обращать внимание на
2:06
кодировку текстовых файликов с которыми
2:08
Мы работаем она прописывается здесь
2:12
то есть самом скрипте ничего сложного
2:14
теперь по поводу Что нужно для запуска
2:18
этого скрипта
2:20
во-первых нужно установить Python
2:23
переходим по данной ссылке Она как
2:26
всегда будет в описании под видео
2:29
нажимаем кнопочку
2:32
после того как Фарик скачается мы его
2:35
запускаем и нажимаем далее Далее то есть
2:39
там ничего сложного установка очень
2:41
простая
2:43
после установки пайтона нам нужно еще
2:45
установить модуль который называется
2:46
Homo gips
2:49
вот страничка этого модуля
2:53
написано заклинание установки Это
2:56
заклинание нужно запускать командной
2:58
строке скопировали перешли командную
3:01
строку
3:02
вставили
3:04
нажали Enter
3:07
ждем пока модуль скачается становится
3:18
модуль установился теперь запускаем
3:20
скрипт
3:23
так как у меня находится в текущий
3:25
рабочей папке полигон отсюда я его
3:28
запущу
3:37
пару секунд и у нас появился новый
3:40
текстовый файлик
3:42
который мы можем открыть и посмотреть
3:44
результат работы например попробуем
3:47
найти слово
3:48
создание
4:04
слово мы видим
4:11
найти мы его не можем
4:14
то есть мы получили то чего добивались
4:17
нужно обратить внимание что в скрипте мы
4:19
использовали только две раскладки
4:21
русскую и английскую Если же мы будем
4:25
использовать больше например французскую
4:27
украинскую то текст можно перемешать еще
4:31
сильнее и Это значительно затруднит
4:34
поиск

Поделиться: