Как работает капча «Я не робот»?

Как работает капча «Я не робот»?

Это графика, требующая громоздкого OCR, которого нет у большинства ботов (судя по всему)? Тем не менее, это фиксированная графика, и на самом деле не требует OCR, а простого сопоставления с образцом в библиотеке одного элемента. Я просто не понимаю, как это создает непреодолимое препятствие для ботов.

решение1

Капча отслеживает поведение мыши. Хотя боту легко нажать кнопку на форме, ему сложно имитировать хаотичное движение мыши, перемещаемой человеком.

Однако это не невозможно:https://www.youtube.com/watch?v=fsF7enQY8uI

решение2

Текст в капчах не распознается OCR. Для распознавания текста OCR использует стандартные правила определения того, что такое текст.

Подходящий текст обычно искажен, не параллелен или расположен прямыми линиями, параллельными горизонту, и содержит случайный мусор, с которым OCR не может справиться.

т.е. не соответствуют обычным правилам того, как должен выглядеть текст.

Поскольку глубокое обучение становится все более распространенным, это лишь вопрос времени, когда капчи перестанут работать.

Существует множество различных капч, некоторые из которых требуют выбора ряда графических элементов, имеющих определенную тему (например, которые являются частями знака, которые впоследствии могут быть дополнительно уточнены и затем добавлены в метод библиотеки ниже, после того как весь знак будет собран и текстовая графика извлечена тем же методом), которые компьютер не сможет распознать. С этим типом вас всегда просят определить известный сценарий и, как правило, неизвестный для добавления в библиотеку известных, как только будет получено достаточно идентичных ответов.

Наиболее распространены два способа использования изображений:

1.
Одно случайно искаженное изображение, сгенерированное из слова, затем добавлен дополнительный мусор, чтобы запутать OCR. Как «подсаливание» списка паролей путем добавления «случайного» мусорного слова, чтобы остановить радужную атаку.

2
Другая форма — использование фотографий (обычно слов) чего-то, что люди должны были решить, что это такое, потому что изображение слишком сложно для автоматического распознавания. Обычно это внешние параметры компьютерного программирования того, что определяет текст (или знак или что-то еще) и часто окружено случайной средой.
Для этого требуется большая библиотека фотографий с известным «текстом» или другими параметрами, например, которые являются частью знака и т. д.

Примечание:
Библиотека для второго метода увеличивается за счет предоставления 2 изображений, которые пользователи пытаются правильно идентифицировать.
1 изображение известно, а другое неизвестно.
Правильное решение известного доказывает, что вы не робот.
Достаточное количество людей, сопоставляющих/дающих одинаковый ответ неизвестному, означает, что теперь один из них известен и может быть добавлен в библиотеку известных.
Вот как Google Maps идентифицирует то, что на самом деле является знаками с названием улицы/места (а затем и текст, который они содержат), и тексты проекта Gutenberg, которые не были распознаны OCR, были исправлены.

Связанный контент