"나는 로봇이 아닙니다" 보안 문자는 어떻게 작동하나요?

"나는 로봇이 아닙니다" 보안 문자는 어떻게 작동하나요?

그래픽이므로 대부분의 봇에는 (분명히) 부족하지만 부피가 큰 OCR이 필요합니까? 그럼에도 불구하고 이는 고정된 그래픽이므로 OCR이 실제로 필요하지 않으며 한 항목의 라이브러리에 대한 간단한 패턴 일치만 필요합니다. 나는 그것이 어떻게 봇을 좌절시키기 위해 극복할 수 없는 장애물을 제기하는지 이해하지 못합니다.

답변1

보안 문자는 마우스 동작을 모니터링합니다. 봇이 양식의 버튼을 클릭하는 것은 쉽지만 사람이 움직이는 마우스의 불규칙한 움직임을 시뮬레이션하는 것은 어렵습니다.

그러나 불가능한 것은 아닙니다.https://www.youtube.com/watch?v=fsF7enQY8uI

답변2

보안 문자의 텍스트가 OCR에서 인식되지 않습니다. OCR은 텍스트를 인식하기 위해 텍스트가 무엇인지에 대한 표준 규칙을 사용했습니다.

적합한 텍스트는 일반적으로 직선이 평행하지 않고 왜곡되어 있습니다. OCR이 처리할 수 없는 임의의 정크가 포함되어 있습니다.

즉, 텍스트가 어떤 모습이어야 하는지에 대한 일반적인 규칙을 따르지 않습니다.

딥러닝이 점점 보편화되면서 Captcha가 작동하지 않는 것은 시간문제입니다.

다양한 보안 문자가 있으며, 일부는 테마가 있는 여러 그래픽을 선택해야 합니다(예: 나중에 더 다듬을 수 있는 기호의 일부이며 전체 기호가 조립되고 텍스트 그래픽이 완성되면 아래 라이브러리 방법에 추가할 수 있음). 같은 방법으로 추출한 것)은 컴퓨터가 식별할 수 없습니다. 이 유형을 사용하면 항상 알려진 시나리오를 식별하라는 메시지가 표시되며 일반적으로 동일한 답변이 충분히 수신되면 알려진 시나리오에 추가하기 위해 일반적으로 알려지지 않은 시나리오가 표시됩니다.

가장 일반적으로 사용되는 이미지는 두 가지 방식입니다.

1
단어에서 무작위로 왜곡된 단일 이미지가 생성된 후 OCR을 혼동하기 위해 불필요한 정크가 추가되었습니다. 레인보우 공격을 막기 위해 "무작위" 정크 단어를 추가하여 비밀번호 목록을 "솔팅"하는 것과 같습니다.

2
또 다른 형태는 이미지가 너무 복잡해서 자동으로 인식할 수 없기 때문에 사람들이 그것이 무엇인지 결정해야 하는 사진(대개 단어)을 사용하는 것입니다. 일반적으로 텍스트(또는 기호 등)를 정의하는 컴퓨터 프로그래밍 매개 변수 외부에 있으며 종종 무작위 환경에 둘러싸여 있습니다.
이를 위해서는 알려진 "텍스트" 또는 기호 등의 일부인 기타 매개변수가 포함된 대규모 사진 라이브러리가 필요합니다.

참고 사항:
두 번째 방법에 대한 라이브러리는 사용자가 올바르게 식별하려고 하는 2개의 이미지를 제공하여 증가합니다.
1개의 이미지는 알려진 이미지이고 다른 이미지는 알려지지 않은 이미지입니다.
알려진 문제를 올바르게 해결하면 당신이 로봇이 아니라는 것을 증명할 수 있습니다.
동일한 답변으로 알려지지 않은 항목을 일치/답변하는 충분한 수의 사람들은 이제 그 항목이 알려져 있고 알려진 라이브러리에 추가될 수 있음을 의미합니다.
이는 Google 지도가 실제로 거리/장소 이름 기호(나중에 포함된 텍스트)가 무엇인지 식별하고 OCR에 실패한 프로젝트 구텐베르그 텍스트를 수정하는 방법입니다.

관련 정보