Wie funktioniert das Captcha „Ich bin kein Roboter“?

Wie funktioniert das Captcha „Ich bin kein Roboter“?

Handelt es sich um eine Grafik, die eine aufwändige OCR-Erkennung erfordert, die den meisten Bots (anscheinend) fehlt? Trotzdem handelt es sich um eine feste Grafik, die eigentlich keine OCR-Erkennung erfordert, sondern nur einen einfachen Musterabgleich mit einer Bibliothek eines Elements. Ich verstehe einfach nicht, wie dies eine unüberwindbare Hürde darstellen soll, die Bots frustriert.

Antwort1

Das Captcha überwacht das Mausverhalten. Während es für einen Bot einfach ist, auf eine Schaltfläche in einem Formular zu klicken, ist es schwierig, die unregelmäßige Bewegung einer von einem Menschen bewegten Maus zu simulieren.

Es ist jedoch nicht unmöglich:https://www.youtube.com/watch?v=fsF7enQY8uI

Antwort2

Text in Captchas konnte von OCR nicht erkannt werden. OCR verwendet Standardregeln zur Texterkennung.

Geeigneter Text ist normalerweise verzerrt, verläuft nicht parallel oder in geraden Linien parallel zum Horizont und enthält zufälligen Müll, mit dem OCR nicht umgehen kann.

d. h. sie erfüllen nicht die üblichen Regeln, wie ein Text aussehen sollte.

Da Deep Learning immer häufiger zum Einsatz kommt, ist es nur eine Frage der Zeit, bis Captchas nicht mehr funktionieren.

Es gibt viele verschiedene Captchas. Bei manchen muss man eine Reihe von Grafiken mit einem bestimmten Thema auswählen (z. B. Teile eines Schilds, die später weiter verfeinert und dann der unten stehenden Bibliotheksmethode hinzugefügt werden können, sobald das ganze Schild zusammengesetzt und die Textgrafik mit derselben Methode extrahiert wurde), die ein Computer nicht erkennen kann. Bei diesem Typ werden Sie immer gebeten, ein bekanntes Szenario und normalerweise ein unbekanntes zu identifizieren, um es der Bibliothek der bekannten hinzuzufügen, sobald genügend identische Antworten eingegangen sind.

Am häufigsten werden Bilder auf zwei Arten verwendet:

1
Ein einzelnes, zufällig verzerrtes Bild, das aus einem Wort generiert und dann mit zusätzlichem Müll versehen wird, um die OCR zu verwirren. Wie das „Salzen“ einer Passwortliste durch Hinzufügen eines „zufälligen“ Müllworts, um einen Rainbow-Angriff zu stoppen.

2
Eine andere Form ist die Verwendung von Fotos (normalerweise von Wörtern) von etwas, bei dem die Leute entscheiden mussten, was es ist, weil das Bild zu komplex ist, um es automatisch zu erkennen. Im Allgemeinen liegt es außerhalb der Computerprogrammierparameter dessen, was Text (oder ein Zeichen oder was auch immer) definiert, und ist oft von einer zufälligen Umgebung umgeben.
Dies erfordert eine große Bibliothek von Fotos mit bekanntem „Text“ oder anderen Parametern, z. B. welche Teile eines Zeichens usw. sind.

Randbemerkung:
Die Bibliothek für die zweite Methode wird durch die Bereitstellung von 2 Bildern erweitert, die die Benutzer richtig zu identifizieren versuchen.
1 Bild ist bekannt und ein anderes unbekannt.
Die richtige Lösung des bekannten Bildes beweist, dass Sie kein Roboter sind. Wenn
genügend Leute das Unbekannte mit derselben Antwort abgleichen/beantworten, bedeutet dies, dass eines nun bekannt ist und der bekannten Bibliothek hinzugefügt werden kann.
Auf diese Weise identifiziert Google Maps, was tatsächlich Straßen-/Ortsschilder sind (und später den Text, den sie enthalten), und Texte des Projekts Gutenberg, die die OCR nicht bestanden, wurden korrigiert.

verwandte Informationen