Wenn ich OCR mit Adobe Acrobat 2017 verwende, stelle ich fest, dass nicht derselbe Text auf derselben Seite erkannt wird. Wenn beispielsweise das Wort Dr. Thandabout 15 Mal auf derselben Seite vorkommt, wird dieser Name nur 12 Mal erkannt. Kann mir jemand zu diesem Problem weiterhelfen?
Antwort1
OCR ist nie 100 % genau und nach der OCR einer PDF-Datei sollte eine redaktionelle Überprüfung erfolgen.
Aus meiner Erfahrung geschätzt (meinungsbasiert) mit OCR-Ergebnissen:
- serifenlos: 95 % genau
- Serife: 90 % genau
- Monospace-Schriftart: 80 % genau
- dekorative Serife: 75 % genau
- Schreibschrift: 50 % genau
Natürlich gelten die obigen Schätzungen nur, wenn das PDF nicht gescannt wurde und es sich lediglich um ein bildbasiertes PDF ohne Müll handelt.
Wenn Sie das PDF nicht durch die Redaktion laufen lassen können, können Sie die Rechtschreibung jederzeit durch Drücken der F7Taste überprüfen oder verwendenEdit => Check Spelling => In Fields, Comment, Editable Text