OCR-Lösung für Anwaltsrechnungen

OCR-Lösung für Anwaltsrechnungen

Ich habe verschiedene Arten von Rechtsrechnungen. Ich möchte sie in Excel-Tabellen digitalisieren. Da sie unterschiedliche Layouts haben und es viele davon gibt, kann ich sie nicht verarbeiten. Kann mir jemand eine praktische Lösung anbieten?

Antwort1

Mir ist keine gute und preisgünstige Lösung bekannt :(

Sie könnten Nuance OmniPage oder Abby FlexiCapture ausprobieren (es gibt Desktop-Versionen bis hin zu 100.000-Dollar-Enterprise-Versionen). Vor einiger Zeit habe ich die SDKs/OCR-Qualität der beiden verglichen. Kein großer Unterschied, obwohl ich das Gefühl hatte, dass Abbyy ein klitzekleines bisschen besser war (Nuance stürzte ein paar Mal ab, Abbyy nicht).

Sowohl OmniPage als auch FlexiCapture (FineReader) haben Desktop-Editionen, die angeblich PDFs in bearbeitbare Excel-Dateien konvertieren. Beim Herumspielen mit den kostenlosen Testversionen habe ich herausgefunden, dass sie bearbeitbare Excel-Dateien erstellen, aber nur für sehr hochwertige, saubere Quellen. Beide bieten auch Stapelverarbeitungsfunktionen.

Außerdem finde ich, dass scanstore.com eine tolle Ressource ist:

http://www.scanstore.com/Scanning_Software/Forms_Processing/Invoice_Processing/

Wenn Sie nach Open Source suchen, ist Tesseract die beste „Engine“. Sie müssen den gesamten Teil zur Formularerfassung darum herum erstellen. Ich habe darüber nachgedacht – und Sie benötigen:

  1. Verwenden Sie Barcodes oder registrieren Sie Rechnungsarten auf andere Weise
  2. Finden Sie für jeden Typ heraus, welche Teile der Rechnung Tabellen sind
  3. Den relevanten Bereich ausschneiden - und an tesserat/abbyy/nuance senden
  4. Erhalten Sie etwas zurück, das in eine Tabelle analysiert werden kann
  5. Sprachmodellierung anwenden (überraschenderweise leisten Abbyy und Nuance hier schreckliche Arbeit)

Ach ja, und zu Ihrer Information: Es gibt viele BPO-Dienstleistungsunternehmen, die echte Mitarbeiter für die Dateneingabe haben. Das ist nicht so teuer, wie Sie vielleicht denken.

Antwort2

Hier sind einige kostenlose OCR-Softwares: CuneiForm, GOCR, Ocrad, OCRopus, Tesseract. Aber das Ergebnis ist nicht so gut. Aber Sie können FineReader, ExperVision, OmniPage ausprobieren, das Ergebnis wird besser sein. Meiner Erfahrung nach können Sie sich jedoch nicht auf die reine Technologielösung verlassen. Wenn Sie Ihre Projektkosten unter einen vernünftigen Preis halten möchten, ist die Integration der OCR-Technologie und der Humanressourcen eine gute Wahl. Soweit ich weiß, kann Expervision sowohl maßgeschneiderte OCR-Technologie als auch BPO-Dienste anbieten. Sie können sich deren Website ansehen.Erfahrung

verwandte Informationen