OCR-Templates ermöglichen die automatische Extraktion von Daten aus Dokumenten mit wiederkehrendem Aufbau. Im Gegensatz zur zonalen OCR, die manuell pro Dokument angewendet wird, arbeiten OCR-Templates mit vordefinierten Zonen, die auf zukünftige Dokumente automatisch angewendet werden.
Bei der Erstellung eines Templates wird zunächst ein Referenzdokument ausgewählt. Dieses dient als Grundlage für die Definition der auszulesenden Bereiche.
Im rechten Bereich der Maske werden die vorhandenen Indexfelder angezeigt. Um eine Zone zu definieren, wird zunächst ein gewünschtes Indexfeld ausgewählt. Anschließend kann im Dokument ein Bereich per Maus aufgezogen werden. Der erkannte Inhalt dieses Bereichs wird später automatisch in das entsprechende Indexfeld geschrieben.
Zonen können dabei flexibel auf dem Dokument definiert werden. Es besteht keine Beschränkung auf die erste Seite, sodass auch mehrseitige Dokumente vollständig abgebildet werden können.
Die definierten Zonen werden im Template gespeichert und stehen anschließend für die automatische Verarbeitung zur Verfügung.
Wird später ein Dokument hochgeladen, das diesem Dokumenttyp entspricht, erfolgt die Verarbeitung automatisch im Hintergrund:
- Die definierten Zonen werden angewendet
- Inhalte werden ausgelesen
- Werte werden direkt in die zugehörigen Indexfelder übernommen
Dies gilt auch für Mehrfachuploads, bei denen mehrere Dokumente gleichzeitig hochgeladen werden. In diesem Fall werden die OCR-Templates auf alle hochgeladenen Dokumente angewendet, sodass die entsprechenden Inhalte parallel extrahiert und in die jeweiligen Indexfelder übernommen werden.
Dadurch entfällt die manuelle Datenerfassung weitgehend, und wiederkehrende Dokumente können effizient und konsistent verarbeitet werden.
OCR-Templates eignen sich besonders für Dokumente mit gleichbleibender Struktur, wie beispielsweise Formulare oder wiederkehrende Belege.

Ansicht Template Editor

Ansicht Dokumentenverwaltung – Hochladen eines Dokuments

Ansicht Erkannte Werte

Vorschauvideo des OCR-Templates