Die Dokumentenverarbeitung umfasst alle Schritte, die nach dem Eingang eines Dokuments erfolgen. Dazu zählen insbesondere die Aufbereitung, Analyse und Weiterverarbeitung von Dokumentinhalten.
Ein zentraler Bestandteil ist die OCR-gestützte Texterkennung, mit der auch gescannte oder bildbasierte Dokumente in durchsuchbare Inhalte umgewandelt werden. Auf Basis definierter OCR-Zonen und Templates können relevante Informationen aus Dokumenten ausgelesen und für die Befüllung von Indexfeldern genutzt werden. Dadurch wird die manuelle Erfassung wiederkehrender Inhalte deutlich erleichtert.
Durch diese Verarbeitungsschritte wird aus einem einfachen Dokument eine strukturierte und auswertbare Informationsquelle.