Luradocument PDF Compressor 5.5: PDF-Software integriert Freiformerkennung

Luratech wird auf der DMS Expo 2009 (Halle 7, Stand G059) seinen Luradocument PDF Compressor 5.5 vorstellen. DMS-EXPO-Besucher, die sich über PDF/A als sicheres Langzeitarchivformat informieren möchten, können zudem im Rahmen des VOI-Forums einen Einführungsvortrag (16. September, 12.30 bis 13.00 Uhr) von Luratech besuchen.

PDF Compressor 5.5 ist eine vollständige Konvertierungslösung, die die komplette Prozesskette nach dem Scannen und dem digitalen Erstellen von Dokumenten über die Datenextraktion bis hin zum Export für die Langzeitarchivierung abdecken soll. Gescannte farbige oder schwarz-weißen Dokumente werden in hochkomprimierte PDF/A-Dateien konvertiert, die in Volltext (OCR) durchsuchbar sind. Darüber hinaus sollen sich auch elektronisch erzeugte Microsoft-Office-Dokumente, E-Mails und PDF-Dateien stapelweise in PDF/A-Dateien umwandeln lassen.

Die seit kurzem verfügbare Freiformerkennung ist vollständig in den Luradocument PDF Compressor integriert, was den Einführungsaufwand verringern soll. Das flexibel einsetzbare Modul klassifiziert Dokumente automatisch, extrahiert die darin enthaltenen Daten und soll auch große Dokumentenmengen schnell und effizient verarbeiten können. Der Implementierungsaufwand ist vergleichsweise gering, so dass Projekte jeglicher Art in kürzester Zeit umsetzbar sein sollen. Zusätzlich soll das Lizenzmodell einen schnellen Return on Investment ermöglichen.

Carsten Heiermann, Luratech-Geschäftsführer: „Muss beispielsweise ein Unternehmen große Dokumentmengen verarbeiten, die sich aber nur aus zwei unterschiedlichen Typen zusammensetzen oder bei denen jeweils lediglich eine Zahl auszulesen ist, so wurde dies bisher aufgrund der Komplexität anderer Produkte oft manuell durchgeführt. Mit unserer einfach implementierbaren Freiformerkennung ist es nun auch möglich, auch solche Prozesse kostensparend zu automatisieren.“

Die Option ‚Formularerkennung‘ des PDF Compressors umfasst – neben Dokumentenklassifikation und Datenextraktion – einen Form-Designer, einen Form-Validator sowie eine Lizenz für einen CPU-Core für die Erkennung im PDF Compressor. Durch zusätzliche Form-Validator- und CPU-Core-Lizenzen soll sich der Durchsatz weiter erhöhen lassen. Die Formularerkennung soll Inhalte bestimmter, definierter Formularfelder in den PDF-Resultaten durch echtes Schwärzen dauerhaft unleserlich machen können. Unternehmen sollen so gescannte Dokumente veröffentlichen können, ohne sensible Informationen – beispielsweise personenbezogene Daten – preiszugeben. Zudem soll die Klassifikations- und Erkennungsgenauigkeit der templatebasierten Formularerkennung verbessert worden sein. Anwender können Feldern so genannte Anker zuweisen, an denen das Design und verdrehte oder verschobene Einzelseiten aneinander ausgerichtet werden. Das Erkennen und Auswerten von Ankreuzfeldern rundet die Formularerkennung ab.

Der PDF Compressor 5.5 konvertiert gescannte farbige oder schwarzweiße Dokumente in hochkomprimierte, volltextdurchsuchbare PDF/A-Dateien und unterstützt alle üblichen Scan-Formate wie TIFF, JPEG oder PDF. Dank Layer-Technik sollen farbige PDF/A-Dateien so klein wie vergleichbare Schwarz-Weiß-Dokument im TIFF-G4-Format sein. PDF/A-Dateien in schwarzweiß sollen nur halb so groß wie eine TIFF-G4-Datei sein. Der PDF Compressors bettet außerdem XMP-Metadaten, Verlinkungen und Lesezeichen sowie OCR-Ergebnisse aus anderen Prozessen im XML-Format in seine PDF- und PDF/A-Ausgabedateien ein.

Mit dem Modul ‚Born Digital‘ sollen sich elektronisch erzeugte Dokumente aus MS Office, Outlook (E-Mails) sowie elektronisch entstandene PDF-Dateien in PDF- oder PDF/A-Dateien umwandeln lassen, die von der Software stapelweise und so robust und einfach wie gescannte Papierdokumente verarbeitet werden. (Quelle: Luratech Europe GmbH/GST)