iText 7 pdfOCR+
pdfOCR+ ist ein iText 7 Add-On, das Text in Dokumenten durchsuchbar macht und es Ihnen ermöglicht, den gefundenen Text in automatisierten Dokumenten-Workflows zu verwenden.
How it works
Take a look at how easy it is to OCR a list of images and create a PDF file!
Don't forget to specify the path to your local Tesseract Data files using TESS_DATA_FOLDER in the code below. You can always find the most accurate trained LSTM models here.
Warum iText 7 pdfOCR+ verwenden?
Gedruckte Dokumente enthalten eine Fülle von Informationen. In Dateien wie gedruckten Rechnungen oder Formularen befinden sich strukturierte Daten, die von der Software verarbeitet werden müssen. Selbst PDF-Scans sind nicht leicht zu lesen, so dass der Inhalt dieser Dokumente oft manuell transkribiert werden muss. Gleiches gilt für schriftliche Unterlagen wie Versicherungsansprüche, Zeugenberichte oder Beschwerdebriefe. Um diese Art von Dokumenten einfach und schnell in einen automatisierten digitalen Workflow einzufügen, müssen sie zuverlässig und automatisch transkribiert werden.
Erschließen Sie das Potenzial elektronisch archivierter Dateien.
- Nützliches Werkzeug, wenn Sie mit vielen handschriftlichen oder maschinell gedruckten Dateien mit wertvollen Informationen in Berührung kommen.
- Perfekt für den Einsatz in Branchen wie Banken, Finanzen, Behörden, Versicherungen, Gesundheitswesen, Telekommunikation und der Fremdbeschaffung von Geschäftsprozessen.
Lösung für das Gesundheitswesen
Ganze Patientenakten können durchsuchbar gemacht werden, einschließlich handschriftlicher Notizen.
Nützliches Werkzeug für Akademiker, Historiker und Forscher
Analysieren Sie ihre Archive, da das Werkzeug vollständig in der Lage ist, historische Handschriften und Schriftfamilien zu verarbeiten.
Kernfähigkeiten von pdfOCR+
pdfOCR+ fügt eine unsichtbare Textebene zu einem reinen PDF-Bild hinzu. Es enthält die Transkription des Textes, der maschinell kopiert und ausgewertet werden kann. Erleichtert das Auffinden und Verwenden von Dokumenten in der Geschäfts- und Prozessautomatisierung.
Einfache API
- Java-API ermöglicht die Integration in den bestehenden Workflow.
- Nahtlose Integration mit iText Core 7.
Leistungsstarke KI-basierte OCR
- Kann sowohl maschinengeschriebenen, handbedruckten als auch handgeschriebenen Text transkribieren.
- Macht Dokumente präziser auffindbar.
- Nutzt maschinelles Lernen, um sich im Laufe der Zeit zu verbessern.
Löst die häufigsten OCR-Herausforderungen
- Kompatibel mit Bild- und PDF-Dateien.
- Erstellt unsichtbare Textebenen, ohne das ursprüngliche Datei-Layout zu zerstören.
- Erkennt alle Sprachen des lateinischen Alphabets.
- Extrem schnell und skalierbar.
Resources
Here you will find the resources needed to install and use pdfOCR.