pdf2Data

Einführung

iText 7 pdf2Data

pdf2Data ermöglicht Ihnen die Automatisierung der PDF-Verarbeitung und die einfache Extraktion von Daten aus einem Volumen von PDF-Dokumenten im gleichen Format. Es bietet einen Rahmen zur Erkennung von Daten in PDF-Dokumenten, basierend auf Auswahlregeln, die Sie in einer Vorlage definieren können.pdf2Data ist eines unserer kommerziell lizenzierten Add-Ons für iText 7. Sie benötigen eine kommerzielle Lizenz für iText 7 Core und pdf2Data, um dieses Produkt für kommerzielle Zwecke oder in einer geschlossenen Quelle verwenden zu können. Fordern Sie ein Angebot an, um mehr über die Lizenzierung und die Preise für Ihr Projekt zu erfahren.

How it works

Try the below example yourself with the online demo:

Data extraction

1
2
3
4
5
6
7
8
9
10
11
public static void main() {
    // load a PDF template
    Template template = TemplateMaster.getTemplateFromPDF(templatePDF);
 
    // build a new Pdf2DataExtractor based on the template
    Pdf2DataExtractor extractor = new Pdf2DataExtractor(template);
 
    // inputPDF: PDF file to process
    // outputPDF: annotated PDF file for visual inspection
    // outputXML: XML file with extracted data
    extractor.recognizeToXML(inputPDF, outputPDF, outputXML);}

Template creation

First create a template PDF based on a sample document, by defining selectors using areas of interest and selection rules. This can be done through the intuitive pdf2Data template editor, which is offered as a web application:

pdf2Data Example

Vorteile

Warum iText 7 pdf2Data verwenden?

Daten sind ein wichtiges Gut, und Sie haben vielleicht mehr, als Sie in Ihren PDF-Dokumenten erkennen. Natürlich würde die manuelle Erfassung dieser Daten viel Zeit in Anspruch nehmen und das Risiko von Eingabefehlern sowie Sicherheitsproblemen erhöhen. Mit pdf2Data können Sie den Prozess der sicheren Datenextraktion automatisieren. Lesen Sie weiter, um weitere Vorteile von pdf2Data zu erfahren. 

 

pdf2Data icon svg
Automatisieren Sie die Datenextraktion aus PDF-Rechnungen und -Dokumenten.

Extrahieren und verarbeiten Sie Daten aus großen Mengen von PDFs, indem Sie die für Sie wichtigen Informationen in einer Vorlage definieren und diese mit der  Programmierung in Java und .NET automatisch herausziehen. 

pdf2Data icon svg
Definieren Sie, welche spezifischen Datenteile Sie extrahieren möchten.

Definieren Sie mit dem pdf2Data-Vorlageneditor schnell die gewünschten Informationen, die Sie in einer Vorlage extrahieren möchten. Zum Beispiel das Adressfeld, das sich immer in der rechten oberen Ecke Ihrer PDF-Rechnungen befindet.

pdf2Data icon svg
Integration in Ihre bestehenden Dokumentenprozesse

pdf2Data verwendet offene Standards, um die Integration zu erleichtern, was die Integration in bestehende Workflows einfach und schnell macht. Es enthält SDKs für Java und .NET sowie eine Befehlszeilenschnittstelle.

Schlüsselfunktionen

Kernfunktionen von iText 7 pdf2data

pdf2Data definiert die Bereiche, Schriften, Muster oder Zinstabellen in einer Vorlage, die für alle PDFs verwendet wird, die im gleichen Format erstellt wurden, wie beispielsweise eine Rechnung oder ein Eingangsdokument. Anschließend können Sie mit Selektoren Bereiche von Interesse definieren. Jeder Selektor verwendet eine andere Art und Weise, um die wichtigen Informationen zu identifizieren, die in Verbindung oder allein verwendet werden können, um Ihren Bedürfnissen gerecht zu werden. 

Core capabilities development icon
Daten aus PDF-Dokumenten extrahieren

Nutzen der Inhaltextraktion für einen hochpräzisen Erkennungsprozess von Text und Bildern.

Core capabilities development icon
Intuitive Konfiguration der Extraktion

Dieses Add-on verfügt über eine umfassende, sofort einsatzfähige Funktionalität mit der Flexibilität, es zu erweitern und anzupassen. Fokus auf einfache Integration und offene Standards.

Core capabilities development icon
Vorlagen verwenden, um die Extraktion zu optimieren.

Interessengebiete und Auswahlregeln definieren, um genau die Inhalte zu erhalten, die Sie benötigen.

Core capabilities development icon
Integration in Ihren PDF- und/oder Daten-Workflow

Datenausgabe in einem strukturierten, wiederverwendbaren Format zur Weiterverarbeitung mit Zugriff auf die Seitenkoordinaten des extrahierten Inhalts.

Kontakt

Haben Sie noch weitere Fragen? 

Gerne beantworten wir Ihre Fragen. Kontaktieren Sie uns und wir werden uns in Kürze mit Ihnen in Verbindung setzen.

Bitte kontaktieren Sie uns
Auf dem Laufenden bleiben

Melden Sie sich mit mehr als 11.000 Abonnenten an und werden Sie ein iText PDF-Experte, indem Sie sich über unsere neuen Produkte, Updates, Tipps, technischen Lösungen und Veranstaltungen informieren.

Abonniere jetzt