iText pdf library
Website search

pdf2Data

Introduction

iText 7 pdf2Data

pdf2Data vous permet d'automatiser le traitement de vos PDF et d'extraire facilement les données d'un volume de documents PDF dans le même format. Il offre un cadre pour reconnaître les données dans les documents PDF, en fonction de règles de sélection que vous pouvez définir dans un modèle.pdf2Data est l'un de nos modules complémentaires sous licence commerciale pour iText 7, vous aurez besoin d'une licence commerciale pour iText 7 Core et pdf2Data pour pouvoir utiliser ce produit à des fins commerciales ou en code source propriétaire. Demandez un devis pour en savoir plus sur les licences et les tarifs pour votre projet.

How it works

Try the below example yourself with the online demo:

Data extraction

1
2
3
4
5
6
7
8
9
10
11
12
13
14
// Make sure to load license file before invoking any code
LicenseKey.loadLicenseFile(pathToLicenseFile);
 
// Parse template into an object that will be used later on
Template template = Pdf2DataExtractor.parseTemplateFromPDF(pathToPdfTemplate);
 
// Create an instance of Pdf2DataExtractor for the parsed template
Pdf2DataExtractor extractor = new Pdf2DataExtractor(template);
 
// Feed file to be parsed against the template. Can be called multiple times for different files
ParsingResult result = extractor.recognize(pathToFileToParse);
 
// Save result to XML or explore the ParsingResult object to fetch information programmatically
result.saveToXML(pathToOutXmlFile);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
// Make sure to load license file before invoking any code
LicenseKey.LoadLicenseFile(pathToLicenseFile);
 
// Parse template into an object that will be used later on
Template template = Pdf2DataExtractor.ParseTemplateFromPDF(pathToPdfTemplate);
 
// Create an instance of Pdf2DataExtractor for the parsed template
Pdf2DataExtractor extractor = new Pdf2DataExtractor(template);
 
// Feed file to be parsed against the template. Can be called multiple times for different files
ParsingResult result = extractor.Recognize(pathToFileToParse);
 
// Save result to XML or explore the ParsingResult object to fetch information programmatically
result.SaveToXML(pathToOutXmlFile);

Template creation

First create a template PDF based on a sample document, by defining selectors using areas of interest and selection rules. This can be done through the intuitive pdf2Data template editor, which is offered as a web application:

pdf2Data Example

Avantages

Pourquoi utiliser iText 7 pdfData ?

Les données sont une marchandise importante et vos documents PDF peuvent renfermer plus de valeur que vous l'imaginez. Bien entendu, la collecte manuelle de ces données vous prendrait beaucoup de temps et augmenterait le risque d'erreurs de saisie et de problèmes de sécurité. Avec pdf2Data, vous pouvez automatiser le processus d'extraction des données de manière sécurisée. Continuez à lire pour connaître plus d'avantages de pdf2Data. 

 

pdf2Data icon svg
Automatisez l'extraction de données à partir de vos factures et documents en PDF

Extrayez et traitez les données de grandes quantités de PDF en définissant les informations qui vous intéressent dans un modèle et en les extrayant automatiquement lors de la programmation en Java et .NET. 

pdf2Data icon svg
Définissez précisément les parties de données que vous souhaitez extraire

Définissez rapidement les informations que vous souhaitez extraire dans un modèle avec l’éditeur de modèles pdf2Data. Par exemple : le champ d'adresse qui se trouve toujours dans le coin supérieur droit de vos factures en PDF.

pdf2Data icon svg
Le système s'intègre dans vos processus documentaires existants

pdf2Data utilise des normes libres de droit pour une intégration facile et rapide aux flux de travail existants. Il comprend des SDK pour Java et .NET, ainsi qu'une interface de ligne de commande.

Principales fonctionnalités

Principales fonctionnalités d'iText 7 pdfData

pdf2Data définit les zones, les polices, les modèles ou les tableaux présentant un intérêt dans un modèle utilisé pour tous les PDF créés dans le même format, tels qu'une facture ou un document de prise en charge. Vous pouvez ensuite définir des zones d’intérêt à l'aide de sélecteurs. Chaque sélecteur utilise une manière différente d’identifier les informations importantes et peut être utilisé conjointement ou seul en fonction de vos besoins. 

Core capabilities development icon
Extraire des données de documents PDF

Exploitez l'extraction du contenu d'iText 7 Core pour un processus de reconnaissance haute fidélité du texte et des images.

Core capabilities development icon
Configuration d'extraction intuitive

Ce module complémentaire a une fonctionnalité complète prête à l'emploi, avec des possibilités d'extension et de personnalisation. Concentrez-vous sur une intégration facile et des normes libres de droits.

Core capabilities development icon
Utilisation de modèles pour rationaliser l'extraction

Définissez les zones d'intérêt et les règles de sélection pour obtenir exactement le contenu dont vous avez besoin.

Core capabilities development icon
Intégration dans votre flux de travail PDF et/ou de données

Sortez des données dans un format structuré et réutilisable pour un traitement ultérieur, avec accès aux coordonnées de page du contenu extrait.

Contact

Vous avez d'autres questions ?

Nous y répondrons avec plaisir. Contactez-nous et nous reviendrons vers vous sous peu.

Contactez-nous
Restez à jour

Rejoignez plus de 11 000 abonnés et devenez un expert iText PDF en vous tenant au courant de nos nouveaux produits, mises à jour, conseils, solutions techniques et événements.

Abonnez-vous