iText pdf library
Website search

pdf2Data

Introducción

iText 7 pdf2Data

pdf2Data le permite automatizar el procesamiento de PDF y extraer fácilmente datos de un volumen de documentos PDF en el mismo formato. Ofrece un marco para reconocer datos dentro de los documentos PDF, según las reglas de selección que usted puede definir en una plantilla.

pdf2Data es uno de nuestros complementos con licencia comercial para iText 7; necesitará una licencia comercial para iText 7 Core y pdf2Data para poder utilizar este producto con fines comerciales o en una fuente cerrada. Solicite una cotización para obtener más información sobre licencias y precios para su proyecto.

How it works

Try the below example yourself with the online demo:

Data extraction

1
2
3
4
5
6
7
8
9
10
11
12
13
14
// Make sure to load license file before invoking any code
LicenseKey.loadLicenseFile(pathToLicenseFile);
 
// Parse template into an object that will be used later on
Template template = Pdf2DataExtractor.parseTemplateFromPDF(pathToPdfTemplate);
 
// Create an instance of Pdf2DataExtractor for the parsed template
Pdf2DataExtractor extractor = new Pdf2DataExtractor(template);
 
// Feed file to be parsed against the template. Can be called multiple times for different files
ParsingResult result = extractor.recognize(pathToFileToParse);
 
// Save result to XML or explore the ParsingResult object to fetch information programmatically
result.saveToXML(pathToOutXmlFile);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
// Make sure to load license file before invoking any code
LicenseKey.LoadLicenseFile(pathToLicenseFile);
 
// Parse template into an object that will be used later on
Template template = Pdf2DataExtractor.ParseTemplateFromPDF(pathToPdfTemplate);
 
// Create an instance of Pdf2DataExtractor for the parsed template
Pdf2DataExtractor extractor = new Pdf2DataExtractor(template);
 
// Feed file to be parsed against the template. Can be called multiple times for different files
ParsingResult result = extractor.Recognize(pathToFileToParse);
 
// Save result to XML or explore the ParsingResult object to fetch information programmatically
result.SaveToXML(pathToOutXmlFile);

Template creation

First create a template PDF based on a sample document, by defining selectors using areas of interest and selection rules. This can be done through the intuitive pdf2Data template editor, which is offered as a web application:

pdf2Data Example

Beneficios

¿Por qué usar iText 7 pdf2Data?

Los datos son un producto básico importante, y puede tener más de lo que cree dentro de sus documentos PDF. Por supuesto, la recopilación de estos datos de forma manual le tomaría mucho tiempo y aumentaría el riesgo de errores de entrada y problemas de seguridad. Con pdf2Data puede automatizar el proceso de extracción de datos de forma segura. Continúe leyendo para conocer más beneficios de pdf2Data. 

 

pdf2Data icon svg
Extracción automática de datos de facturas y documentos en PDF

Extrae y procesa datos de una gran cantidad de PDF al definir la información que es importante para usted en una plantilla y sacarla automáticamente con programación en Java y .NET. 

pdf2Data icon svg
Definición de las partes de información específicas que quiere extraer

Defina rápidamente la información que desea extraer en una plantilla con el editor de plantillas pdf2Data. Como, por ejemplo, el campo de dirección que siempre está en la esquina superior derecha de sus facturas en PDF.

pdf2Data icon svg
Integración en sus procesos de documentos existentes

pdf2Data utiliza estándares abiertos para facilitar la integración, por lo que la integración a los flujos de trabajo existentes se vuelve fácil y rápida. Incluye SDK para Java y .NET, así como una interfaz de línea de comando.

Características clave

Capacidades esenciales de iText 7 pdf2data

pdf2Data funciona al definir las áreas, fuentes, patrones o tablas de interés en una plantilla que se utiliza para todos los archivos PDF creados en el mismo formato, como una factura o un documento de entrada. A continuación, puede definir las áreas de interés con los selectores. Cada selector utiliza una forma diferente de identificar la información que es importante y puede usarse en conjunto o por sí solo para satisfacer sus necesidades. 

Core capabilities development icon
Extraiga datos de documentos PDF

Aproveche la extracción de contenido de iText 7 Core para un proceso de reconocimiento de texto e imágenes de alta fidelidad.

Core capabilities development icon
Configuración de extracción intuitiva

Este complemento tiene una funcionalidad integral lista para usar, con la flexibilidad para ampliar y personalizar. Enfoque en la fácil integración y los estándares abiertos.

Core capabilities development icon
Use plantillas para agilizar la extracción

Defina áreas de interés y reglas de selección para obtener exactamente el contenido que necesita.

Core capabilities development icon
Integración con su flujo de trabajo de datos o PDF

Salida de datos en un formato estructurado y reutilizable para su posterior procesamiento, con acceso a las coordenadas de página del contenido extraído.

Contacto

¿Aún tiene preguntas? 

Estamos encantados de responder a sus preguntas. Comuníquese con nosotros y le responderemos a la brevedad.

Contáctenos
Manténgase actualizado

Únase a más de 11,000 suscriptores y conviértase en un experto en iText PDF al mantenerse al día con nuestros nuevos productos, actualizaciones, consejos, soluciones técnicas y eventos.

Suscríbase ahora