iText 5 e iText 2: hojas de ruta, diferencias, actualizaciones

COMPARACIÓN DE FUNCIONES DE ITEXT 2 E ITEXT 5

Han pasado 5 años desde que iText 2 recibió su última y definitiva corrección de errores. En iText 5 nos hemos centrado en implementar estándares que no existían hace 5 años (PDF 2.0 (*), PAdES, PDF/A-2 y PDF/A-3, PDF/UA) y hemos invertido en tecnología basada en XML, más específicamente, en la arquitectura de formularios XML (XFA).


Para obtener una descripción general completa, puedes consultar las notas de la versión y los registros de cambios.


(*) El comité ISO responsable de PDF está trabajando actualmente en ISO-32000-2, también conocido como PDF 2.0. La especificación aún no se había publicado en 2015, pero ya implementamos muchas de las nuevas funciones (por ejemplo, los nuevos aspectos de las firmas digitales).

iText 2.x o iTextSharp 4.xiText 5.x

Java

.NET

Android

Google App Engine

Preparado para PDF 2.0

Firmas digitales

PAdES

XFA

PDF con etiquetas

PDF/A-1, PDF/A-2 y PDF/A-3

Admisión de archivos PDF grandes

< 2 GByte

< 1 TByte

Accesibilidad: PDF/UA

XML Worker: Convertir HTML, XML y CSS a PDF

XFA Worker: Acoplar formularios XFA

Asistencia técnica de los desarrolladores de iText Core

Correcciones de errores y actualizaciones

Una descripción general no exhaustiva de las diferencias de funcionalidad entre iText 2 y 5

1. FIRMAS DIGITALES

Esta función se ha reescrito completamente para que iText se pueda usar para la creación de firmas que sean legalmente vinculantes en Europa y EE. UU. Hemos implementado el estándar PAdES (que incluye la validación a largo plazo y la firma XFA).

Para esta función ofrecemos una alternativa para Adobe LiveCycle. Lee este documento para una comparación de terceros. En 2012, nuestro fundador escribió un documento técnico detallado sobre Digital Signatures for PDF documents y está disponible como descarga gratuita.

2. XML WORKER

Una herramienta genérica para las personas que desean convertir XML a PDF. La implementación básica convierte XHTML+CSS a PDF. Es más preciso que el antiguo HTMLWorker, pero no tiene la intención de convertir sitios web a PDF. Es más bien un sistema de plantillas donde los usuarios crean plantillas simples usando HTML y CSS (en lugar del complicado lenguaje de etiquetas XSL:FO). Llenan el HTML con datos y lo convierten a PDF. XML Worker fue el primer paso en el desarrollo de XFA Worker. Mira el vídeo "How to use XML Worker" (Cómo usar XML Worker).

3. XFA WORKER

Este es un producto de código cerrado creado para personas que desean una alternativa para Adobe LiveCycle (para el acoplamiento de formularios XFA). Un formulario XFA es un tipo dinámico de formulario interactivo que puede cambiar en función de la interacción del usuario o la entrada de datos. El acoplamiento de un formulario XFA lo convierte en un PDF no interactivo, es decir, una versión final del formulario rellenado que ya no necesita más cambios (por ejemplo, para archivar).

Para el acoplamiento de formularios XFA, XFA Worker es una alternativa a Adobe LiveCycle: lee más en este hilo.

4. PDF CON ETIQUETAS

El formato PDF se diseñó originalmente como un producto final, para representación visual. No es un formato de procesamiento de textos destinado a futuras ediciones. Simplificando, el formato PDF tiene un conjunto de instrucciones para colocar contenido (texto, imágenes, etc.) en posiciones absolutas en las páginas. No tenía ningún concepto de estructura de documento o elementos estructurales, como encabezados, párrafos, tablas y listas. Esto hace que sea difícil extraer, procesar y reutilizar el contenido de un documento PDF.

Para facilitar estas tareas, el PDF con etiquetas (PDF 1.3) brindó más recursos para almacenar información adicional. Añadir la estructura lógica del documento (árbol de estructura) al PDF es una parte importante.

El PDF con etiquetas es importante en el contexto de PDF/UA (sección 508: los documentos deben ser accesibles) y PDF/A (nivel A). No es imposible crear un PDF con etiquetas con iText 2, pero es extremadamente difícil hacerlo de manera correcta y eficaz porque hay que crear la estructura en el nivel más bajo (se debe tener fluidez en la sintaxis del PDF). En las versiones más recientes de iText puedes automatizar el etiquetado al usar objetos de alto nivel de iText (PdfPTable, Paragraph, etc.).

Ahora contamos con verificación de conformidad para PDF/A-1, PDF/A-2 y PDF/A-3 (niveles A y B).

5. EXTRACCIÓN DE DATOS OPTIMIZADA

iText 5 incorpora mejoras para extraer texto e imágenes de PDF. Mediante la heurística, podemos reconstruir texto a partir del contenido textual en el contenido de la página PDF. Todavía no tenemos un reconocimiento genérico de la estructura (es decir, detección de párrafos, listas, etc.), pero hemos creado un sistema personalizado para uno de nuestros clientes.

6. MEJORA DE COMBINACIÓN Y COPIA

Se ha reescrito el proceso de combinación y copia de PDF. La copia inteligente de PDF se ha mejorado para poder procesar PDF con etiquetas y PDF con Acroform. En iText 2, se perdía el elemento StructTreeRoot y esto afectaba al formato de los formularios.

7. ADMISIÓN DE DOCUMENTOS PDF DE HASTA 1 TBYTE

iText 2 solo admite archivos PDF de hasta 2 GByte. La versión actual de iText permite archivos PDF de hasta 1 TByte.

8. YATP

Mejoras a las que nos referimos como "YATP". Literalmente "Otro problema de TIFF", del inglés "Yet Another TIFF Problem." TIFF es un estándar del que "abusan" muchos productores de TIFF. Como resultado, hemos encontrado algunos TIFF realmente extraños que podrían no ser interpretados por iText. Cada dos meses debemos proporcionar una solución para problemas similares no limitados a TIFF, pero como TIFF es el formato más problemático, nos referimos a estos problemas como YATP.

9. ITEXT PARA ANDROID Y GAE

iTextG: una versión de iText que se puede usar en: