iText 5 et iText 2 : feuilles de route, différences, mises à jour

COMPARAISON DE FONCTIONNALITÉS ITEXT 2 ET ITEXT 5

Cela fait 5 ans déjà depuis qu'iText 2 a reçu son dernier et ultime correctif. Dans iText 5, nous nous sommes concentrés sur la mise en place de normes qui n'existaient pas il y a 5 ans (PDF 2.0 (*), PAdES, PDF/A-2 et PDF/A-3, PDF/UA) et nous avons investi dans la technologie XML, notamment XML Forms Architecture (XFA).


Pour une vue d'ensemble complète, vous pouvez consulter les notes de version et les journaux de modifications.


(*) Le comité ISO en charge de la norme PDF travaille actuellement sur ISO-32000-2, c'est-à-dire PDF 2.0. La spécification n'avait pas encore été publiée en 2015, mais nous avions déjà mis en œuvre une grande partie des nouvelles fonctionnalités (par exemple, les nouveaux types de signatures numériques).

iText 2.x ou iTextSharp 4.xiText 5.x

Java

.NET

Android

Google App Engine

Compatible PDF 2.0

Signatures numériques

PAdES

XFA

PDF balisé

PDF/A-1, PDF/A-2 et PDF/A-3

Prise en charge de fichiers PDF volumineux

< 2 Go

< 1 To

Accessibilité : PDF/UA

XML Worker : convertir les formats HTML, XML et CSS au format PDF

XFA Worker: aplatit les formulaires XFA

Support technique par les développeurs iText Core

Correctifs et mises à jour

Vue d'ensemble non exhaustive des différences de fonctionnalités entre iText 2 et iText 5

1. SIGNATURES NUMÉRIQUES

Cette fonctionnalité a été complètement revue et corrigée afin qu'iText puisse être utilisé afin de créer des signatures juridiquement contraignantes en Europe et aux États-Unis. Nous avons mis en place la norme PAdES (y compris la validation à long terme et la signature XFA).

Avec cette fonctionnalité, nous offrons une alternative à Adobe LiveCycle, ce document vous propose une comparaison indépendante. En 2012, notre fondateur a écrit un livre blanc détaillé, Digital Signatures for PDF Documents (Signatures numériques pour documents PDF), disponible en téléchargement gratuit.

2. XML WORKER

Il s'agit d'un outil générique pour les personnes qui veulent convertir le format XML au format PDF. L'installation de base convertit XHTML+CSS en PDF. Il est plus précis que l'ancien outil HTMLWorker mais il n'est pas destiné à convertir des sites Web au format PDF. Il s'apparente davantage à un système de modèles dans lequel les utilisateurs créent des modèles simples en utilisant HTML et CSS (plutôt que l'approche complexe XSL:FO). Ils complètent le fichier HTML avec des données et convertissent ce fichier HTML au format PDF. XML Worker a été la première étape du développement de XFA Worker. Voir la [vidéo « how to use XML Worker » (Comment utiliser XML Worker)] (https://www.youtube.com/watch?v=clWoDrEEl50).

3. XFA WORKER

Il s'agit d'un produit propriétaire créé pour les personnes qui souhaitent une alternative à Adobe LiveCycle (pour l'aplatissement des formulaires XFA). Un formulaire XFA est un type dynamique de formulaire interactif, qui peut changer en fonction de l'interaction de l'utilisateur ou de la saisie de données. L'aplatissement d'un formulaire XFA le transforme en un PDF non interactif, une version finale du formulaire rempli qui ne doit plus être modifiée (par exemple pour l'archivage).

Pour l'aplatissement des formulaires XFA, XFA Worker représente une alternative à Adobe LiveCycle : découvrez-en davantage dans ce fil.

4. PDF BALISÉ

PDF a été conçu à l'origine comme un produit final pour une représentation visuelle. Il ne s'agit pas d'un format de traitement de texte destiné à être modifié. Plus simplement, PDF présente un ensemble d'instructions pour placer le contenu (texte, images, etc.) à des positions absolues sur les pages. Ce format ne disposait pas de concept de structure de document ou d'éléments structurels, tels les en-têtes, les paragraphes, les tableaux et les listes. Ce cas de figure rend l'extraction, le traitement et la réutilisation du contenu PDF difficiles.

Le PDF balisé (PDF 1.3) a ajouté des possibilités de stockage des informations supplémentaires pour faciliter ces processus. L'ajout d'une structure de document logique (arborescence de structure) au PDF constitue une partie importante.

Le PDF balisé est important dans le cadre de PDF/UA (Section 508 : les documents doivent être accessibles) et PDF/A (niveau A). Il n'est pas impossible de créer un PDF balisé avec iText 2, mais il est cependant extrêmement difficile de le faire correctement et efficacement car vous devez créer la structure au niveau le plus bas (vous devez maîtriser la syntaxe PDF). Dans les versions les plus récentes d'iText, vous pouvez désormais automatiser le balisage en utilisant les objets de haut niveau d'iText (PdfPTable, Paragraph, etc.).

Nous disposons maintenant de la vérification de conformité pour PDF/A-1, PDF/A-2 et PDF/A-3 (niveaux A et B).

5. EXTRACTION DE DONNÉES AMÉLIORÉE

iText 5 contient des améliorations pour l'extraction de texte et d'images à partir de PDF. En utilisant la méthode heuristique, nous pouvons reconstruire le texte à partir du contenu textuel dans le contenu de la page PDF. Nous n'avons pas encore de reconnaissance de structure générique (pour détecter des paragraphes, des listes, etc.), mais nous avons élaboré un système personnalisé pour l'un de nos clients.

6. FUSION ET COPIE AMÉLIORÉES

Les processus de fusion et de copie de fichiers PDF ont été revus et corrigés. Pdf(Smart)Copy a été amélioré pour être en mesure de traiter les fichiers PDF et PDF balisés avec Acroforms. Dans iText 2, vous perdez StructTreeRoot et les formulaires sont endommagés.

7. PRISE EN CHARGE DES DOCUMENTS PDF JUSQU'À 1 TO

iText 2 prend en charge uniquement les fichiers PDF de 2 Go maximum. La version actuelle d'iText prend en charge des PDF de 1 To maximum.

8. YATP

Améliorations que nous appelons « YATP », ce qui signifie littéralement « Yet Another TIFF Problem » (encore un autre problème TIFF). TIFF est une norme qui est utilisée à tort et à travers par de nombreux producteurs TIFF. De ce fait, nous avons rencontré des TIFF très étranges qui n'ont pas pu être interprétés par iText. Tous les deux mois, nous devons fournir une solution pour des problèmes similaires qui ne se limitent pas au format TIFF mais comme il s'agit du format le plus problématique, nous appelons ces problèmes « YATP ».

9. ITEXT POUR ANDROID ET GAE

iTextG : une version d'iText qui peut être utilisée sur :