iText 5とiText 2: ロードマップ、差異、アップデート

iText 2とiText 5の機能比較

iText 2の最後の不具合修正をリリースしてから5年が経過しました。iText 5では、5年前に存在しなかった実行基準に注力し(PDF 2.0 (*)、PAdES、PDF/A-2およびPDF/A-3、PDF/UA)、XMLベースのテクノロジー、特にXMLフォーマット・アーキテクチャ(XFA)に投資をしてきました。


概要に関しては、リリースノートおよびチェンジログをご参照ください。


(*) ISO委員会は、ISO-32000-2、つまりPDF 2.0に現在取り組んでいます。スペックは2015年時点では発表されていませんでしたが、既に多くの新しい機能を実装しました(例: デジタル署名の新しい特色)。

iText 2.xまたはiTextSharp 4.xiText 5.x

Java

.NET

Android

Google App Engine

PDF 2.0に対応

デジタル署名

PAdES

XFA

タグ付け

PDF/A-1、PDF/A-2、およびPDF/A-3

大きいPDFファイルのサポート

2GB未満

1TB未満

アクセシビリティ:PDF/UA

XML Worker:HTML、XMLおよびCSSからPDFへの変換

XFA Worker: XFAフォームの平坦化

iText Core開発者によるテクニカルサポート

バグフィックスと更新

iText 2とiText 5の機能の差異に関する簡単な概要

1.デジタル署名

この機能は完全に書き換えが行われ、iTextを使用してヨーロッパとアメリカで法的な拘束力のある署名を作成できるようになりました。当社はPAdES基準(長期間の検証およびXFA署名を含む)を適用しました。

Adobe LiveCycleの代替品を提供するこの機能の場合、サードパーティの比較について、本書をお読みください。 2012年、当社の創設者が無料ダウンロードで入手できる PDF文書のデジタル署名 についての詳細なホワイトペーパーを執筆しました。

2.XML WORKER

XMLをPDFに変換するための一般的なツールです。基本的な実装では、XHTMLおよびCSSをPDFに変換します。これは従来のHTML Workerより正確ですが、ウェブサイトをPDFに変換するものではありません。これは、HTMLおよびCSS(複雑なXSL:FOアプローチの代わり)を使用するシンプルなテンプレートを作成する場合のテンプレート・システムのようなものです。これにより、データが含まれるHTMLを追加し、HTMLをPDFに変換できます。XML Workerは、XFA Workerの開発の第一段階でした。「 [XML Workerビデオの使用方法」(https://www.youtube.com/watch?v=clWoDrEEl50)をご覧ください。

3.XFA WORKER

これは、Adobe LiveCycle(XFAフォームの平坦化用)の代替が必要な場合のために作成された、クローズド・ソース製品です。XFAフォームは、ユーザー・インタラクションまたはデータ入力に基づいて変更できる、動的タイプのインタラクティブ・フォームです。XFAフォームを非インタラクティブPDFに平坦化し、これ以上の変更を必要としない記入済みの最終バージョン(アーカイブなど)にします。

XFAフォーマの平坦化の場合、XFA WorkerがAdobe LiveCycleの代替となります。このスレッドで詳細をご確認ください

4.タグ付け

PDFは本来、視覚的な表現用の最終製品として設計されました。これは、編集を重ねるためのワード処理フォーマットではありません。つまり、PDFにはページの任意の位置にコンテンツ(テキスト、画像など)を置くための指示情報が含まれています。ヘッダー、段落、表、リストのような文書構造や構造エレメントのコンセプトがないため、PDFコンテンツを抽出、処理、再利用することが難しくなっています。

タグ付きのPDF(PDF1.3)では、これをより便利にするために追加情報を保存する能力が追加されました。PDFへ論理的な文書構造(構造ツリー)を追加することは、重要な部分です。

タグ付きPDFは、PDF/UA(セクション508: 文書がアクセスできる必要がある)およびPDF/A(レベルA)のコンテキストで重要です。 iText 2を使用してタグ付きPDFを作成することは可能ですが、最低レベル(PDF構文に精通している必要があります)で構造を作成する必要があるため、正確かつ効率的に行うことが非常に困難になります。最新版のiTextでは、iTextの最高レベルのオブジェクト(PdfPTable、Paragraphなど)を使用するとき、自動的にタグ付けを行うことができます。

現在、PDF/A-1、PDF/A-2、およびPDF/A-3(レベルAおよびB)に準拠しているか確認するチェック機能が搭載されています。

5.改善されたデータ抽出機能

iText 5ではPDFからテキストと画像を抽出する機能の改善が含まれています。ヒューリスティックを使用して、PDFページの文章コンテンツ内のテキストを再構築できます。一般的な構造認識機能(段落、リストの検知など)はありませんが、お客様からのご依頼によりカスタムシステムを構築しました。

6.改善されたマージとコピー

PDFのマージおよびコピーのプロセスが書き換えられました。Pdf(Smart)Copyは、タグ付けとAcroforms付きのPDFを処理できるように改善されています。iText 2では、StructTreeRootがなくなり、フォームが壊れてしまいます。

7.最大1TBまでのPDF文書のサポート

iText 2は、最大2GBのPDFをサポートします。最新バージョンのiTextは、最大1TBのPDFの使用が可能です。

8.YATP

「YATP」とと呼ばれる改善文字どおり、「Yet Another TIFF Problem.(また新たなTIFFの問題)」です。 TIFFは、多くのTIFF製作者により「誤用」される基準です。結果として、iTextが読み込めない非常に奇妙なTIFFに遭遇してきました。TIFFに限らず、数か月ごとに類似の問題のソリューションを提供する必要がありますが、TIFFは最も問題が見られるフォーマットであるため、このような問題を「YATP」と呼んでいるのです。

9.AndroidおよびGAE用iText

iTextG: 以下で使用できるiTextバージョン