pdf2Data

はじめに

iText 7 pdf2Data

pdf2Dataを使用すると、PDFの処理を自動化して、大量の同じ形式のPDF文書からデータを簡単に抽出することができます。テンプレートで定義できる選択ルールに基づいて、PDF文書内にあるデータを認識するフレームワークを提供します。

pdf2DataはiText 7向け商用ライセンスのアドオンの1つで、商用目的やクローズドソースでこの製品を使用する場合には、iText 7 Coreとpdf2Data向けの商用ライセンスが必要です。プロジェクト向けのライセンスおよび価格設定に関する詳細については、お見積もりをご依頼ください。

メリット

iText 7 pdf2Dataを使う理由

データは重要な商品であり、認識できる以上のデータがPDF文書に隠されています。当然のことながら、このデータを手動で収集するのは時間がかかり、入力ミスのリスクだけでなく、  セキュリティ上の問題も高くなります。pdf2Dataを使用すると、 データを安全な方法で抽出するプロセスを自動化できます。pdf2Dataが持つその他のメリットについては続きをお読みください。 

 

pdf2Data icon svg
PDF版請求書や文書からのデータ抽出を自動化

テンプレートで重要な情報を定義し、Javaや.NETでのプログラミングを用いて自動的に取り出すことで、 大量のPDFから データを抽出して処理します。 

pdf2Data icon svg
抽出したいデータ部分を具体的に定義する

pdf2Dataテンプレートエディタを用いて、 テンプレートに抽出したい情報をすばやく定義します(PDF版 請求書の右上端に常にある住所のフィールドなど)。

pdf2Data icon svg
既存の文書処理への統合

pdf2Dataはオープン標準を使用して統合を容易にし、これにより、既存ワークフローへの統合を 容易かつ迅速に行います。これにはJava用SDKと.NET用SDK、ならびにコマンドラインインターフェイスが含まれています。

主な特徴

iText 7 pdf2dataのコア機能

pdf2Dataは、請求書や受領書など、同じ形式で作成されたPDF文書のテンプレート上の領域、フォント、パターン、利息表を定義することで動作します。その後、セレクターを使って利息の領域を定義できます。各セレクターはさまざまな方法を使用して重要な情報を識別し、ニーズに合わせて単独または組み合わせて使用できます。 

Core capabilities development icon
PDF文書からデータを抽出

iText 7 Coreの コンテンツ抽出機能を活用すると、テキストや画像に対する忠実度の高い認識プロセスを行うことができます。

Core capabilities development icon
直感的な抽出設定

このアドオンは拡張とカスタマイズできる柔軟性を持つ総合的でオリジナルな機能を備えています。統合のしやすさとオープンスタンダードに重きを置いています。

Core capabilities development icon
テンプレートを使用して抽出を合理化

目的の領域と選択ルールを定義すれば、必要なコンテンツを正確に取得できます。

Core capabilities development icon
PDFやデータのワークフローに統合

抽出したコンテンツのページ座標にアクセスして、さらなる処理の為にデータを構造化され、再利用ができる形式で出力します。

お問い合わせ

それでも問題が解決しませんか? 

お寄せいただいたご質問には、喜んでお答えいたします。当社へご連絡ください。内容を確認次第、追ってご連絡いたします。

問い合わせる
常に最新情報を得る

11,000人以上の購読者に加わって、iTextの新しい製品、アップデート、ヒント、記述的な解決策や出来事に関する最新情報を得ることでiText PDF専門家になりましょう。

今すぐ購読