iText 7 pdfSweep
pdfSweepは、JavaおよびC#(.NET) 用のiText 7アドオンであり、信頼性及び安全性の高い方法でPDFドキュメントから情報を削除(または編集)します
How it works
With just a few lines of code you can use the powerful PDF redaction capabilities of pdfSweep to irretrievably remove content. The following example will find and redact all instances of the word "Alice" in a document, regardless of casing:
1
2
3
4
try (PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(new_File(SRC, "redact")))) {
final ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(Pattern.compile("Alice", Pattern.CASE_INSENSITIVE)).setRedactionColor(ColorConstants.PINK);
PdfCleaner.autoSweepCleanUp(pdf, cleanupStrategy);
}
1
2
3
4
PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(DEST));
ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(new Regex(@"Alice", RegexOptions.IgnoreCase)).SetRedactionColor(ColorConstants.PINK);
PdfCleaner.AutoSweepCleanUp(pdf, cleanupStrategy);
pdf.Close();
The original PDF
The redacted PDF
リソース
pdfSweepのインストールと使用に必要なリソースがここにあります。
Other resources
iText 7 pdfSweep 編集ツールのコア機能
pdfSweepでは、iText 7の文書スタンプと透かしツールを用いてPDF文書を編集する際に介入します。pdfSweepでは、画像、もしくは画像の一部のセンシティブなテキスト上にデジタルの「黒線」を追加した後、文書のレンダリング指示を変更し、デジタルドキュメントの隠したコンテンツが抽出できないようにします。これは、 のテキストと画像の両方で機能して、完全な情報セキュリティを提供します。
pdfSweepの利点と提供するデータセキュリティを見てみると、pdfSweepをドキュメントワークフローに統合するためには、5行のコードのみが必要であることに驚くかも知れません。
語句を自動的に削除
正規表現などのパターンに基づいて、文書からテキストの一部分を分割、マージ、削除します。
削除領域のカスタマイズ
デジタル黒線のように、必要に応じてコンテンツを削除する機能を提供します。
安全かつ信頼できる削除
pdfSweepは、PDF文書の表示や印刷を行う際にレンダリングする外観の上で、基礎となるレンダリング命令とデータ構造も処理して、削除した情報が回復不可能であることを確保します。
テキストと画像を部分的に削除
編集領域がコンテンツを部分的に覆っている場合、選択した領域のテキストや画像を削除することができます。
iText 7 pdfSweepを使う理由
pdfSweep は、 機密データの秘匿化のための、非常に効率的なPDFツールです。
単に秘匿するだけはでなく、該当コンテンツをデジタルドキュメントから削除します。また、完全な機密保持のために、テキスト、画像、画像の一部、もしくは図面の編集を行うことも可能です。iText pdfSweepは、データの編集において、GDPRへ準拠しています。
データを安全に保つ
PDF文書を 開示する前に機密情報や個人情報を削除することができ、 「黒線」での編集と同等のデジタル処理などを使用します。
柔軟なオプション
社会保障番号、日付、IPアドレスなど、一般的なケース用に 事前に定義したパターン一式と一緒に正規表現を使用して、文書全体の編集を自動化します。 座標を用いてカスタム編集領域を定義し、 その中にあるコンテンツを削除します。