iText 7 pdfSweep
pdfSweep позволяет разделять и объединять документы PDF, а также безопасно удалять (обезличивать) данные из документов PDF.
How it works
With just a few lines of code you can use the powerful PDF redaction capabilities of pdfSweep to irretrievably remove content. The following example will find and redact all instances of the word "Alice" in a document, regardless of casing:
1
2
3
4
5
try (PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(new_File(SRC, "redact")))) {
final ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(Pattern.compile("Alice", Pattern.CASE_INSENSITIVE)).setRedactionColor(ColorConstants.PINK);
final PdfAutoSweep autoSweep = new PdfAutoSweep(cleanupStrategy);
autoSweep.cleanUp(pdf);
}
1
2
3
4
5
PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(DEST));
ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(new Regex(@"Alice", RegexOptions.IgnoreCase)).SetRedactionColor(ColorConstants.PINK);
PdfAutoSweep autoSweep = new PdfAutoSweep(cleanupStrategy);
autoSweep.CleanUp(pdf);
pdf.Close();
The original PDF
The redacted PDF
Resources
Here you will find the needed resources to install and use pdfSweep.
Other resources
Основные возможности iText 7 pdfSweep
pdfSweep используется при редактировании документов PDF с помощью инструментов добавления к документам водяных знаков и штампов iText 7. После добавления цифровой «черной полосы» поверх конфиденциального текста pdfSweep меняет инструкции рендеринга документа, предотвращая возможность извлечения скрытого контента. Это работает как для текста, так и для изображений, значительно повышая безопасность документа. Более того, для этого нужно всего пять строк кода, поэтому pdfSweep очень просто интегрируется в процедуры работы с PDF.
Автоматическое удаление слов и фраз
Объединение, разделение или удаление частей текста в документе на основе шаблонов, таких как регулярные выражения.
Настраиваемые области удаления
Возможность удаления необходимого содержания, как цифровая черная полоса.
Безопасное и надежное удаление
Помимо визуального отображения при просмотре или печати документа PDF pdfSweep также учитывает базовые инструкции рендеринга и структуры данных для обеспечения невозможности получения удаленной информации.
Частичное удаление текста и изображений
Если контент только частично закрыт областью обезличивания, он удаляется частично, что позволяет удалить выбранные части текста и изображения.
Преимущества iText 7 pdfSweep
Удаление контента вместо простого скрытия. Обезличивание текста и изображений для полной конфиденциальности.
Обеспечение безопасности данных
Перед публикацией PDF документов можно удалить конфиденциальную или частную информацию, использовать цифровой эквивалент вымарывания «черной полосой» и многое другое.
Гибкие параметры
Используйте регулярные выражения для автоматизации удаления чувствительного контента в документе с помощью набора готовых шаблонов для распространенных случаев, таких как номера социального страхования, даты и IP-адреса. Определите пользовательские области для удаления контента с помощью координат, чтобы удалять все в указанных областях.