pdfSweep

How it works

With just a few lines of code you can use the powerful PDF redaction capabilities of pdfSweep to irretrievably remove content. The following example will find and redact all instances of the word "Alice" in a document, regardless of casing:

1
2
3
4
5
try (PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(new_File(SRC, "redact")))) {
            final ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(Pattern.compile("Alice", Pattern.CASE_INSENSITIVE)).setRedactionColor(ColorConstants.PINK);
            final PdfAutoSweep autoSweep = new PdfAutoSweep(cleanupStrategy);
            autoSweep.cleanUp(pdf);
        }
1
2
3
4
5
PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(DEST));
            ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(new Regex(@"Alice", RegexOptions.IgnoreCase)).SetRedactionColor(ColorConstants.PINK);
            PdfAutoSweep autoSweep = new PdfAutoSweep(cleanupStrategy);
            autoSweep.CleanUp(pdf);
            pdf.Close();

The original PDF

An unredacted page from Alice in Wonderland

The redacted PDF

A redacted page from Alice in Wonderland

Ключевые функции

Основные возможности iText 7 pdfSweep

pdfSweep используется при редактировании документов PDF с помощью инструментов добавления к документам водяных знаков и штампов iText 7. После добавления цифровой «черной полосы» поверх конфиденциального текста pdfSweep меняет инструкции рендеринга документа, предотвращая возможность извлечения скрытого контента. Это работает как для текста, так и для изображений, значительно повышая безопасность документа. Более того, для этого нужно всего пять строк кода, поэтому pdfSweep очень просто интегрируется в процедуры работы с PDF.

Core capabilities development icon
Автоматическое удаление слов и фраз

Объединение, разделение или удаление частей текста в документе на основе шаблонов, таких как регулярные выражения.

Core capabilities development icon
Настраиваемые области удаления

Возможность удаления необходимого содержания, как цифровая черная полоса.

Core capabilities development icon
Безопасное и надежное удаление

Помимо визуального отображения при просмотре или печати документа PDF pdfSweep также учитывает базовые инструкции рендеринга и структуры данных для обеспечения невозможности получения удаленной информации.

Core capabilities development icon
Частичное удаление текста и изображений

Если контент только частично закрыт областью обезличивания, он удаляется частично, что позволяет удалить выбранные части текста и изображения.

Преимущества

Преимущества iText 7 pdfSweep

Удаление контента вместо простого скрытия. Обезличивание текста и изображений для полной конфиденциальности.

pdfSweep icon svg
Обеспечение безопасности данных

Перед публикацией PDF документов можно удалить конфиденциальную или частную информацию, использовать цифровой эквивалент вымарывания «черной полосой» и многое другое.

pdfSweep icon svg
Гибкие параметры

Используйте регулярные выражения для автоматизации удаления чувствительного контента в документе с помощью набора готовых шаблонов для распространенных случаев, таких как номера социального страхования, даты и IP-адреса. Определите пользовательские области для удаления контента с помощью координат, чтобы удалять все в указанных областях.

Контактная информация

Остались вопросы? 

Мы готовы вам помочь. Обратитесь к нам, и мы ответим, как только сможем.

Связаться с нами
Оставаться в курсе

Присоединяйтесь к более чем 11 000 подписчиков и станьте экспертом iText PDF, следя за нашими новыми продуктами, обновлениями, советами, техническими решениями и событиями.

Подпишись сейчас