iText 7 pdfSweep
pdfSweep — это дополнение iText 7 для Java и C# (.NET), которое позволяет удалять (обезличивать) информацию из PDF-документов надежным и безопасным способом
How it works
With just a few lines of code you can use the powerful PDF redaction capabilities of pdfSweep to irretrievably remove content. The following example will find and redact all instances of the word "Alice" in a document, regardless of casing:
1
2
3
4
try (PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(new_File(SRC, "redact")))) {
final ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(Pattern.compile("Alice", Pattern.CASE_INSENSITIVE)).setRedactionColor(ColorConstants.PINK);
PdfCleaner.autoSweepCleanUp(pdf, cleanupStrategy);
}
1
2
3
4
PdfDocument pdf = new PdfDocument(new PdfReader(SRC), new PdfWriter(DEST));
ICleanupStrategy cleanupStrategy = new RegexBasedCleanupStrategy(new Regex(@"Alice", RegexOptions.IgnoreCase)).SetRedactionColor(ColorConstants.PINK);
PdfCleaner.AutoSweepCleanUp(pdf, cleanupStrategy);
pdf.Close();
The original PDF
The redacted PDF
Материалы
Здесь вы найдете ресурсы, необходимые для установки и использования дополнения pdfSweep.
Other resources
Основные возможности инструмента обезличивания iText<br />7 pdfSweep
pdfSweep используется при редактировании документов PDF с помощью инструментов добавления к документам водяных знаков и штампов iText 7. После добавления цифровой «черной полосы» поверх конфиденциального текста, изображения или части изображения pdfSweep меняет инструкции рендеринга документа, предотвращая возможность извлечения скрытого контента из вашего цифрового документа. Это работает как для текста, так и для изображений, обеспечивая полную защиту информации.
Глядя на преимущества дополнения pdfSweep и предлагаемый им уровень информационной безопасности, сложно поверить в то, что для его интеграции в ваш документооборот потребуется всего пять строк кода.
Автоматическое удаление слов и фраз
Объединение, разделение или удаление частей текста в документе на основе шаблонов, таких как регулярные выражения.
Настраиваемые области удаления
Возможность удаления необходимого содержания, как цифровая черная полоса.
Безопасное и надежное удаление
Помимо визуального отображения при просмотре или печати документа PDF pdfSweep также учитывает базовые инструкции рендеринга и структуры данных для обеспечения невозможности получения удаленной информации.
Частичное удаление текста и изображений
Если контент только частично закрыт областью обезличивания, он удаляется частично, что позволяет удалить выбранные части текста и изображения.
Преимущества iText 7 pdfSweep
pdfSweep — высокоэффективный инструмент для удаления конфиденциальных данных из PDF-документов.
Безвозвратно удаляйте содержимое из цифровых документов вместо того, чтобы просто его закрывать. Вы также можете обезличивать текст, изображения или части изображений или чертежей для обеспечения полной конфиденциальности. iText pdfSweep соответствует требованиям GDPR в отношении обезличивания данных.
Обеспечение безопасности данных
Перед публикацией PDF документов можно удалить конфиденциальную или частную информацию, использовать цифровой эквивалент вымарывания «черной полосой» и многое другое.
Гибкие параметры
Используйте регулярные выражения для автоматизации удаления чувствительного контента в документе с помощью набора готовых шаблонов для распространенных случаев, таких как номера социального страхования, даты и IP-адреса. Определите пользовательские области для удаления контента с помощью координат, чтобы удалять все в указанных областях.