Deutsch Indonesia Tiếng Việt فارسی English Italiano Türkçe ไทย Español Polski Русский 日本語 Français Português العربية

Разделение документов и извлечение страниц на C#

Wordize for .NET - профессиональное решение для программного разделения документов на части. Класс Splitter позволит C# разработчикам делить документы на страницы, разделы, диапазоны страниц с использованием различных критериев. Программное разделение документов поможет сэкономить время при обработке объемных файлов, упростить совместную работу над документами и оптимизировать документооборот для печати и рассылки.

При разделении документа на части API автоматически генерирует уникальные имена для каждой части по правилу {filename}_{index}.{extension}, где {filename} - базовое имя выходного файла, {index} - порядковый номер части, начиная с 1, а {extension} - расширение (формат) выходного файла.

Функциональные возможности:
  • Разделение по страницам - метод Splitter.Split() с параметром SplitCriteria.Page создает отдельные документы для каждой страницы исходного файла
  • Разделение по разделам - использование SplitCriteria.SectionBreak для деления документа по границам разделов
  • Разделение на основе стилей заголовков - параметр SplitCriteria.Style с указанием SplitStyle позволяет делить документ по абзацам с определенными стилями заголовков
  • Извлечение диапазонов страниц - метод Splitter.ExtractPages() извлекает заданные страницы или диапазоны страниц из документа
  • Удаление пустых страниц - метод Splitter.RemoveBlankPages() удаляет пустые страницы для улучшения читаемости и уменьшения размера файла
  • Поддержка Fluent API для запуска операции разделения через SplitterContext и цепочку методов, что добавляет C# коду наглядности
Сценарии использования:
  • Извлечение страниц для выборочной обработки
  • Подготовка документации к печати
  • Совместная работа над документами
  • Архивирование и реструктуризация данных
  • Подготовка контента для веб-публикации
  • Удаление пустых страниц и лишнего контента

Протестируйте возможности программного разделения документов в интерактивном онлайн-демо, которое представлено на этой странице. Для этого загрузите документ, выберите критерий его разделения, запустите операцию и скачайте полученные части. Представленный фрагмент кода C# с использованием класса Splitter полностью готов для использования в вашем .NET проекте.

C#
Запустить код
Загрузите документ, который хотите разделить
Выберите формат вывода из списка
using Wordize.Splitting;

Splitter.Split("Input.docx", "Output_page.docx", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.Page
    }
);
using Wordize.Splitting; Splitter.Split("Input.docx", "Output_page.docx", new SplitOptions() { SplitCriteria = SplitCriteria.Page } ); using Wordize.Splitting; Splitter.Split("Input.docx", "Output_page.docx", new SplitOptions() { SplitCriteria = SplitCriteria.Page } );
using Wordize.Splitting;

Splitter.Split("Input.docx",  "Output_section.docx", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.SectionBreak
    }
);
using Wordize.Splitting; Splitter.Split("Input.docx", "Output_section.docx", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } ); using Wordize.Splitting; Splitter.Split("Input.docx", "Output_section.docx", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } );
Запустить код

Как программно разделить PDF, Word, HTML на части

  1. Подключите Wordize for .NET к своему C# проекту
  2. Вызовите метод Splitter.Split(), указав в параметрах документ, базовое имя выходного файла и SplitOptions с критериями разделения. Форматы будут определены автоматически на основе расширений файлов
  3. Получите разделенные файлы согласно заданным параметрам
5%