Deutsch Indonesia Tiếng Việt فارسی English Italiano Türkçe ไทย Español Polski Русский 日本語 Français Português العربية

Chia Tài Liệu và Trích Xuất Trang với C#

Wordize for .NET là giải pháp chuyên nghiệp để chia tài liệu thành các phần bằng lập trình. Lớp Splitter giúp các lập trình viên C# chia tài liệu thành trang, phần, dải trang sử dụng các tiêu chí khác nhau. Việc chia tài liệu bằng lập trình giúp tiết kiệm thời gian khi xử lý file lớn, đơn giản hóa việc làm việc cộng tác trên tài liệu và tối ưu hóa quy trình tài liệu cho in ấn và phân phối.

Khi chia tài liệu thành các phần, API sẽ tự động tạo tên duy nhất cho mỗi phần theo quy tắc {filename}_{index}.{extension}, trong đó {filename} là tên cơ sở của file đầu ra, {index} là số thứ tự của phần bắt đầu từ 1, và {extension} là phần mở rộng (định dạng) của file đầu ra.

Khả Năng Chức Năng:
  • Chia theo trang - phương thức Splitter.Split() với tham số SplitCriteria.Page tạo các tài liệu riêng biệt cho mỗi trang của file nguồn
  • Chia theo phần - sử dụng SplitCriteria.SectionBreak để chia tài liệu theo ranh giới các phần
  • Chia dựa trên kiểu tiêu đề - tham số SplitCriteria.Style với chỉ định SplitStyle cho phép chia tài liệu theo đoạn văn có kiểu tiêu đề cụ thể
  • Trích xuất dải trang - phương thức Splitter.ExtractPages() trích xuất các trang được chỉ định hoặc dải trang từ tài liệu
  • Xóa trang trống - phương thức Splitter.RemoveBlankPages() xóa các trang trống để cải thiện khả năng đọc và giảm kích thước file
  • Hỗ trợ Fluent API để chạy các thao tác chia qua SplitterContext và chuỗi phương thức, tăng tính rõ ràng cho code C#
Tình Huống Sử Dụng:
  • Trích xuất trang để xử lý có chọn lọc
  • Chuẩn bị tài liệu để in ấn
  • Làm việc cộng tác trên tài liệu
  • Lưu trữ và tái cấu trúc dữ liệu
  • Chuẩn bị nội dung cho xuất bản web
  • Xóa trang trống và nội dung thừa

Kiểm tra khả năng chia tài liệu bằng lập trình trong demo tương tác trực tuyến được trình bày trên trang này. Để làm điều này, hãy tải lên tài liệu của bạn, chọn tiêu chí chia, chạy thao tác và tải xuống các phần thu được. Đoạn code C# được trình bày sử dụng lớp Splitter hoàn toàn sẵn sàng sử dụng trong dự án .NET của bạn.

C#
Chạy mã
Tải lên tài liệu bạn muốn chia
Chọn định dạng đầu ra từ danh sách
using Wordize.Splitting;

Splitter.Split("Input.docx", "Output_page.docx", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.Page
    }
);
using Wordize.Splitting; Splitter.Split("Input.docx", "Output_page.docx", new SplitOptions() { SplitCriteria = SplitCriteria.Page } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.docx", "Output_page.docx", new SplitOptions() { SplitCriteria = SplitCriteria.Page } );
using Wordize.Splitting;

Splitter.Split("Input.docx",  "Output_section.docx", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.SectionBreak
    }
);
using Wordize.Splitting; Splitter.Split("Input.docx", "Output_section.docx", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.docx", "Output_section.docx", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } );
Chạy mã

Cách chia PDF, Word, HTML thành các phần bằng lập trình

  1. Kết nối Wordize for .NET với dự án C# của bạn
  2. Gọi phương thức Splitter.Split(), chỉ định trong tham số tài liệu, tên cơ sở của file đầu ra và SplitOptions với tiêu chí chia. Định dạng sẽ được xác định tự động dựa trên phần mở rộng file
  3. Nhận các file đã chia theo tham số được chỉ định
5%