Deutsch Indonesia Tiếng Việt فارسی English Italiano Türkçe ไทย Español Polski Русский 日本語 Français Português العربية

Chia Tài Liệu PDF và Trích Xuất Trang với C#

Wordize for .NET là giải pháp chuyên nghiệp để chia tài liệu PDF thành các phần bằng lập trình. Lớp Splitter giúp các lập trình viên C# chia file PDF thành trang, phần, dải trang sử dụng các tiêu chí khác nhau. Việc chia PDF bằng lập trình giúp tiết kiệm thời gian khi xử lý file lớn và tối ưu hóa quy trình tài liệu cho in ấn và phân phối.

Khi chia PDF thành các phần, API sẽ tự động tạo tên duy nhất cho mỗi phần theo quy tắc {filename}_{index}.{extension}, trong đó {filename} là tên cơ sở của file đầu ra, {index} là số thứ tự của phần bắt đầu từ 1, và {extension} là phần mở rộng (định dạng) của file đầu ra.

Khả Năng Chức Năng:
  • Chia PDF theo trang - phương thức Splitter.Split() với tham số SplitCriteria.Page tạo các tài liệu riêng biệt cho mỗi trang của file PDF nguồn
  • Chia PDF theo phần - sử dụng SplitCriteria.SectionBreak để chia tài liệu PDF theo ranh giới các phần
  • Chia PDF dựa trên kiểu tiêu đề - tham số SplitCriteria.Style với chỉ định SplitStyle cho phép chia tài liệu PDF theo đoạn văn có kiểu tiêu đề cụ thể
  • Trích xuất dải trang - phương thức Splitter.ExtractPages() trích xuất các trang được chỉ định hoặc dải trang từ tài liệu PDF
  • Xóa trang trống - phương thức Splitter.RemoveBlankPages() xóa các trang trống để cải thiện khả năng đọc và giảm kích thước file PDF
  • Hỗ trợ Fluent API để chạy các thao tác chia PDF qua SplitterContext và chuỗi phương thức, tăng tính rõ ràng cho code C#
Tình Huống Sử Dụng:
  • Trích xuất trang riêng lẻ từ PDF để xử lý có chọn lọc
  • Chia các hướng dẫn PDF lớn, đặc tả kỹ thuật và báo cáo thành các chương hoặc phần riêng biệt để dễ phân phối
  • Chia PDF thành các phần có kích thước tối ưu cho in riêng biệt hoặc phân phối giữa nhiều máy in
  • Chia tài liệu PDF lưu trữ thành các phần để tối ưu hệ thống lưu trữ và truy cập nhanh thông tin cần thiết
  • Chuẩn bị nội dung cho xuất bản web bằng cách chia tài liệu PDF thành trang hoặc bài viết có kích thước phù hợp
  • Xóa trang trống để giảm kích thước PDF và cải thiện hiệu suất của hệ thống quy trình tài liệu

Kiểm tra khả năng chia PDF bằng lập trình trong demo tương tác trực tuyến được trình bày trên trang này. Để làm điều này, hãy tải lên file PDF của bạn, chọn tiêu chí chia, chạy thao tác và tải xuống các phần thu được để kiểm tra. Đoạn code C# được trình bày sử dụng lớp Splitter hoàn toàn sẵn sàng sử dụng trong dự án .NET của bạn.

C#
Chạy mã
Tải lên tài liệu bạn muốn chia
Chọn định dạng đầu ra từ danh sách
using Wordize.Splitting;

Splitter.Split("Input.pdf", "Output_page.pdf", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.Page
    }
);
using Wordize.Splitting; Splitter.Split("Input.pdf", "Output_page.pdf", new SplitOptions() { SplitCriteria = SplitCriteria.Page } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.pdf", "Output_page.pdf", new SplitOptions() { SplitCriteria = SplitCriteria.Page } );
using Wordize.Splitting;

Splitter.Split("Input.pdf",  "Output_section.pdf", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.SectionBreak
    }
);
using Wordize.Splitting; Splitter.Split("Input.pdf", "Output_section.pdf", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.pdf", "Output_section.pdf", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } );
Chạy mã

Cách chia PDF thành các phần bằng lập trình

  1. Kết nối Wordize SDK với dự án .NET của bạn
  2. Gọi phương thức Splitter.Split(), chỉ định trong tham số tài liệu PDF, tên cơ sở của file đầu ra và SplitOptions với tiêu chí chia. Định dạng sẽ được xác định tự động dựa trên phần mở rộng file
  3. Nhận các file PDF đã chia theo tham số được chỉ định
5%