Deutsch Indonesia Tiếng Việt فارسی English Italiano Türkçe ไทย Español Polski Русский 日本語 Français Português العربية

Chia DOC và Trích Xuất Trang với C#

Wordize for .NET là giải pháp chuyên nghiệp để chia tài liệu DOC thành các phần bằng lập trình. Lớp Splitter giúp các lập trình viên C# chia file DOC thành trang, phần, dải trang sử dụng các tiêu chí khác nhau. Việc chia DOC bằng lập trình giúp tiết kiệm thời gian khi xử lý file lớn và tối ưu hóa quy trình tài liệu cho in ấn và phân phối.

Khi chia DOC thành các phần, API sẽ tự động tạo tên duy nhất cho mỗi phần theo quy tắc {filename}_{index}.{extension}, trong đó {filename} là tên cơ sở của file đầu ra, {index} là số thứ tự của phần bắt đầu từ 1, và {extension} là phần mở rộng (định dạng) của file đầu ra.

Khả Năng Chức Năng:
  • Chia DOC theo trang - phương thức Splitter.Split() với tham số SplitCriteria.Page tạo các tài liệu riêng biệt cho mỗi trang của file DOC nguồn
  • Chia DOC theo phần - sử dụng SplitCriteria.SectionBreak để chia tài liệu DOC theo ranh giới các phần
  • Chia DOC dựa trên kiểu tiêu đề - tham số SplitCriteria.Style với chỉ định SplitStyle cho phép chia tài liệu DOC theo đoạn văn có kiểu tiêu đề cụ thể
  • Trích xuất dải trang - phương thức Splitter.ExtractPages() trích xuất các trang được chỉ định hoặc dải trang từ tài liệu DOC
  • Xóa trang trống - phương thức Splitter.RemoveBlankPages() xóa các trang trống để cải thiện khả năng đọc và giảm kích thước file DOC
  • Hỗ trợ Fluent API để chạy các thao tác chia DOC qua SplitterContext và chuỗi phương thức, tăng tính rõ ràng cho code C#
Tình Huống Sử Dụng:
  • Trích xuất trang riêng lẻ từ tài liệu DOC để xử lý có chọn lọc
  • Chia các hướng dẫn DOC lớn, đặc tả kỹ thuật và báo cáo thành các chương hoặc phần riêng biệt để dễ phân phối và chỉnh sửa
  • Chia DOC thành các phần có kích thước tối ưu cho in riêng biệt hoặc phân phối giữa nhiều máy in
  • Chia tài liệu DOC lưu trữ thành các phần để tối ưu hệ thống lưu trữ và truy cập nhanh thông tin cần thiết
  • Chuẩn bị nội dung cho xuất bản web bằng cách chia tài liệu DOC thành trang hoặc bài viết có kích thước phù hợp
  • Xóa trang trống để giảm kích thước tài liệu DOC và cải thiện hiệu suất của hệ thống quy trình tài liệu

Kiểm tra khả năng chia DOC bằng lập trình trong demo tương tác trực tuyến được trình bày trên trang này. Để làm điều này, hãy tải lên file DOC của bạn, chọn tiêu chí chia, chạy thao tác và tải xuống các phần thu được để kiểm tra. Đoạn code C# được trình bày sử dụng lớp Splitter hoàn toàn sẵn sàng sử dụng trong dự án .NET của bạn.

C#
Chạy mã
Tải lên tài liệu bạn muốn chia
Chọn định dạng đầu ra từ danh sách
using Wordize.Splitting;

Splitter.Split("Input.doc", "Output_page.doc", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.Page
    }
);
using Wordize.Splitting; Splitter.Split("Input.doc", "Output_page.doc", new SplitOptions() { SplitCriteria = SplitCriteria.Page } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.doc", "Output_page.doc", new SplitOptions() { SplitCriteria = SplitCriteria.Page } );
using Wordize.Splitting;

Splitter.Split("Input.doc",  "Output_section.doc", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.SectionBreak
    }
);
using Wordize.Splitting; Splitter.Split("Input.doc", "Output_section.doc", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.doc", "Output_section.doc", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } );
Chạy mã

Cách chia DOC thành các phần bằng lập trình

  1. Kết nối Wordize SDK với dự án .NET của bạn
  2. Gọi phương thức Splitter.Split(), chỉ định trong tham số tài liệu DOC, tên cơ sở của file đầu ra và SplitOptions với tiêu chí chia. Định dạng sẽ được xác định tự động dựa trên phần mở rộng file
  3. Nhận các file DOC đã chia theo tham số được chỉ định
5%