Deutsch Indonesia Tiếng Việt فارسی English Italiano Türkçe ไทย Español Polski Русский 日本語 Français Português العربية

การแยกเอกสารและสกัดหน้าเอกสารด้วย C#

Wordize for .NET เป็นโซลูชันระดับมืออาชีพสำหรับการแยกเอกสารเป็นส่วนต่างๆ แบบโปรแกรม คลาส Splitter ช่วยให้นักพัฒนา C# สามารถแยกเอกสารเป็นหน้า ส่วน ช่วงหน้าโดยใช้เกณฑ์ต่างๆ การแยกเอกสารแบบโปรแกรมช่วยประหยัดเวลาในการประมวลผลไฟล์ขนาดใหญ่ ลดความซับซ้อนของการทำงานร่วมกันในเอกสาร และเพิ่มประสิทธิภาพเวิร์กโฟลว์เอกสารสำหรับการพิมพ์และการจัดส่ง

เมื่อแยกเอกสารเป็นส่วนต่างๆ API จะสร้างชื่อเฉพาะสำหรับแต่ละส่วนโดยอัตโนมัติตามกฎ {filename}_{index}.{extension} โดยที่ {filename} เป็นชื่อฐานของไฟล์เอาต์พุต {index} เป็นหมายเลขลำดับของส่วนเริ่มต้นจาก 1 และ {extension} เป็นนามสกุล (รูปแบบ) ของไฟล์เอาต์พุต

ความสามารถเชิงฟังก์ชัน:
  • การแยกตามหน้า - เมธอด Splitter.Split() กับพารามิเตอร์ SplitCriteria.Page สร้างเอกสารแยกสำหรับแต่ละหน้าของไฟล์ต้นฉบับ
  • การแยกตามส่วน - การใช้ SplitCriteria.SectionBreak เพื่อแยกเอกสารตามขอบเขตของส่วน
  • การแยกตามสไตล์หัวข้อ - พารามิเตอร์ SplitCriteria.Style ด้วยการระบุ SplitStyle ช่วยให้แยกเอกสารตามย่อหน้าที่มีสไตล์หัวข้อเฉพาะ
  • การสกัดช่วงหน้า - เมธอด Splitter.ExtractPages() สกัดหน้าที่กำหนดหรือช่วงหน้าจากเอกสาร
  • การลบหน้าว่าง - เมธอด Splitter.RemoveBlankPages() ลบหน้าว่างเพื่อปรับปรุงความสามารถในการอ่านและลดขนาดไฟล์
  • รองรับ Fluent API สำหรับการรันการดำเนินการแยกผ่าน SplitterContext และการเชื่อมโยงเมธอด เพิ่มความชัดเจนให้โค้ด C#
สถานการณ์การใช้งาน:
  • การสกัดหน้าสำหรับการประมวลผลแบบเลือก
  • การเตรียมเอกสารสำหรับการพิมพ์
  • การทำงานร่วมกันในเอกสาร
  • การจัดเก็บและการปรับโครงสร้างข้อมูล
  • การเตรียมเนื้อหาสำหรับการเผยแพร่เว็บ
  • การลบหน้าว่างและเนื้อหาที่ไม่จำเป็น

ทดสอบความสามารถในการแยกเอกสารแบบโปรแกรมในเดโมแบบโต้ตอบออนไลน์ที่นำเสนอในหน้านี้ ในการทำเช่นนี้ ให้อัปโหลดเอกสารของคุณ เลือกเกณฑ์การแยก เรียกใช้การดำเนินการ และดาวน์โหลดส่วนที่ได้รับ โค้ด C# ที่นำเสนอโดยใช้คลาส Splitter พร้อมสำหรับการใช้งานในโปรเจ็กต์ .NET ของคุณ

C#
รันโค้ด
อัปโหลดเอกสารที่คุณต้องการแยก
เลือกรูปแบบเอาต์พุตจากรายการ
using Wordize.Splitting;

Splitter.Split("Input.docx", "Output_page.docx", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.Page
    }
);
using Wordize.Splitting; Splitter.Split("Input.docx", "Output_page.docx", new SplitOptions() { SplitCriteria = SplitCriteria.Page } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.docx", "Output_page.docx", new SplitOptions() { SplitCriteria = SplitCriteria.Page } );
using Wordize.Splitting;

Splitter.Split("Input.docx",  "Output_section.docx", 
    new SplitOptions()
    { 
        SplitCriteria = SplitCriteria.SectionBreak
    }
);
using Wordize.Splitting; Splitter.Split("Input.docx", "Output_section.docx", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } ); using Wordize.Splitting; //IMAGE Splitter.Split("Input.docx", "Output_section.docx", new SplitOptions() { SplitCriteria = SplitCriteria.SectionBreak } );
รันโค้ด

วิธีแยก PDF, วอร์ด, HTML แบบโปรแกรมเป็นส่วนต่างๆ

  1. เชื่อมต่อ Wordize for .NET กับโปรเจ็กต์ C# ของคุณ
  2. เรียกใช้เมธอด Splitter.Split() โดยระบุในพารามิเตอร์เอกสาร ชื่อฐานของไฟล์เอาต์พุต และ SplitOptions พร้อมเกณฑ์การแยก รูปแบบจะถูกกำหนดโดยอัตโนมัติตามนามสกุลไฟล์
  3. รับไฟล์ที่แยกแล้วตามพารามิเตอร์ที่กำหนด
5%