Bài viết ngắn này chứa thông tin chi tiết về cách tách tài liệu Word bằng Java. Nó cung cấp thông tin chi tiết về cách định cấu hình môi trường, một tập hợp các bước cần tuân theo để viết ứng dụng này và mã mẫu có thể chạy được minh họa quy trình tách các trang trong Word bằng Java. Nó mô tả quá trình chia tài liệu dựa trên từng trang, tuy nhiên, nó cũng thảo luận về các tùy chọn để chia tài liệu Word theo nhiều cách khác nhau và lưu nó dưới dạng DOCX, DOC hoặc bất kỳ định dạng được hỗ trợ nào khác .
Các bước tách file Word bằng Java
- Thiết lập môi trường để sử dụng Aspose.Words for Java để phân chia tài liệu Word
- Tải tệp Word mẫu có nhiều trang vào đối tượng lớp Document
- Lấy tổng số trang trong tài liệu đã tải
- Phân tích qua từng trang của tài liệu
- Trích xuất trang được chỉ định bằng phương pháp extractPages() trong lớp Tài liệu
- Lưu tài liệu vừa trích xuất trên đĩa
Các bước này giải thích quy trình tách tài liệu Word bằng Java bằng cách chia sẻ liên kết tới thư viện tài nguyên được sử dụng trong mã mẫu. Trước tiên, bạn tải tệp Word nguồn vào đối tượng lớp Tài liệu cũng chứa phương thức chia tài liệu. Ở đây, các bước được đưa ra để chia nhỏ tài liệu sao cho mỗi trang được trích xuất và lưu dưới dạng một tài liệu riêng biệt.
Mã để trích xuất các trang từ Word bằng Java
Mã này trình bày quá trình tách DOCX bằng Java trong đó tài liệu nguồn được tải bằng cách sử dụng đối tượng lớp Tài liệu có nhiều hàm tạo lấy tên tệp, luồng đầu vào và đối tượng lớp LoadOptions để đặt mật khẩu cho các tệp được bảo vệ cùng với các tệp khác tài sản là tốt. Hàm extractPages() có thể được sử dụng để trích xuất các trang bằng cách cung cấp chỉ mục bắt đầu và số lượng trang được trích xuất dưới dạng tài liệu mới. Các tùy chọn cũng có sẵn để phân chia tài liệu theo tiêu đề, phần và theo phạm vi trang theo yêu cầu.
Hướng dẫn này đã hướng dẫn chúng ta viết Bộ tách trang Word bằng Java. Nếu bạn muốn tìm hiểu quy trình thêm nhận xét, hãy tham khảo bài viết trên cách thêm comment trong Word bằng Java.