PDFBox - Removendo páginas

Vamos agora aprender como remover páginas de um documento PDF.

Removendo páginas de um documento existente

Você pode remover uma página de um documento PDF existente usando o removePage() método do PDDocument classe.

Etapa 1: Carregando um documento PDF existente

Carregue um documento PDF existente usando o método estático load() do PDDocumentclasse. Este método aceita um objeto de arquivo como parâmetro, uma vez que é um método estático, você pode invocá-lo usando o nome da classe conforme mostrado abaixo.

File file = new File("path of the document") 
PDDocument.load(file);

Etapa 2: listando o número de páginas

Você pode listar o número de páginas que existe no documento PDF usando o getNumberOfPages() método conforme mostrado abaixo.

int noOfPages= document.getNumberOfPages();
System.out.print(noOfPages);

Etapa 3: Remover a página

Você pode remover uma página do documento PDF usando o removePage() método do PDDocumentclasse. Para este método, você precisa passar o índice da página a ser deletada.

Enquanto especificando o índice para as páginas de um documento PDF, tenha em mente que a indexação dessas páginas começa do zero, ou seja, se você quiser excluir o 1 st página, em seguida, as necessidades de valor de índice para ser 0.

document.removePage(2);

Etapa 4: Salvar o documento

Depois de remover a página, salve o documento PDF usando o save() método do PDDocument classe conforme mostrado no seguinte bloco de código.

document.save("Path");

Etapa 5: Fechando o Documento

Finalmente, feche o documento usando o close() método do PDDocument classe como mostrado abaixo.

document.close();

Exemplo

Suponha que temos um documento PDF com o nome sample.pdf e contém três páginas vazias, conforme mostrado abaixo.

Este exemplo demonstra como remover páginas de um documento PDF existente. Aqui, carregaremos o documento PDF especificado acima denominadosample.pdf, remova uma página dela e salve-a no caminho C:/PdfBox_Examples/. Salve este código em um arquivo com o nomeRemoving_pages.java.

import java.io.File;
import java.io.IOException;

import org.apache.pdfbox.pdmodel.PDDocument;

public class RemovingPages {

   public static void main(String args[]) throws IOException {

      //Loading an existing document
      File file = new File("C:/PdfBox_Examples/sample.pdf");
      PDDocument document = PDDocument.load(file);
       
      //Listing the number of existing pages
      int noOfPages= document.getNumberOfPages();
      System.out.print(noOfPages);
       
      //Removing the pages
      document.removePage(2);
      
      System.out.println("page removed");

      //Saving the document
      document.save("C:/PdfBox_Examples/sample.pdf");

      //Closing the document
      document.close();

   }
}

Compile e execute o arquivo Java salvo no prompt de comando usando os comandos a seguir.

javac RemovingPages.java 
java RemovingPages

Após a execução, o programa acima cria um documento PDF com páginas em branco exibindo a seguinte mensagem.

3
page removed

Se você verificar o caminho especificado, poderá descobrir que a página necessária foi excluída e apenas duas páginas permaneceram no documento, conforme mostrado abaixo.