2つのPDFファイルをJavaの1つにマージする方法は？

Question

PDFBox を使用して、多くのPDFファイルを1つにマージしたいと思います。これは私がやったことです：

PDDocument document = new PDDocument(); for (String pdfFile: pdfFiles) { PDDocument part = PDDocument.load(pdfFile); List<PDPage> list = part.getDocumentCatalog().getAllPages(); for (PDPage page: list) { document.addPage(page); } part.close(); } document.save("merged.pdf"); document.close();

pdfFilesはArrayList<String>すべてのPDFファイルを含む。

上記を実行しているとき、私は常に以下を取得しています：

org.Apache.pdfbox.exceptions.COSVisitorException: Bad file descriptor

私は何か間違っていますか？他の方法はありますか？

cherouvim · Accepted Answer

Pdfboxの PDFMergerUtility を使用しないのはなぜですか？

PDFMergerUtility ut = new PDFMergerUtility(); ut.addSource(...); ut.addSource(...); ut.addSource(...); ut.setDestinationFileName(...); ut.mergeDocuments();

Michael Lloyd Lee mlk · Answer

Googleのクイック検索で次のバグが返されました： "インポートされたPDFを含むドキュメントの保存中に不正なファイル記述子" 。

結合されたPDFを保存して閉じるまで、マージするPDFを開いたままにしておく必要があるようです。

benito · Answer

これはすぐに使用できるコードで、4つのpdfファイルを http://central.maven.org/maven2/com/itextpdf/itextpdf/5.5.0/itextpdf-5.5.0.jarのitext.jarとマージします、詳細は http://tutorialspointexamples.com/

import com.itextpdf.text.Document; import com.itextpdf.text.pdf.PdfContentByte; import com.itextpdf.text.pdf.PdfImportedPage; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.PdfWriter; /** * This class is used to merge two or more * existing pdf file using iText jar. */ public class PDFMerger { static void mergePdfFiles(List<InputStream> inputPdfList, OutputStream outputStream) throws Exception{ //Create document and pdfReader objects. Document document = new Document(); List<PdfReader> readers = new ArrayList<PdfReader>(); int totalPages = 0; //Create pdf Iterator object using inputPdfList. Iterator<InputStream> pdfIterator = inputPdfList.iterator(); // Create reader list for the input pdf files. while (pdfIterator.hasNext()) { InputStream pdf = pdfIterator.next(); PdfReader pdfReader = new PdfReader(pdf); readers.add(pdfReader); totalPages = totalPages + pdfReader.getNumberOfPages(); } // Create writer for the outputStream PdfWriter writer = PdfWriter.getInstance(document, outputStream); //Open document. document.open(); //Contain the pdf data. PdfContentByte pageContentByte = writer.getDirectContent(); PdfImportedPage pdfImportedPage; int currentPdfReaderPage = 1; Iterator<PdfReader> iteratorPDFReader = readers.iterator(); // Iterate and process the reader list. while (iteratorPDFReader.hasNext()) { PdfReader pdfReader = iteratorPDFReader.next(); //Create page and add content. while (currentPdfReaderPage <= pdfReader.getNumberOfPages()) { document.newPage(); pdfImportedPage = writer.getImportedPage( pdfReader,currentPdfReaderPage); pageContentByte.addTemplate(pdfImportedPage, 0, 0); currentPdfReaderPage++; } currentPdfReaderPage = 1; } //Close document and outputStream. outputStream.flush(); document.close(); outputStream.close(); System.out.println("Pdf files merged successfully."); } public static void main(String args[]){ try { //Prepare input pdf file list as list of input stream. List<InputStream> inputPdfList = new ArrayList<InputStream>(); inputPdfList.add(new FileInputStream("..\pdf\pdf_1.pdf")); inputPdfList.add(new FileInputStream("..\pdf\pdf_2.pdf")); inputPdfList.add(new FileInputStream("..\pdf\pdf_3.pdf")); inputPdfList.add(new FileInputStream("..\pdf\pdf_4.pdf")); //Prepare output stream for merged pdf file. OutputStream outputStream = new FileOutputStream("..\pdf\MergeFile_1234.pdf"); //call method to merge pdf files. mergePdfFiles(inputPdfList, outputStream); } catch (Exception e) { e.printStackTrace(); } } }

Sabapathy · Answer

package article14; import Java.io.File; import org.Apache.pdfbox.pdmodel.PDDocument; import org.Apache.pdfbox.pdmodel.PDPage; import org.Apache.pdfbox.util.PDFMergerUtility; public class Pdf { public static void main(String args[]) { new Pdf().createNew(); new Pdf().combine(); } public void combine() { try { PDFMergerUtility mergePdf = new PDFMergerUtility(); String folder ="pdf"; File _folder = new File(folder); File[] filesInFolder; filesInFolder = _folder.listFiles(); for (File string : filesInFolder) { mergePdf.addSource(string); } mergePdf.setDestinationFileName("Combined.pdf"); mergePdf.mergeDocuments(); } catch(Exception e) { } } public void createNew() { PDDocument document = null; try { String filename="test.pdf"; document=new PDDocument(); PDPage blankPage = new PDPage(); document.addPage( blankPage ); document.save( filename ); } catch(Exception e) { } } }

arifng · Answer

org.Apache.pdfboxを使用した複数のpdfマージ方法

public void mergePDFFiles(List<File> files, String mergedFileName) { try { PDFMergerUtility pdfmerger = new PDFMergerUtility(); for (File file : files) { PDDocument document = PDDocument.load(file); pdfmerger.setDestinationFileName(mergedFileName); pdfmerger.addSource(file); pdfmerger.mergeDocuments(MemoryUsageSetting.setupTempFileOnly()); document.close(); } } catch (IOException e) { logger.error("Error to merge files. Error: " + e.getMessage()); } }

メインプログラムから、ファイルのリストとターゲットファイル名を使用してmergePDFFilesメソッドを呼び出します。

 String mergedFileName = "Merged.pdf"; mergePDFFiles(files, mergedFileName);

mergePDFFilesを呼び出した後、マージされたファイルをロードします

 File mergedFile = new File(mergedFileName);

Ricardo Jl Rufino · Answer

ITextの使用（既存のPDFバイト単位））

 public static byte[] mergePDF(List<byte[]> pdfFilesAsByteArray) throws DocumentException, IOException { ByteArrayOutputStream outStream = new ByteArrayOutputStream(); Document document = null; PdfCopy writer = null; for (byte[] pdfByteArray : pdfFilesAsByteArray) { try { PdfReader reader = new PdfReader(pdfByteArray); int numberOfPages = reader.getNumberOfPages(); if (document == null) { document = new Document(reader.getPageSizeWithRotation(1)); writer = new PdfCopy(document, outStream); // new document.open(); } PdfImportedPage page; for (int i = 0; i < numberOfPages;) { ++i; page = writer.getImportedPage(reader, i); writer.addPage(page); } } catch (Exception e) { e.printStackTrace(); } } document.close(); outStream.close(); return outStream.toByteArray(); }

Dave W · Answer

一方が他方をオーバーレイする2つのファイルを結合する場合（例：文書Aはテンプレートであり、文書Bにはテンプレートに配置するテキストがある）、これは機能します。

「doc」を作成したら、その上にテンプレート（templateFile）を記述します-

 PDDocument watermarkDoc = PDDocument.load(getServletContext() .getRealPath(templateFile)); Overlay overlay = new Overlay(); overlay.overlay(watermarkDoc, doc);