約1000個のpdfファイルがあり、それらを300 dpiのTIFFファイルに変換する必要があります。これを行う最良の方法は何ですか?受け入れられるSDKまたは何かまたはツールがあれば理想的です。
Imagemagick、またはそれ以上のGhostscriptを使用してください。
http://www.ibm.com/developerworks/library/l-graf2/#N101C2 にはimagemagickの例があります。
convert foo.pdf pages-%03d.tiff
http://www.asmail.be/msg0055376363.html にはghostscriptの例があります:
gs -q -dNOPAUSE -sDEVICE=tiffg4 -sOutputFile=a.tif foo.pdf -c quit
Ghostscriptをインストールし、gsのマニュアルページを読んで、どのようなオプションが必要かを確認し、実験します。
コマンドラインからGhostScriptを使用して、私は過去に以下を使用しました。
windowsの場合:
gswin32c -dNOPAUSE -q -g300x300 -sDEVICE=tiffg4 -dBATCH -sOutputFile=output_file_name.tif input_file_name.pdf
* nixで:
gs -dNOPAUSE -q -g300x300 -sDEVICE=tiffg4 -dBATCH -sOutputFile=output_file_name.tif input_file_name.pdf
多数のファイルの場合、単純なバッチ/シェルスクリプトを使用して、任意の数のファイルを変換できます...
ディレクトリ構造を調べ、ghostscriptを使用してすべてのpdfファイルをtiffファイルに変換するための小さなPowerShellスクリプトを作成しました。これが私のスクリプトです:
$tool = 'C:\Program Files\gs\gs8.63\bin\gswin32c.exe'
$pdfs = get-childitem . -recurse | where {$_.Extension -match "pdf"}
foreach($pdf in $pdfs)
{
$tiff = $pdf.FullName.split('.')[0] + '.tiff'
if(test-path $tiff)
{
"tiff file already exists " + $tiff
}
else
{
'Processing ' + $pdf.Name
$param = "-sOutputFile=$tiff"
& $tool -q -dNOPAUSE -sDEVICE=tiffg4 $param -r300 $pdf.FullName -c quit
}
}
1)GhostScriptをインストールします
2)ImageMagickをインストールする
3)「Convert-to-TIFF.bat」(Windows XP、Vista、7)を作成し、次の行を使用します。
for %%f in (%*) DO "C:\Program Files\ImageMagick-6.6.4-Q16\convert.exe" -density 300 -compress lzw %%f %%f.tiff
任意の数の単一ページPDFファイルをこのファイルにドラッグすると、300 DPIの圧縮TIFFに変換されます。
pythonを使用して、これが最終的には
import os
os.popen(' '.join([
self._ghostscriptPath + 'gswin32c.exe',
'-q',
'-dNOPAUSE',
'-dBATCH',
'-r300',
'-sDEVICE=tiff12nc',
'-sPAPERSIZE=a4',
'-sOutputFile=%s %s' % (tifDest, pdfSource),
]))
PDF Focus .Netは次のようにできます:
1。PDF to TIFF
SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
string pdfPath = @"c:\My.pdf";
string imageFolder = @"c:\images\";
f.OpenPdf(pdfPath);
if (f.PageCount > 0)
{
//Save all PDF pages to image folder as tiff images, 200 dpi
int result = f.ToImage(imageFolder, "page",System.Drawing.Imaging.ImageFormat.Tiff, 200);
}
2。PDF to Multipage-TIFF
//Convert PDF file to Multipage TIFF file
SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
string pdfPath = @"c:\Document.pdf";
string tiffPath = @"c:\Result.tiff";
f.OpenPdf(pdfPath);
if (f.PageCount > 0)
{
f.ToMultipageTiff(tiffPath, 120) == 0)
{
System.Diagnostics.Process.Start(tiffPath);
}
}
ABCPDFも同様にできます-チェックアウト http://www.websupergoo.com/helppdf6net/default.html
Ubuntuでテストされた必須のghostscriptとtiffcp
import os
def pdf2tiff(source, destination):
idx = destination.rindex('.')
destination = destination[:idx]
args = [
'-q', '-dNOPAUSE', '-dBATCH',
'-sDEVICE=tiffg4',
'-r600', '-sPAPERSIZE=a4',
'-sOutputFile=' + destination + '__%03d.tiff'
]
gs_cmd = 'gs ' + ' '.join(args) +' '+ source
os.system(gs_cmd)
args = [destination + '__*.tiff', destination + '.tiff' ]
tiffcp_cmd = 'tiffcp ' + ' '.join(args)
os.system(tiffcp_cmd)
args = [destination + '__*.tiff']
rm_cmd = 'rm ' + ' '.join(args)
os.system(rm_cmd)
pdf2tiff('abc.pdf', 'abc.tiff')
Pdf2tiffはどうですか? http://python.net/~gherman/pdf2tiff.html
これも試してみませんか? PDFフォーカス
この.Netライブラリを使用すると、問題を解決できます。
このコードが役立ちます(C#で1000 PDFファイルを300-dpi TIFFファイルに変換します):
SautinSoft.PdfFocus f = new SautinSoft.PdfFocus();
string[] pdfFiles = Directory.GetFiles(@"d:\Folder with 1000 pdfs\", "*.pdf");
string folderWithTiffs = @"d:\Folder with TIFFs\";
foreach (string pdffile in pdfFiles)
{
f.OpenPdf(pdffile);
if (f.PageCount > 0)
{
//save all pages to tiff files with 300 dpi
f.ToImage(folderWithTiffs, Path.GetFileNameWithoutExtension(pdffile), System.Drawing.Imaging.ImageFormat.Tiff, 300);
}
f.ClosePdf();
}
https://pypi.org/project/pdf2tiff/
Pdf2ps、ps2imageを使用して、結果の画像から他のユーティリティでtiffに変換することもできます(「paul」[paul-さらに別の画像ビューア(PNG、TIFF、GIF、JPGなどを表示)を覚えています)
免責事項:私が推奨している製品の仕事
Atalasoftには、 convert PDF to TIFF -FOXITのパートナーであるため、PDFレンダリング非常に良いです。
PDFTIFF.comを convert PDF to TIFF にすると、無制限のページを処理できます