web-dev-qa-db-ja.com

PDFファイルからテキストをコピーできません

私はfoxit PDFリーダーを使用してテキストブックを表示しています。PDFファイルからWord文書にテキストをコピーしたいのですが、許可されません。テキストを細かく選択できますしかし、テキストをコピーするオプションは利用できません。他のドキュメントからテキストをコピーできますが、一部のドキュメントはコピーできません。Windowsでこの保護を回避する方法はありますか?

42
Jonno_FTW

PDFファイルはおそらくテキストのコピーに対してロックされています。ロックを解除するには、次の2つの方法があります。

  1. PDFが印刷に対してロックされていない場合は、仮想PDFプリンターに印刷して、ロックされていないファイルを作成できます。これを見てください:
    "パスワードを削除して保護を解除PDFシークレットを知らずに印刷することを許可したもの"
  2. 印刷機能がロックアウトされている場合は、これを参照してください:
    "制限を解除し、保護されたパスワードを復号化するPDFファイルPDF Unlocker"
30
harrymc
  1. Google ChromeでPDFを開きます(ドラッグアンドドロップPDFファイルをChromeに))。
  2. 特定のページをPDFとして印刷するか、単に印刷プレビューを開きます。
  3. これで、印刷プレビューまたは出力PDFからテキストをコピーできます。しかし、テーブルを直接コピーできるとは思いません。
25
Khaleel

私はあなたのPDF Ghostscript を使用してファイルのWindowsで利用可能)のDRMフリーバージョンを作成することができました。

gs -q -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=stripped.pdf VassilakisP2001Dissertation.pdf

結果のファイルstripped.pdfはAdobe Readerにロードできます。Readerを使用すると、好きなようにコピーできます。また、テーブルのフォーマットのほとんどが保持されます。

12
Michael Hampton

Okular(Linuxの場合、KDEの一部)を使用して、PDFファイルからテーブルを正常にコピーできました。これを行うには、Okularの設定に移動し、[Obey DRM制限をオフにする必要がありました。 」

あなたがWindowsを実行しているのでこれは実際にはあまり役に立たないことを私は知っていますが、Linuxマシンが手元にあるか、それをインストールする意思がある場合は可能性があります。

残念ながらそれはフォーマットされていないプレーンテキストでしたが、テーブルを再作成することはそれほど難しくないはずです。私のコピーアンドペーストアドベンチャーの結果を見ることができます ここ

2
Michael Hampton

GT Textは、画像(pdfスナップショット=画像)をテキストに変換するプログラムです。エリアを選択してクリップボードにコピーできます無料です

公式ホームページは http://gttext.googlecode.com です。

1
David

コピーが灰色になっている場合、疑わしいため、PDFは「ロック」されています。読み取ることはできますが、コピー/貼り付けはできません。

このWebサイトはPDFのロックを解除します

https://smallpdf.com/unlock-pdf

1
barlop

別の可能性は Evince です。

Windowsの場合 、デフォルトでコピーをサポートしているようです。

Linuxでは、override_restrictionsの設定を確認していない場合は これらの指示dconf-editor/org/gnome/evinceoverride_restrictions)に従って、コピーを有効にできます。

0
endolith

これはなんとか基本テキストを変換しました。それはテーブルと苦労しました。

http://www.onlineocr.net/documents

0
Rob Sedgwick

短いスニペットを探しているだけの場合は、Googleに引用符の内側にいくつかの単語を入力すると、他の形式でスキャンされた、または他の人が入力した正確な引用を見つけることができます。

別のオプションは、Googleドキュメントの「写真からのドキュメント」Androidアプリで、OCRを介してテキストを挿入します。これはもちろんエラーが発生しやすくなります。

PDFロック機能が存在しないことを望みます。:(

0
endolith

エンドリスへの回答:

あなたのPDFはコピーから保護されていますが、印刷からは保護されていません。

だから私はテーブル6.15を含む1つのページを別のPDFにコピーされないように印刷し、テーブルを選択してコピーしてからWordに貼り付けました。驚いたことに、貼り付けの結果全くのごみだった。

私はこのテーブルをさらに調べて、非常に驚​​くべき結果を見つけました:これはテーブルではありません!

これは実際には、テキストの小さな断片のモンタージュであり、テーブルのように見えるようにページに配置されます。しかし、これは実際のテーブルではありません。

最善の方法は、全体をテーブルとして書き直すか、このテーブルのように組み立てられたテキストのスクリーンショットを作業で使用することです。

これが、私の 生成された1ページのpdf文書 から取得した表のスクリーンショットです。

image

0
harrymc