web-dev-qa-db-ja.com

WebサイトでPDFのキーワードを設定し、検索エンジンを使用してPDFを内部で検索する

ですから、仕事の経験上、いくつかのことをするように命じられました。現在、会社のWebサイトにPDFがアップロードされています。これらはトラブルシューティングであり、技術/リリースドキュメントはフォーカスの主なトピック(「Building a Query」など)でタイトルが付けられています。ただし、これらのドキュメントは、「Running aクエリ」。

私のタスクは次のとおりです。

  1. 各PDFで扱われているトピックで構成されるキーワードまたはタグをこれらのPDFに追加します。
  2. ユーザーが「x」を検索して、「x」に言及しているすべてのPDFを表示できる、何らかの検索エンジンまたは類似のユーティリティを追加します。

私はゼロから始めているので、どんなアイデアでも大歓迎です。

2
Ross Massie

ゼロから始める場合、Wordpressには、すぐに起動して実行できる多くのプラグインがあります...ここにPDF検索用のプラグインがあります https:// searchwp.com

このプラグインは使用していませんが、必要な機能があるようです。

wordpressを初めて使用する場合は、少し学習曲線をたどることができますが、そこには多くのリソースがあり、themeforest.netのような場所からいくつかの素晴らしいテーマを入手できます。

それが役立つことを願っています;)

1
WebStudio

Googleでは、1つのWebサイトのみの検索を作成することもできます。たとえば、検索を表示するハイパーリンク(リンク)をドキュメントに作成できます。

https://www.google.com/advanced_search?q=site:stackexchange.com+filetype:pdf&lr=&hl=en&as_qdr=all

また、Googleは カスタム検索エンジン を提供します。これは、会社のWebサイトに追加する少量のコードを含むため、非常に簡単です。

これにより、Googleの[高度な検索]ボックスが表示され、ウェブサイトがstackexchange.comに設定され、ファイルの種類がpdfに設定されます。 Adobe.comは、pdfファイルを作成するAdobe Acrobatの作成者であるため、より多くの情報を提供する場合もあります。 Adobe Acrobat(リーダーではなくフルバージョン)では、各ファイルのプロパティとキーワードを設定できます。他のPDFライターでも同じことができます。

PDFが編集可能なテキストではなく、タイプライターで書かれたドキュメント(または印刷物の明らかな写真)のスキャン画像である場合、ソフトウェアで光学文字認識(OCR)スキャンを使用して、テキストを電子的に認識して検索できるようにします。

0
Mousey