WebサイトでPDFのキーワードを設定し、検索エンジンを使用してPDFを内部で検索する

Question

ですから、仕事の経験上、いくつかのことをするように命じられました。現在、会社のWebサイトにPDFがアップロードされています。これらはトラブルシューティングであり、技術/リリースドキュメントはフォーカスの主なトピック（「Building a Query」など）でタイトルが付けられています。ただし、これらのドキュメントは、「Running aクエリ」。

私のタスクは次のとおりです。

各PDFで扱われているトピックで構成されるキーワードまたはタグをこれらのPDFに追加します。
ユーザーが「x」を検索して、「x」に言及しているすべてのPDFを表示できる、何らかの検索エンジンまたは類似のユーティリティを追加します。

私はゼロから始めているので、どんなアイデアでも大歓迎です。

WebStudio · Answer

ゼロから始める場合、Wordpressには、すぐに起動して実行できる多くのプラグインがあります...ここにPDF検索用のプラグインがあります https：// searchwp.com

このプラグインは使用していませんが、必要な機能があるようです。

wordpressを初めて使用する場合は、少し学習曲線をたどることができますが、そこには多くのリソースがあり、themeforest.netのような場所からいくつかの素晴らしいテーマを入手できます。

それが役立つことを願っています;）

Mousey · Answer

Googleでは、1つのWebサイトのみの検索を作成することもできます。たとえば、検索を表示するハイパーリンク（リンク）をドキュメントに作成できます。

https://www.google.com/advanced_search?q=site:stackexchange.com+filetype:pdf&lr=&hl=en&as_qdr=all

また、Googleはカスタム検索エンジンを提供します。これは、会社のWebサイトに追加する少量のコードを含むため、非常に簡単です。

これにより、Googleの[高度な検索]ボックスが表示され、ウェブサイトがstackexchange.comに設定され、ファイルの種類がpdfに設定されます。 Adobe.comは、pdfファイルを作成するAdobe Acrobatの作成者であるため、より多くの情報を提供する場合もあります。 Adobe Acrobat（リーダーではなくフルバージョン）では、各ファイルのプロパティとキーワードを設定できます。他のPDFライターでも同じことができます。

PDFが編集可能なテキストではなく、タイプライターで書かれたドキュメント（または印刷物の明らかな写真）のスキャン画像である場合、ソフトウェアで光学文字認識（OCR）スキャンを使用して、テキストを電子的に認識して検索できるようにします。