web-dev-qa-db-ja.com

GoogleドライブのPDFのコンテンツが検索用にインデックス付けされるタイミングを知る方法

200個のPDFファイル(数分前にGoogleドライブにアップロード)のファイルIDと、それらのIDを持つGoogleシートのsetValueを取得できるNiceルーチンを作成しました。

正しいファイルIDを取得するために、PDFのコンテンツを検索します。

問題は、200のPDFをアップロードしてから5分後にコンテンツが検索可能になる日もあれば、最大7時間かかる日もあるということです。

インデックスのステータスを追跡する方法はありますか?

ドライブ上の特定のフォルダーを優先的にインデックス付けする方法はありますか?

6
user68137

インデックスのステータスを追跡する方法はありますか?

ファイルにインデックスが付けられているかどうかを確認するには、 Google Drive REST AP​​I のgetメソッドを使用してcontentHints.indexableTextプロパティを確認します。

ドライブ上の特定のフォルダーを優先的にインデックス付けする方法はありますか?

AFAIK Google Driveには、エンドユーザーが特定のフォルダーを優先的にインデックス付けする方法は含まれていません。

他のファイルシステムとは異なり、GoogleドライブのフォルダーはGoogleのサーバー上のファイルの物理的な場所とは関係なく、ユーザーがファイルのほとんどを理解できる方法で整理できるようにするための手段にすぎません。

参照資料

引用

から https://developers.google.com/drive/v3/web/file#saving_indexable_text

インデックス可能なテキストを保存する

ドライブは、ファイルの種類を認識すると、検索用のドキュメントに自動的にインデックスを付けます。これには、テキストドキュメント、PDF、テキスト付き画像、およびその他の一般的な種類が含まれます。アプリが他の種類のファイル(図面、ビデオ、ショートカット)を保存する場合、インデックス付け可能なテキストを提供することにより、発見しやすくすることができます。

索引付け可能なテキストは、HTMLとして索引付けされます。インデックス可能なテキスト文字列Here's some textを保存すると、「Here's some text」はインデックス化されますが、「value1」はインデックス化されません。このため、XMLをインデックス可能なテキストとして保存することは、HTMLを保存するほど有用ではありません。また、留意してください:

ContentHints.indexableTextのサイズ制限は128Kです。重要度の順にテキストをソートしようとしないでください。インデクサーはそれを非常に効率的に行います。インデックス可能なテキストは、保存するたびにアプリケーションで更新する必要があります。テキストがファイルのコンテンツに関連していることを確認してください。この最後の点は明白に思えるかもしれませんが、非常に重要です。よく検索する用語を追加して、ファイルを検索結果に表示しようとすることはお勧めできません。これはユーザーを苛立たせることができ、ファイルを削除するように動機付けることさえできます。

2
Rubén