Apache Solrでは、両方が目的を解決する場合、なぜテキストフィールドよりも文字列フィールドを優先する必要があるのですか?
文字列またはテキストは、インデックスサイズ、インデックス読み取り、インデックス作成などのパラメータにどのように影響しますか?
Solrスキーマで定義されているデフォルトのフィールドは大きく異なります。
String
は、トークン化などを実行せずにWord/Sentenceを正確な文字列として保存します。ファセットなど、完全一致を保存するのに一般的に役立ちます。
Text
は通常、トークン化と2次処理(下位のケースなど)を実行します。文の一部を一致させたいすべてのシナリオに役立ちます。
次のサンプル"This is a sample sentence"
が両方のフィールドにインデックス付けされている場合、string
フィールドからヒットを取得するには、テキストThis is a sample sentence
を正確に検索する必要がありますが、sample
(またはさらにsamples
text
フィールドからヒットを取得するためにステム化が有効になっています)。