web-dev-qa-db-ja.com

SolrスキーマのomitNormsおよびバージョンフィールドとは何ですか?

OmitNorms = "true"を使用するタイミングがわかりません。 2、3個のリンクを読みましたが、意味がわかりません。 「このフィールドに関連付けられている基準を省略するにはtrueに設定します(これにより、フィールドの長さの正規化とインデックス時間のブーストが無効になり、メモリが節約されます。フルテキストフィールドまたはインデックス時間のブーストが必要なフィールドのみ)規範が必要です。」 http://wiki.Apache.org/solr/SchemaXml ページ

20
Kamal Kishore

規範は、フィールドごと、ドキュメントごとに、インデックスにシングルバイト情報として格納されます。これは、フィールドに適用されるインデックスタイムブーストの情報または長さ情報を保持します。
長さ情報を使用すると、短いフィールドを長いフィールドよりもブーストできます。
また、インデックスタイムブーストでは、1つのフィールドを他のフィールドよりも高くブーストできます。

スペースを使用するため、必要がなければオフにしてください。
インデックスタイムブーストが使用されない場合ORフィールドが短いテキストフィールドまたは長さの正規化を必要としない非テキストフィールドの場合。

あなたは少し詳細な説明を見つけることができます ここ

ノルムがIndexReaderに読み込まれると、各フィールドのbyte [maxdoc]配列に読み込まれます。したがって、4億人に1つのドキュメントにフィールドがある場合でも、そのフィールドのbyte [maxdoc]が読み込まれます。大量のRAMを使用する可能性があります。


RAMが話している量の例として、1000万のドキュメントインデックスの1つのフィールドは10 MB未満のRAMを使用します。そのような100のフィールドはほぼ1ギガバイトのRAMを使用します。

25
Jayendra