この質問 に触発されて、私はこれを好奇心から求めています。
わかっています 8000バイトを超えるVARCHAR(MAX)
値は、行ではなく個別のLOBページに格納されます。その後、そのような値を持つ行を取得するには、2つ以上の論理IO演算が必要です(基本的に、理論上必要な場合よりも1つ多い)。
リンクされた質問で示されているように、VARCHAR(MAX)
列をINCLUDE
dとして一意のインデックスに追加できます。この列の長さが8000バイトを超える場合、そのような値は引き続きインデックスリーフページに「インライン」で格納されますか、それともLOBページに移動されますか?
8000バイトを超える値は「インライン」で格納できません。それらはLOBページに保管されます。これは sys.dm_db_index_physical_stats で確認できます。簡単な表から始めます。
_USE tempdb;
DROP TABLE IF EXISTS #LOB_FOR_ME;
CREATE TABLE #LOB_FOR_ME (
ID BIGINT,
MAX_VERNON_WAS_HERE VARCHAR(MAX)
);
CREATE INDEX IX ON #LOB_FOR_ME (ID) INCLUDE (MAX_VERNON_WAS_HERE);
_
次に、VARCHAR(MAX)
列に8000バイトの値を持つ行をいくつか挿入し、DMFをチェックアウトします。
_USE tempdb;
INSERT INTO #LOB_FOR_ME
SELECT 1, REPLICATE('Z', 8000)
FROM master..spt_values;
SELECT index_level, index_type_desc, alloc_unit_type_desc, page_count, record_count
FROM sys.dm_db_index_physical_stats(DB_ID(), OBJECT_ID('#LOB_FOR_ME'), 2, NULL , 'DETAILED');
_
インデックスにLOBページがありません:
_╔═════════════╦════════════════════╦══════════════════════╦════════════╦══════════════╗
║ index_level ║ index_type_desc ║ alloc_unit_type_desc ║ page_count ║ record_count ║
╠═════════════╬════════════════════╬══════════════════════╬════════════╬══════════════╣
║ 0 ║ NONCLUSTERED INDEX ║ IN_ROW_DATA ║ 2540 ║ 2540 ║
║ 1 ║ NONCLUSTERED INDEX ║ IN_ROW_DATA ║ 18 ║ 2540 ║
║ 2 ║ NONCLUSTERED INDEX ║ IN_ROW_DATA ║ 1 ║ 18 ║
╚═════════════╩════════════════════╩══════════════════════╩════════════╩══════════════╝
_
しかし、8001バイトの値を持つ行を追加すると、次のようになります。
_USE tempdb;
INSERT INTO #LOB_FOR_ME
SELECT 2, REPLICATE(CAST('Z' AS VARCHAR(MAX)), 8001)
FROM master..spt_values;
SELECT index_level, index_type_desc, alloc_unit_type_desc, page_count, record_count
FROM sys.dm_db_index_physical_stats(DB_ID(), OBJECT_ID('#LOB_FOR_ME'), 2, NULL , 'DETAILED');
_
これで、挿入したばかりのすべての行のインデックスに1つのLOBページがあります。
_╔═════════════╦════════════════════╦══════════════════════╦════════════╦══════════════╗
║ index_level ║ index_type_desc ║ alloc_unit_type_desc ║ page_count ║ record_count ║
╠═════════════╬════════════════════╬══════════════════════╬════════════╬══════════════╣
║ 0 ║ NONCLUSTERED INDEX ║ IN_ROW_DATA ║ 2556 ║ 5080 ║
║ 1 ║ NONCLUSTERED INDEX ║ IN_ROW_DATA ║ 18 ║ 2556 ║
║ 2 ║ NONCLUSTERED INDEX ║ IN_ROW_DATA ║ 1 ║ 18 ║
║ 0 ║ NONCLUSTERED INDEX ║ LOB_DATA ║ 2540 ║ 2540 ║
╚═════════════╩════════════════════╩══════════════════════╩════════════╩══════════════╝
_
_SET STATISTICS IO ON;
_と適切なクエリでこれを確認することもできます。 8000バイトの行のみを調べる次のクエリを考えてみます。
_SELECT SUM(LEN(MAX_VERNON_WAS_HERE))
FROM #LOB_FOR_ME
WHERE ID = 1;
_
実行時の結果:
スキャンカウント1、論理読み取り2560、物理読み取り0、先読み読み取り0、LOB論理読み取り0、LOB物理読み取り0、LOB先読み読み取り0。
代わりに8001バイトの行をクエリすると:
_SELECT SUM(LEN(MAX_VERNON_WAS_HERE))
FROM #LOB_FOR_ME
WHERE ID = 2;
_
今、私はロブの読み取りを見る:
スキャンカウント1、論理読み取り20、物理読み取り0、先読み読み取り0、LOB論理読み取り5080、LOB物理読み取り0、LOB先読み読み取り0。