以下にコードサンプルを示します。
CREATE TABLE #titles(
title_id varchar(20),
title varchar(80) NOT NULL,
type char(12) NOT NULL,
pub_id char(4) NULL,
price money NULL,
advance money NULL,
royalty int NULL,
ytd_sales int NULL,
notes varchar(200) NULL,
pubdate datetime NOT NULL
)
GO
insert #titles values ('1', 'Secrets', 'popular_comp', '1389', $20.00, $8000.00, 10, 4095,'Note 1','06/12/94')
insert #titles values ('2', 'The', 'business', '1389', $19.99, $5000.00, 10, 4095,'Note 2','06/12/91')
insert #titles values ('3', 'Emotional', 'psychology', '0736', $7.99, $4000.00, 10, 3336,'Note 3','06/12/91')
insert #titles values ('4', 'Prolonged', 'psychology', '0736', $19.99, $2000.00, 10, 4072,'Note 4','06/12/91')
insert #titles values ('5', 'With', 'business', '1389', $11.95, $5000.00, 10, 3876,'Note 5','06/09/91')
insert #titles values ('6', 'Valley', 'mod_cook', '0877', $19.99, $0.00, 12, 2032,'Note 6','06/09/91')
insert #titles values ('7', 'Any?', 'trad_cook', '0877', $14.99, $8000.00, 10, 4095,'Note 7','06/12/91')
insert #titles values ('8', 'Fifty', 'trad_cook', '0877', $11.95, $4000.00, 14, 1509,'Note 8','06/12/91')
GO
CREATE TABLE #sales(
stor_id char(4) NOT NULL,
ord_num varchar(20) NOT NULL,
ord_date datetime NOT NULL,
qty smallint NOT NULL,
payterms varchar(12) NOT NULL,
title_id varchar(80)
)
GO
insert #sales values('1', 'QA7442.3', '09/13/94', 75, 'ON Billing','1')
insert #sales values('2', 'D4482', '09/14/94', 10, 'Net 60', '1')
insert #sales values('3', 'N914008', '09/14/94', 20, 'Net 30', '2')
insert #sales values('4', 'N914014', '09/14/94', 25, 'Net 30', '3')
insert #sales values('5', '423LL922', '09/14/94', 15, 'ON Billing','3')
insert #sales values('6', '423LL930', '09/14/94', 10, 'ON Billing','2')
SELECT title, price
FROM #titles
WHERE EXISTS
(SELECT *
FROM #sales
WHERE #sales.title_id = #titles.title_id
AND qty >30)
SELECT t.title, t.price
FROM #titles t
inner join #sales s on t.title_id = s.title_id
where s.qty >30
同じ結果をもたらす上記2つのクエリの違いは何ですか?また、EXISTSキーワードの目的と正確に使用する場所を知りたいですか?
EXISTS
はブール値を返すために使用され、JOIN
は他のテーブル全体を返します
EXISTS
は、サブクエリが結果を返すかどうかをテストするためにのみ使用され、すぐに短絡します。 JOIN
は、リレーションが存在する別のテーブルの追加フィールドと組み合わせて結果セットを拡張するために使用されます。
あなたの例では、クエリはシンボリックに同等です。
一般に、次の場合にEXISTS
を使用します。
JOIN
が行を重複させる可能性があります)LEFT OUTER JOIN...NULL
条件の代わりに使用)適切なインデックスがある場合、ほとんどの場合、EXISTS
はJOIN
と同じように動作します。例外は非常に複雑なサブクエリです。通常、EXISTS
を使用した方が高速です。
JOIN
キーにインデックスが付けられていない場合は、EXISTS
を使用した方が高速かもしれませんが、特定の状況をテストする必要があります。
JOIN
構文は読みやすく、通常どおり明確になります。
したがって、3行と5行が一致します
結果は、他の人が言及した「短絡」効果であり、JOINでDISTINCTを使用する必要はありません。 EXISTSは、1:n関係のn側に行の存在を探す場合、ほとんど常に高速です。
EXISTS
は、主にショートカットに使用されます。基本的にオプティマイザーは条件が真になるとすぐに救済されるため、テーブル全体をスキャンする必要はないかもしれません(SQL Serverの最新バージョンでは、この最適化はIN()
でも発生しますが、そうではありませんでした常に真実)。この動作はクエリごとに異なる可能性があり、場合によっては、結合によってオプティマイザが実際にジョブを実行する機会が増えることがあります。だから、「これはEXISTS
を使用すべきときであり、そうすべきではないとき」と言うのは難しいと思います。
とはいえ、この場合、テーブル間は本質的に1対1で一致するため、パフォーマンスの違いはほとんど見られず、オプティマイザーは同様の、または同一のプランを作成する可能性があります。各タイトルに50,000行を追加するときに、salesテーブルでjoin/existsを比較すると、何か異なるものが表示される場合があります(重複、集計、あなたが持っているものを削除するために結合クエリを変更する必要はありません)。
他の行と相互作用する方法に基づいて除外したい行がある場合、existが最も有用であることがわかります。
例えば、
SELECT *
FROM TABLE a
WHERE a.val IN (1,2,3)
AND NOT EXISTS(SELECT NULL
FROM TABLE b
WHERE b.id = a.id
AND b.val NOT IN (1, 2, 3))
この場合、同じIDを持つが無効なa
レコードを持つことに基づいて、b
クエリの行を除外しています。
これは、実際には 私が職場で抱えていた生産上の問題 に由来しています。クエリは、アプリケーションではなくクエリの除外ロジックのほとんどを移動し、ロード時間を24秒以上から2秒未満に短縮しました。 :-)