web-dev-qa-db-ja.com

postgresのSeq ScanとBitmap heap scanの違いは何ですか?

Explainコマンドの出力で、「Seq Scan」と「Bitmap heap Scan」という2つの用語が見つかりました。これらの2種類のスキャンの違いは何ですか? (私はPostgreSqlを使用しています)

49
Sunil

http://www.postgresql.org/docs/8.2/static/using-explain.html

基本的に、順次スキャンは実際の行に行き、行1から読み取りを開始し、クエリが満たされるまで続行します(これは、制限の場合など、テーブル全体ではない場合があります)。

ビットマップヒープスキャンは、PostgreSQLがフェッチする行の小さなサブセットを(たとえば、インデックスから)検出し、それらの行のみをフェッチすることを意味します。もちろん、これはシークがはるかに多くなるため、行の小さなサブセットが必要な場合にのみ高速になります。

例を挙げましょう:

create table test (a int primary key, b int unique, c int);
insert into test values (1,1,1), (2,2,2), (3,3,3), (4,4,4), (5,5,5);

これで、seqスキャンを簡単に取得できます。

explain select * from test where a != 4

                       QUERY PLAN                        
---------------------------------------------------------
 Seq Scan on test  (cost=0.00..34.25 rows=1930 width=12)
   Filter: (a <> 4)

テーブルの大部分を取得する予定であるため、順次スキャンを実行しました。 (大きなシークレスな読み取りの代わりに)それを実行しようとするのはばかげたことでしょう。

これで、インデックスを使用できます。

explain select * from test where a = 4 ;
                              QUERY PLAN                              
----------------------------------------------------------------------
 Index Scan using test_pkey on test  (cost=0.00..8.27 rows=1 width=4)
   Index Cond: (a = 4)

そして最後に、いくつかのビットマップ操作を取得できます。

explain select * from test where a = 4 or a = 3;
                                  QUERY PLAN                                  
------------------------------------------------------------------------------
 Bitmap Heap Scan on test  (cost=8.52..13.86 rows=2 width=12)
   Recheck Cond: ((a = 4) OR (a = 3))
   ->  BitmapOr  (cost=8.52..8.52 rows=2 width=0)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 4)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 3)

これは次のように読むことができます。

  1. A = 4に必要な行のビットマップを作成します。 (ビットマップインデックススキャン)
  2. A = 3に必要な行のビットマップを作成します。 (ビットマップインデックススキャン)
  3. または、2つのビットマップを一緒に(BitmapOr)
  4. これらの行をテーブル(ビットマップヒープスキャン)で調べ、a = 4またはa = 3であることを確認します(condを再確認します)

[はい、これらのクエリプランは愚かですが、それはtestを分析できなかったためです。分析した場合、5つの小さな行があるため、すべて順次スキャンになります]

69
derobert