web-dev-qa-db-ja.com

STATS_STREAMまたはWITH FULLSCANを使用して統計を更新しますか?

creating statistics の構文は次のとおりです。

_-- Syntax for SQL Server and Azure SQL Database  

UPDATE STATISTICS table_or_indexed_view_name   
    [   
        {   
            { index_or_statistics__name }  
          | ( { index_or_statistics_name } [ ,...n ] )   
                }  
    ]   
    [    WITH   
        [  
            FULLSCAN   
              [ [ , ] PERSIST_SAMPLE_PERCENT = { ON | OFF } ]    
            | SAMPLE number { PERCENT | ROWS }   
              [ [ , ] PERSIST_SAMPLE_PERCENT = { ON | OFF } ]    
            | RESAMPLE   
              [ ON PARTITIONS ( { <partition_number> | <range> } [, ...n] ) ]  
            | <update_stats_stream_option> [ ,...n ]  
        ]   
        [ [ , ] [ ALL | COLUMNS | INDEX ]   
        [ [ , ] NORECOMPUTE ]   
        [ [ , ] INCREMENTAL = { ON | OFF } ] 
        [ [ , ] MAXDOP = max_degree_of_parallelism ] 
    ] ;  

<update_stats_stream_option> ::=  
    [ STATS_STREAM = stats_stream ]  
    [ ROWCOUNT = numeric_constant ]  
    [ PAGECOUNT = numeric_contant ]
_

こちら 統計をスクリプト化する Martin Smith による優れたスクリプトがありますSTATS_STREAM

スクリプトをテストデータベースの1つで実行すると、次のようになります。

_DECLARE @Schema             sysname,
        @Table              sysname,
        @StatsName          sysname,
        @IncludeStatsStream BIT,
        @StatsStream        VARCHAR(MAX),
        @TwoPartQuotedName  NVARCHAR(500);

select  @Schema           = 'dbo',
        @Table            = 'tbl_Application_Medical',
        @StatsName        = '_WA_Sys_00000002_7039AB57',
        @IncludeStatsStream = 1;

select @TwoPartQuotedName = QUOTENAME(@Schema) + '.' + QUOTENAME(@Table);


IF @IncludeStatsStream = 1 AND @@MICROSOFTVERSION/ POWER(2,24) > 9
  BEGIN
      DECLARE @StatsResults TABLE
        (
           StatsStream VARBINARY(MAX),
           Rows        BIGINT,
           DataPages   BIGINT
        );

      INSERT INTO @StatsResults
      EXEC sys.sp_executesql 
        N'DBCC SHOW_STATISTICS(@TwoPartQuotedName, @StatsName) WITH STATS_STREAM;',
        N'@TwoPartQuotedName NVARCHAR(500), @StatsName sysname',
        @TwoPartQuotedName = @TwoPartQuotedName,
        @StatsName = @StatsName;

      --Would need some other method on 2005 hence just skipping this
      SELECT @StatsStream = CONVERT(VARCHAR(MAX), StatsStream, 1)
      FROM   @StatsResults;
  END;

WITH stats AS
(
/* 
Support earlier versions without these columns using trick from http://dba.stackexchange.com/a/66755/3690 */
SELECT x.*
FROM (SELECT NULL AS filter_definition, NULL AS is_incremental) AS dummy
CROSS APPLY
(
  SELECT object_id, stats_id, name, no_recompute, filter_definition, is_incremental
  FROM sys.stats
) AS x
)
SELECT '
CREATE STATISTICS ' + QUOTENAME(name) + '   
ON ' + @TwoPartQuotedName + ' (' + SUBSTRING(cols, 2, 10000000) +')
'  + 
ISNULL(' WHERE ' + filter_definition,'') +
ISNULL(STUFF ( 
    ISNULL(',STATS_STREAM = ' + @StatsStream, '') +
    CASE WHEN no_recompute = 1 THEN ',NORECOMPUTE' ELSE '' END + 
    CASE WHEN is_incremental = 1 THEN ',INCREMENTAL=ON' ELSE '' END
 , 1 , 1 ,  ' WITH '  ) , '') AS [processing-instruction(x)]
FROM   stats s
       CROSS APPLY (SELECT ',' + QUOTENAME(c.name)
                    FROM   sys.stats_columns sc
                           JOIN sys.columns c
                             ON c.object_id = sc.object_id
                                AND c.column_id = sc.column_id
                    WHERE  sc.object_id = s.object_id
                           AND sc.stats_id = s.stats_id
                    ORDER  BY sc.stats_column_id
                    FOR XML PATH(''))CA(cols)
WHERE  s.object_id = OBJECT_ID(@TwoPartQuotedName)
       AND s.name = @StatsName
FOR XML PATH('');

select * from @StatsResults
_

xmlファイル:

<?x CREATE STATISTICS [_WA_Sys_00000002_7039AB57] ON [dbo].[tbl_Application_Medical] ([Smoker]) WITH STATS_STREAM = lot of binary chars that would not fit here?>

enter image description here

いつ すべてのデータベースの統計を更新するサーバー内のすべてのテーブル は、 create statistics _WITH FULLSCAN_の代わりにstats_screamを使用したスクリプト

これら2つの違いは何ですか?

3

他の答え は正しいので、例で物事がより明確になるように...

CREATE TABLE T1
(
C1 VARCHAR(50),
INDEX CIX CLUSTERED(C1)
);

INSERT INTO T1
VALUES ('orange'), ('kiwi'), ('strawberry');


UPDATE STATISTICS [dbo].[T1]([CIX]) 
WITH STATS_STREAM = 0x01000000010000000000000000000000368684C40000000051020000000000001102000000000000A7020000A7000000320000000000000008D000000000000007000000009BA10039AA000003000000000000000300000000000000000000000000003F000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000002000000020000000100000010000000ABAAAA400000404000000000ABAAAA4000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001304000000000000000000000000000049000000000000008D0000000000000095000000000000009D0000000000000010000000000000002C000000000000003000100000000040000000000000803F04000001001C006170706C65300010000000803F000000000000803F04000001001D0062616E616E61FF01000000000000000300000002000000280000002800000000000000000000000B0000006170706C6562616E616E61030000004000000000820500000001060500000003000000000000000000000000000000, 
ROWCOUNT = 3, PAGECOUNT = 1

DBCC SHOW_STATISTICS ( T1 , CIX )  WITH HISTOGRAM;   

統計は完全に架空のものであり、表の内容とは関係ありません。 STATS_STREAMにエンコードされたヒストグラムを使用するだけです

+--------------+------------+---------+---------------------+----------------+
| RANGE_HI_KEY | RANGE_ROWS | EQ_ROWS | DISTINCT_RANGE_ROWS | AVG_RANGE_ROWS |
+--------------+------------+---------+---------------------+----------------+
| Apple        |          0 |       2 |                   0 |              1 |
| banana       |          0 |       1 |                   0 |              1 |
+--------------+------------+---------+---------------------+----------------+

だが

UPDATE STATISTICS [dbo].[T1]([CIX]) 
WITH FULLSCAN 

DBCC SHOW_STATISTICS ( T1 , CIX )    WITH HISTOGRAM; 

すべてのベーステーブル行をスキャンし、正しい値で新しいヒストグラムを作成します

+--------------+------------+---------+---------------------+----------------+
| RANGE_HI_KEY | RANGE_ROWS | EQ_ROWS | DISTINCT_RANGE_ROWS | AVG_RANGE_ROWS |
+--------------+------------+---------+---------------------+----------------+
| kiwi         |          0 |       1 |                   0 |              1 |
| orange       |          0 |       1 |                   0 |              1 |
| strawberry   |          0 |       1 |                   0 |              1 |
+--------------+------------+---------+---------------------+----------------+

STATS_STREAMオプションはデバッグにのみ役立ちます。データをコピーする必要なく、本番環境から開発インスタンスにヒストグラムをコピーできます。これは、クエリプランの問題を評価するときに役立ちます。

3
Martin Smith

STATS_STREAMでコマンドを使用すると、一部の統計の正確なコピーを作成できます。トラブルシューティングやテストの目的で、別のテーブルや別のデータベースでクエリオプティマイザーの動作を繰り返す場合に非常に役立ちます。

オプションに関するすばらしい記事: Custom Built Statistics

コマンド 'WITH FULLSCAN'を使用すると、テーブルのすべての行をスキャンしてクエリ最適化統計を更新するだけです。

BOLから:

[〜#〜]フルスキャン[〜#〜]

テーブルまたはインデックス付きビューのすべての行をスキャンして統計を計算します。 FULLSCANとSAMPLE 100 PERCENTは同じ結果になります。 FULLSCANは、SAMPLEオプションと一緒に使用することはできません。

4
Denis Rubashkin