T-SQL
の領域でプログラミングタスクを取得しました。
タスク:
質問:この問題を解決する最も効率的な方法は何ですか?ループが正しい場合、改善の余地はありますか?
私はループと#一時テーブルを使用しました、ここで私の解決策:
set rowcount 0
-- THE SOURCE TABLE "LINE" HAS THE SAME SCHEMA AS #RESULT AND #TEMP
use Northwind
go
declare @sum int
declare @curr int
set @sum = 0
declare @id int
IF OBJECT_ID('tempdb..#temp','u') IS NOT NULL
DROP TABLE #temp
IF OBJECT_ID('tempdb..#result','u') IS NOT NULL
DROP TABLE #result
create table #result(
id int not null,
[name] varchar(255) not null,
weight int not null,
turn int not null
)
create table #temp(
id int not null,
[name] varchar(255) not null,
weight int not null,
turn int not null
)
INSERT into #temp SELECT * FROM line order by turn
WHILE EXISTS (SELECT 1 FROM #temp)
BEGIN
-- Get the top record
SELECT TOP 1 @curr = r.weight FROM #temp r order by turn
SELECT TOP 1 @id = r.id FROM #temp r order by turn
--print @curr
print @sum
IF(@sum + @curr <= 1000)
BEGIN
print 'entering........ again'
--print @curr
set @sum = @sum + @curr
--print @sum
INSERT INTO #result SELECT * FROM #temp where [id] = @id --id, [name], turn
DELETE FROM #temp WHERE id = @id
END
ELSE
BEGIN
print 'breaaaking.-----'
BREAK
END
END
SELECT TOP 1 [name] FROM #result r order by r.turn desc
ここでは、テストにNorthwindを使用したテーブルの作成スクリプトを示します。
USE [Northwind]
GO
/****** Object: Table [dbo].[line] Script Date: 28.05.2018 21:56:18 ******/
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE TABLE [dbo].[line](
[id] [int] NOT NULL,
[name] [varchar](255) NOT NULL,
[weight] [int] NOT NULL,
[turn] [int] NOT NULL,
PRIMARY KEY CLUSTERED
(
[id] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY],
UNIQUE NONCLUSTERED
(
[turn] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
) ON [PRIMARY]
GO
ALTER TABLE [dbo].[line] WITH CHECK ADD CHECK (([weight]>(0)))
GO
INSERT INTO [dbo].[line]
([id], [name], [weight], [turn])
VALUES
(5, 'gary', 800, 1),
(3, 'jo', 350, 2),
(6, 'thomas', 400, 3),
(2, 'will', 200, 4),
(4, 'mark', 175, 5),
(1, 'james', 100, 6)
;
一般的にループを回避するようにしてください。これらは通常、セットベースのソリューションよりも効率が悪く、読みにくくなります。
以下はかなり効率的です。
キールックアップを回避するために、名前と重みの列がインデックスで_INCLUDE-
_ dである場合はさらにそうです。
turn
の順序で一意のインデックスをスキャンし、Weight
列の現在の合計を計算できます。次に、同じ順序付け基準でLEAD
を使用して、現在の合計を確認できます。次の行になります。
これが1000を超えるかNULL
(次の行がないことを示す)である最初の行を見つけるとすぐに、スキャンを停止できます。
_WITH T1
AS (SELECT *,
SUM(Weight) OVER (ORDER BY turn ROWS UNBOUNDED PRECEDING) AS cume_weight
FROM [dbo].[line]),
T2
AS (SELECT LEAD(cume_weight) OVER (ORDER BY turn) AS next_cume_weight,
*
FROM T1)
SELECT TOP 1 name
FROM T2
WHERE next_cume_weight > 1000
OR next_cume_weight IS NULL
ORDER BY turn
_
実際には、厳密に必要な場所の前の数行を読み取るようです。ウィンドウスプールとストリームの各集計ペアが原因で、さらに2行が読み取られるようです。
質問のサンプルデータの場合、理想的にはインデックススキャンから2行を読み取るだけで十分ですが、実際には6行を読み取りますが、これは重大な効率の問題ではなく、テーブルに行が追加されても低下しません( このデモ )
この問題に関心のある人は、各演算子によって出力された行を含む画像(_query_trace_column_values
_拡張イベントによって示される)を以下に示します。行は_row_id
_の順序で出力されます(_47
_から始まる)インデックススキャンによって読み取られ、TOP
の_113
_で終了する最初の行
下の画像をクリックして大きくするか、代わりに フローをわかりやすくするためのアニメーションバージョン を参照してください。
右側のストリーム集合体が最初の行を放出した時点でアニメーションを一時停止します(ゲイリーの場合-ターン= 1)。異なるWindowCount(Joの場合-ターン= 2)で最初の行を受け取るのを待っていたことは明らかです。そして、ウィンドウスプールは、別のturn
を持つ次の行を読み取るまで、最初の「Jo」行を解放しません(トーマスの場合-ターン= 3)
したがって、ウィンドウスプールとストリームの集計の両方により、追加の行が読み取られ、プランにはこれらの行が4つあるため、4つの行が追加されます。
上記の列の説明は次のとおりです(info here に基づいて)
SUM
に_Partition By
_がないため、最初の行だけが1になりますrow_number()
Segment1010フラグで示されるグループ内。すべての行が同じグループにあるため、これは1から6までの昇順の整数です。_rows between 5 preceding and 2 following
_のような場合に右フレーム行をフィルタリングするために使用されます。 (またはLEAD
以降)SUM
に_Partition By
_がないため、最初の行だけが1になります(Segment1010と同じ)UNBOUNDED PRECEDING
_の「高速トラック」ケースを使用しています。ソース行ごとに2行を発行する場所。 1つは累積値を持ち、もう1つは詳細値を持ちます。 _query_trace_column_values
_によって公開される行に目に見える違いはありませんが、実際には累積列があると思います。Count(*)
計画に従ってWindowCount1012によってグループ化されましたが、実際には実行中のカウントSUM(weight)
計画に従ってWindowCount1012によってグループ化されますが、実際には実行中の重みの合計(つまり、_cume_weight
_)CASE WHEN [Expr1004]=(0) THEN NULL ELSE [Expr1005] END
-COUNT(*)
がどのように見えるか確認しない0になるため、常に合計が実行されます(_cume_weight
_)LEAD
に_partition by
_がないため、最初の行は1になります。すべて残りはnullになりますrow_number()
Segment1013フラグで示されるグループ内。すべての行が同じグループにあるため、これは1から4までの昇順の整数ですLEAD
には次の単一行が必要なのでLEAD
には次の単一行が必要なのでLEAD
に_partition by
_がないため、最初の行は1になります。すべて残りはヌルになりますLEAD
のウィンドウフレームには最大2行(現在の行と次の行)がありますLAST_VALUE([Expr1002])
for LEAD(cume_weight)
好奇心と同じように(質問がT-SQLを示しているため)、SQLCLRを使用してこの問題を効率的に解決することもできます。
アイデアは、turn
が1000を超えるまで(または行がなくなるまで)、weight
の順序で一度に1行ずつ読み取り、最後に読み取ったname
を返すことです。
ソースコードは:
using Microsoft.SqlServer.Server;
using System.Data;
using System.Data.SqlClient;
using System.Data.SqlTypes;
public partial class UserDefinedFunctions
{
[SqlFunction(DataAccess = DataAccessKind.Read,
SystemDataAccess = SystemDataAccessKind.None,
IsDeterministic = true, IsPrecise = true)]
[return: SqlFacet(IsFixedLength = false, IsNullable = true, MaxSize = 255)]
public static SqlString Elevator()
{
const string query =
@"SELECT L.[name], L.[weight]
FROM dbo.line AS L
ORDER BY L.turn;";
using (var con = new SqlConnection("context connection = true"))
{
con.Open();
using (var cmd = new SqlCommand(query, con))
{
var rdr = cmd.ExecuteReader(CommandBehavior.SingleResult);
var name = SqlString.Null;
var total = 0;
while (rdr.Read() && (total += rdr.GetInt32(1)) <= 1000)
{
name = rdr.GetSqlString(0);
}
return name;
}
}
}
}
コンパイルされたアセンブリとT-SQL関数:
CREATE Assembly Elevator AUTHORIZATION [dbo]
FROM 
WITH PERMISSION_SET = SAFE;
GO
CREATE FUNCTION dbo.Elevator ()
RETURNS nvarchar(255)
AS EXTERNAL NAME Elevator.UserDefinedFunctions.Elevator;
結果を得る:
SELECT dbo.Elevator();
Martin Smith's solution からのわずかな変化
SELECT top 1 name
FROM (
SELECT id, name, weight, turn
, SUM(weight) OVER (ORDER BY turn) AS cumulative_weight
FROM line
) as T
WHERE cumulative_weight <= 1000
ORDER BY turn DESC
RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
はデフォルトのウィンドウフレームなので、宣言しませんでした。
次の累積重みの代わりに、現在の累積重みの述語が使用されます。
私はどのプランもチェックしていないので、その点で違いがあるかどうかわかりません。
自分自身に対して結合を行うことができます:
select
a.id, a.turn, a.game,
coalesce(sum(b.weight), 0) as cumulative_weight
from
table a
left join
table b
on
a.turn > b.turn
group by
a.id, a.turn, a.game ;
この種のものは、行ごとの選択を引き起こすため、あまり効率的ではありません。しかし、少なくともそれは単一のステートメントとして表現されています。
SQLで完全に実行する必要がない場合は、すべての行を選択してループし、行を重ねていくだけです。
一時テーブルを使用せずに、ストアドプロシージャで同じことを行うこともできます。変数に合計と最後の行の名前を保持するだけです。