SSDTはData Flow
タスクのバッチ処理をどのように処理しますか?
SSDTを使用して約1GBのCSVをSQLServerに解析しています。
データフローにはFlat File
ソースがあり、これはOLE DB宛先(ステージングテーブル)に移動します。次にSPが実行されます) SQLタスクを使用します。
解析されるCSVには、要約テーブルと、要約テーブルへの外部キー参照を持つ子テーブルが含まれます。そのため、CSVにはサマリーテーブルの重複したIDが含まれます(したがって、子行ごとに1行あります)。単一のサマリーIDが2つのバッチに分割された場合、データが失われます-SPは、「ステージング中のIDが子テーブルから削除され、ステージングから再挿入」のようなものになります。子テーブル」。以前は、ベンダーが子データの一意のIDをエクスポートしていなかったため、これを行う必要がありました。現在はエクスポートされているため、マージステートメントを使用できます。
だが。 Data Flow
タスクがバッチ処理されているかどうかを知りたいのですが、バッチ処理されている場合はどうすればよいですか?
質問の下のコメントで述べたように、この質問への回答はこの投稿に含まれています: http://blogs.lobsterpot.com.au/2011/02/17/the-ssis-tuning-tip-that -みんな-ミス/
つまり、そのバッチ処理はデフォルトで実行されます(バッチあたり10,000行)。