2つのテーブル間の結合を行う単純なクエリがあります。メインテーブルには、クエリが日付の範囲でフィルター処理する日付フィールドがあります。しかし、1か月間、私のメインテーブルには37412のデータがあり、この値には他の914 794のアイテムが子テーブルにあります。 1か月間だけ、子テーブルには常に35 975 568を超えるアイテムが含まれます。
単純な結合のように、範囲の日付によるフィルタリングは非常に低速です。
select count(i.BrandId) from projectitem i
inner join project p on i.ProjectId = p.Id
where (p.Date between "2019-07-01 00:00:00" AND "2019-07-30 23:59:59");
それはテーブルの構造です:
'CREATE TABLE `project` (
`Id` char(36) NOT NULL,
`Url` varchar(10) DEFAULT NULL,
`Region` varchar(2) NOT NULL,
`Area` int(11) NOT NULL,
`Name` varchar(250) DEFAULT NULL,
`Description` text,
`AccountId` char(36) DEFAULT NULL,
`UserId` char(36) DEFAULT NULL,
`Date` datetime DEFAULT NULL,
`ModifiedDate` datetime DEFAULT NULL,
`DeletedDate` datetime DEFAULT NULL,
`Deleted` tinyint(4) NOT NULL,
`Likes` int(11) NOT NULL,
`Views` int(11) NOT NULL,
`Private` tinyint(4) NOT NULL,
`OnlyBudget` tinyint(4) NOT NULL,
PRIMARY KEY (`Id`),
KEY `dateproject` (`Date`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci'
'CREATE TABLE `projectitem` (
`Id` char(36) NOT NULL,
`BrandId` char(36) DEFAULT NULL,
`SpecificationId` char(36) NOT NULL,
`ProjectId` char(36) NOT NULL,
PRIMARY KEY (`Id`,`ProjectId`,`SpecificationId`),
KEY `project_item_key_idx` (`ProjectId`),
KEY `brand_idx` (`BrandId`),
KEY `spec_item_key_idx` (`SpecificationId`),
CONSTRAINT `project_item_key` FOREIGN KEY (`ProjectId`) REFERENCES `project` (`Id`),
CONSTRAINT `spec_item_key` FOREIGN KEY (`SpecificationId`) REFERENCES `specification` (`Id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci'
どうすれば改善できますか?パフォーマンスが悪い理由の1つは、 "projectitem"テーブルのキーの長さが原因であると思います。
そのデータを別のデータベースから移行しました。よりも、最初にキーなしですべてのテーブルを作成し、移行後、キーとインデックスを作成するためにそのコマンドを使用しました。
SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0;
SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0;
SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='TRADITIONAL,ALLOW_INVALID_DATES';
ALTER TABLE `projectitemreference`
ADD PRIMARY KEY (`Id`, `ProjectId`, `ProjectItemId`, `SpecificationId`),
ADD INDEX `reference_item_key_idx` (`ProjectId` ASC, `ProjectItemId` ASC, `SpecificationId` ASC) VISIBLE
, LOCK = NONE;
ALTER TABLE `projectitemreference`
ADD CONSTRAINT `reference_item_key`
FOREIGN KEY (`ProjectId` , `ProjectItemId` , `SpecificationId`)
REFERENCES .`projectitem` (`ProjectId` , `Id` , `SpecificationId`)
ON DELETE NO ACTION
ON UPDATE NO ACTION,
ADD CONSTRAINT `reference_project_key`
FOREIGN KEY (`ProjectId`)
REFERENCES .`project` (`Id`)
ON DELETE NO ACTION
ON UPDATE NO ACTION, LOCK = NONE;
SET SQL_MODE=@OLD_SQL_MODE;
SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS;
SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS;
それは問題でしょうか?
count(i.BrandId)
は、カウントする前にnullでないかどうかBrandId
をチェックします。そのチェックが必要ない場合は、COUNT(*)
に変更して、JOIN
の行数をカウントします。あるいは、COUNT(DISTINCT i.BrandId)
でさまざまなブランドの数をカウントしたいとお考えですか?
次に、これらのインデックスが役立ちます。
project: INDEX(Date)
projectitem: INDEX(projectid) -- if using COUNT(*)
projectitem: INDEX(projectid, BrandId) -- if explicitly COUNTing on BrandId
データセットがRAMよりも大きくなると、ランダムアクセスによってキャッシュが破壊されるため、GUIDによってパフォーマンスが低下します。
これらのクエリに少しでも変更を加えると、インデックスの再評価が必要になる場合があることに注意してください。