階層フィールドの最高レベルを見つける：CTEありvsなし

Question

注：この質問は、現在MySQLを使用していることを反映するように更新されています。使用しているため、CTEをサポートするデータベースに切り替えると、はるかに簡単になると思います。

主キーidと外部キーparent_idの自己参照テーブルがあります。

+------------+--------------+------+-----+---------+----------------+ | Field | Type | Null | Key | Default | Extra | +------------+--------------+------+-----+---------+----------------+ | id | int(11) | NO | PRI | NULL | auto_increment | | parent_id | int(11) | YES | | NULL | | | name | varchar(255) | YES | | NULL | | | notes | text | YES | | NULL | | +------------+--------------+------+-----+---------+----------------+

nameが与えられた場合、どのようにして最上位の親をクエリできますか？

nameが与えられた場合、name = 'foo'のレコードに関連付けられているすべてのidをクエリするにはどうすればよいですか？

context：私はdbaではありませんが、dbaにこのタイプの階層構造の実装を依頼し、いくつかのクエリをテストしたいと考えています。そうする動機は Kattge et al 2011 で説明されています。

以下は、テーブル内のID間の関係の例です。

enter image description here

-- ----------------------------------------------------- -- Create a new database called 'testdb' -- ----------------------------------------------------- SET @OLD_UNIQUE_CHECKS=@@UNIQUE_CHECKS, UNIQUE_CHECKS=0; SET @OLD_FOREIGN_KEY_CHECKS=@@FOREIGN_KEY_CHECKS, FOREIGN_KEY_CHECKS=0; SET @OLD_SQL_MODE=@@SQL_MODE, SQL_MODE='TRADITIONAL'; CREATE SCHEMA IF NOT EXISTS `testdb` DEFAULT CHARACTER SET latin1 COLLATE latin1_swedish_ci ; USE `testdb` ; -- ----------------------------------------------------- -- Table `testdb`.`observations` -- ----------------------------------------------------- CREATE TABLE IF NOT EXISTS `testdb`.`observations` ( `id` INT NOT NULL , `parent_id` INT NULL , `name` VARCHAR(45) NULL , PRIMARY KEY (`id`) ) ENGINE = InnoDB; SET SQL_MODE=@OLD_SQL_MODE; SET FOREIGN_KEY_CHECKS=@OLD_FOREIGN_KEY_CHECKS; SET UNIQUE_CHECKS=@OLD_UNIQUE_CHECKS; -- ----------------------------------------------------- -- Add Example Data Set -- ----------------------------------------------------- INSERT INTO observations VALUES (1,3), (2,5), (3,NULL), (4,10), (5,NULL), (6,1), (7,5), (8,10), (9,10), (10,3);

RolandoMySQLDBA · Accepted Answer

あなたは間違いなくMySQLのストアドプロシージャ言語を介してこれをスクリプト化する必要があります

検索対象のIDが指定されたParentIDを取得するGetParentIDByIDtoというストアド関数は次のとおりです

DELIMITER $$ DROP FUNCTION IF EXISTS `junk`.`GetParentIDByID` $$ CREATE FUNCTION `junk`.`GetParentIDByID` (GivenID INT) RETURNS INT DETERMINISTIC BEGIN DECLARE rv INT; SELECT IFNULL(parent_id,-1) INTO rv FROM (SELECT parent_id FROM pctable WHERE id = GivenID) A; RETURN rv; END $$ DELIMITER ;

GetAncestryという名前のストアド関数は、第1世代から始まるParentIDのリストを取得します。

DELIMITER $$ DROP FUNCTION IF EXISTS `junk`.`GetAncestry` $$ CREATE FUNCTION `junk`.`GetAncestry` (GivenID INT) RETURNS VARCHAR(1024) DETERMINISTIC BEGIN DECLARE rv VARCHAR(1024); DECLARE cm CHAR(1); DECLARE ch INT; SET rv = ''; SET cm = ''; SET ch = GivenID; WHILE ch > 0 DO SELECT IFNULL(parent_id,-1) INTO ch FROM (SELECT parent_id FROM pctable WHERE id = ch) A; IF ch > 0 THEN SET rv = CONCAT(rv,cm,ch); SET cm = ','; END IF; END WHILE; RETURN rv; END $$ DELIMITER ;

これは、サンプルデータを生成するものです。

USE junk DROP TABLE IF EXISTS pctable; CREATE TABLE pctable ( id INT NOT NULL AUTO_INCREMENT, parent_id INT, PRIMARY KEY (id) ) ENGINE=MyISAM; INSERT INTO pctable (parent_id) VALUES (0); INSERT INTO pctable (parent_id) SELECT parent_id+1 FROM pctable; INSERT INTO pctable (parent_id) SELECT parent_id+2 FROM pctable; INSERT INTO pctable (parent_id) SELECT parent_id+3 FROM pctable; INSERT INTO pctable (parent_id) SELECT parent_id+4 FROM pctable; INSERT INTO pctable (parent_id) SELECT parent_id+5 FROM pctable; SELECT * FROM pctable;

これが生成するものです：

mysql> USE junk Database changed mysql> DROP TABLE IF EXISTS pctable; Query OK, 0 rows affected (0.00 sec) mysql> CREATE TABLE pctable -> ( -> id INT NOT NULL AUTO_INCREMENT, -> parent_id INT, -> PRIMARY KEY (id) -> ) ENGINE=MyISAM; Query OK, 0 rows affected (0.05 sec) mysql> INSERT INTO pctable (parent_id) VALUES (0); Query OK, 1 row affected (0.00 sec) mysql> INSERT INTO pctable (parent_id) SELECT parent_id+1 FROM pctable; Query OK, 1 row affected (0.00 sec) Records: 1 Duplicates: 0 Warnings: 0 mysql> INSERT INTO pctable (parent_id) SELECT parent_id+2 FROM pctable; Query OK, 2 rows affected (0.00 sec) Records: 2 Duplicates: 0 Warnings: 0 mysql> INSERT INTO pctable (parent_id) SELECT parent_id+3 FROM pctable; Query OK, 4 rows affected (0.00 sec) Records: 4 Duplicates: 0 Warnings: 0 mysql> INSERT INTO pctable (parent_id) SELECT parent_id+4 FROM pctable; Query OK, 8 rows affected (0.01 sec) Records: 8 Duplicates: 0 Warnings: 0 mysql> INSERT INTO pctable (parent_id) SELECT parent_id+5 FROM pctable; Query OK, 16 rows affected (0.00 sec) Records: 16 Duplicates: 0 Warnings: 0 mysql> SELECT * FROM pctable; +----+-----------+ | id | parent_id | +----+-----------+ | 1 | 0 | | 2 | 1 | | 3 | 2 | | 4 | 3 | | 5 | 3 | | 6 | 4 | | 7 | 5 | | 8 | 6 | | 9 | 4 | | 10 | 5 | | 11 | 6 | | 12 | 7 | | 13 | 7 | | 14 | 8 | | 15 | 9 | | 16 | 10 | | 17 | 5 | | 18 | 6 | | 19 | 7 | | 20 | 8 | | 21 | 8 | | 22 | 9 | | 23 | 10 | | 24 | 11 | | 25 | 9 | | 26 | 10 | | 27 | 11 | | 28 | 12 | | 29 | 12 | | 30 | 13 | | 31 | 14 | | 32 | 15 | +----+-----------+ 32 rows in set (0.00 sec)

次に、関数が各値に対して生成するものを示します。

mysql> SELECT id,GetParentIDByID(id),GetAncestry(id) FROM pctable; +----+---------------------+-----------------+ | id | GetParentIDByID(id) | GetAncestry(id) | +----+---------------------+-----------------+ | 1 | 0 | | | 2 | 1 | 1 | | 3 | 2 | 2,1 | | 4 | 3 | 3,2,1 | | 5 | 3 | 3,2,1 | | 6 | 4 | 4,3,2,1 | | 7 | 5 | 5,3,2,1 | | 8 | 6 | 6,4,3,2,1 | | 9 | 4 | 4,3,2,1 | | 10 | 5 | 5,3,2,1 | | 11 | 6 | 6,4,3,2,1 | | 12 | 7 | 7,5,3,2,1 | | 13 | 7 | 7,5,3,2,1 | | 14 | 8 | 8,6,4,3,2,1 | | 15 | 9 | 9,4,3,2,1 | | 16 | 10 | 10,5,3,2,1 | | 17 | 5 | 5,3,2,1 | | 18 | 6 | 6,4,3,2,1 | | 19 | 7 | 7,5,3,2,1 | | 20 | 8 | 8,6,4,3,2,1 | | 21 | 8 | 8,6,4,3,2,1 | | 22 | 9 | 9,4,3,2,1 | | 23 | 10 | 10,5,3,2,1 | | 24 | 11 | 11,6,4,3,2,1 | | 25 | 9 | 9,4,3,2,1 | | 26 | 10 | 10,5,3,2,1 | | 27 | 11 | 11,6,4,3,2,1 | | 28 | 12 | 12,7,5,3,2,1 | | 29 | 12 | 12,7,5,3,2,1 | | 30 | 13 | 13,7,5,3,2,1 | | 31 | 14 | 14,8,6,4,3,2,1 | | 32 | 15 | 15,9,4,3,2,1 | +----+---------------------+-----------------+ 32 rows in set (0.02 sec)

MORAL OF THE STORY：再帰的なデータ取得は、MySQLでスクリプト化する必要があります

PDATE 2011-10-24 17:17 EDT

GetAncestryの逆です。私はそれをGetFamilyTreeと呼んでいます。

これがアルゴリズムです：

指定されたIDをキューに入れる
ループ
- Front_idにデキュー
- すべてのIDを、parent_id = front_idであるqueue_childrenに取得します。
- Queue_childrenをretval_list（rv）に追加
- エンキューqueue_children
- Queueとqueue_childrenが同時に空になるまで繰り返す

カレッジでのデータ構造とアルゴリズムのクラスから、これはプリオーダー/プレフィックスツリートラバーサルのようなものと呼ばれています。

これがコードです：

DELIMITER $$ DROP FUNCTION IF EXISTS `junk`.`GetFamilyTree` $$ CREATE FUNCTION `junk`.`GetFamilyTree` (GivenID INT) RETURNS varchar(1024) CHARSET latin1 DETERMINISTIC BEGIN DECLARE rv,q,queue,queue_children VARCHAR(1024); DECLARE queue_length,front_id,pos INT; SET rv = ''; SET queue = GivenID; SET queue_length = 1; WHILE queue_length > 0 DO SET front_id = FORMAT(queue,0); IF queue_length = 1 THEN SET queue = ''; ELSE SET pos = LOCATE(',',queue) + 1; SET q = SUBSTR(queue,pos); SET queue = q; END IF; SET queue_length = queue_length - 1; SELECT IFNULL(qc,'') INTO queue_children FROM (SELECT GROUP_CONCAT(id) qc FROM pctable WHERE parent_id = front_id) A; IF LENGTH(queue_children) = 0 THEN IF LENGTH(queue) = 0 THEN SET queue_length = 0; END IF; ELSE IF LENGTH(rv) = 0 THEN SET rv = queue_children; ELSE SET rv = CONCAT(rv,',',queue_children); END IF; IF LENGTH(queue) = 0 THEN SET queue = queue_children; ELSE SET queue = CONCAT(queue,',',queue_children); END IF; SET queue_length = LENGTH(queue) - LENGTH(REPLACE(queue,',','')) + 1; END IF; END WHILE; RETURN rv; END $$

これが各行が生成するものです

mysql> SELECT id,parent_id,GetParentIDByID(id),GetAncestry(id),GetFamilyTree(id) FROM pctable; +----+-----------+---------------------+-----------------+--------------------------------------------------------------------------------------+ | id | parent_id | GetParentIDByID(id) | GetAncestry(id) | GetFamilyTree(id) | +----+-----------+---------------------+-----------------+--------------------------------------------------------------------------------------+ | 1 | 0 | 0 | | 2,3,4,5,6,9,7,10,17,8,11,18,15,22,25,12,13,19,16,23,26,14,20,21,24,27,32,28,29,30,31 | | 2 | 1 | 1 | 1 | 3,4,5,6,9,7,10,17,8,11,18,15,22,25,12,13,19,16,23,26,14,20,21,24,27,32,28,29,30,31 | | 3 | 2 | 2 | 2,1 | 4,5,6,9,7,10,17,8,11,18,15,22,25,12,13,19,16,23,26,14,20,21,24,27,32,28,29,30,31 | | 4 | 3 | 3 | 3,2,1 | 6,9,8,11,18,15,22,25,14,20,21,24,27,32,31 | | 5 | 3 | 3 | 3,2,1 | 7,10,17,12,13,19,16,23,26,28,29,30 | | 6 | 4 | 4 | 4,3,2,1 | 8,11,18,14,20,21,24,27,31 | | 7 | 5 | 5 | 5,3,2,1 | 12,13,19,28,29,30 | | 8 | 6 | 6 | 6,4,3,2,1 | 14,20,21,31 | | 9 | 4 | 4 | 4,3,2,1 | 15,22,25,32 | | 10 | 5 | 5 | 5,3,2,1 | 16,23,26 | | 11 | 6 | 6 | 6,4,3,2,1 | 24,27 | | 12 | 7 | 7 | 7,5,3,2,1 | 28,29 | | 13 | 7 | 7 | 7,5,3,2,1 | 30 | | 14 | 8 | 8 | 8,6,4,3,2,1 | 31 | | 15 | 9 | 9 | 9,4,3,2,1 | 32 | | 16 | 10 | 10 | 10,5,3,2,1 | | | 17 | 5 | 5 | 5,3,2,1 | | | 18 | 6 | 6 | 6,4,3,2,1 | | | 19 | 7 | 7 | 7,5,3,2,1 | | | 20 | 8 | 8 | 8,6,4,3,2,1 | | | 21 | 8 | 8 | 8,6,4,3,2,1 | | | 22 | 9 | 9 | 9,4,3,2,1 | | | 23 | 10 | 10 | 10,5,3,2,1 | | | 24 | 11 | 11 | 11,6,4,3,2,1 | | | 25 | 9 | 9 | 9,4,3,2,1 | | | 26 | 10 | 10 | 10,5,3,2,1 | | | 27 | 11 | 11 | 11,6,4,3,2,1 | | | 28 | 12 | 12 | 12,7,5,3,2,1 | | | 29 | 12 | 12 | 12,7,5,3,2,1 | | | 30 | 13 | 13 | 13,7,5,3,2,1 | | | 31 | 14 | 14 | 14,8,6,4,3,2,1 | | | 32 | 15 | 15 | 15,9,4,3,2,1 | | +----+-----------+---------------------+-----------------+--------------------------------------------------------------------------------------+ 32 rows in set (0.04 sec)

このアルゴリズムは、循環パスがない場合は問題なく機能します。循環パスが存在する場合は、「訪問済み」列をテーブルに追加する必要があります。

訪問済み列を追加すると、循環関係をブロックするアルゴリズムは次のようになります。

指定されたIDをキューに入れる
すべての訪問済みを0でマーク
ループ
- Front_idにデキュー
- Parent_id = front_idで、visited = 0であるすべてのIDをqueue_childrenに取得します。
- 取得したばかりのすべてのqueue_childrenに、visited = 1のマークを付けます
- Queue_childrenをretval_list（rv）に追加
- エンキューqueue_children
- Queueとqueue_childrenが同時に空になるまで繰り返します

PDATE 2011-10-24 17:37 EDT

観測と呼ばれる新しいテーブルを作成し、サンプルデータを入力しました。 pctableではなくオブザベーションを使用するようにストアドプロシージャを変更しました。これがあなたの出力です：

mysql> CREATE TABLE observations LIKE pctable; Query OK, 0 rows affected (0.04 sec) mysql> INSERT INTO observations VALUES (1,3), (2,5), (3,0), (4,10),(5,0),(6,1),(7,5),(8,10),(9,10),(10,3); Query OK, 10 rows affected (0.00 sec) Records: 10 Duplicates: 0 Warnings: 0 mysql> SELECT * FROM observations; +----+-----------+ | id | parent_id | +----+-----------+ | 1 | 3 | | 2 | 5 | | 3 | 0 | | 4 | 10 | | 5 | 0 | | 6 | 1 | | 7 | 5 | | 8 | 10 | | 9 | 10 | | 10 | 3 | +----+-----------+ 10 rows in set (0.00 sec) mysql> SELECT id,parent_id,GetParentIDByID(id),GetAncestry(id),GetFamilyTree(id) FROM observations; +----+-----------+---------------------+-----------------+-------------------+ | id | parent_id | GetParentIDByID(id) | GetAncestry(id) | GetFamilyTree(id) | +----+-----------+---------------------+-----------------+-------------------+ | 1 | 3 | 3 | | 6 | | 2 | 5 | 5 | 5 | | | 3 | 0 | 0 | | 1,10,6,4,8,9 | | 4 | 10 | 10 | 10,3 | | | 5 | 0 | 0 | | 2,7 | | 6 | 1 | 1 | 1 | | | 7 | 5 | 5 | 5 | | | 8 | 10 | 10 | 10,3 | | | 9 | 10 | 10 | 10,3 | | | 10 | 3 | 3 | 3 | 4,8,9 | +----+-----------+---------------------+-----------------+-------------------+ 10 rows in set (0.01 sec)

PDATE 2011-10-24 18:22 EDT

GetAncestryのコードを変更しました。ありました WHILE ch > 1 そのはず WHILE ch > 0

mysql> SELECT id,parent_id,GetParentIDByID(id),GetAncestry(id),GetFamilyTree(id) FROM observations; +----+-----------+---------------------+-----------------+-------------------+ | id | parent_id | GetParentIDByID(id) | GetAncestry(id) | GetFamilyTree(id) | +----+-----------+---------------------+-----------------+-------------------+ | 1 | 3 | 3 | 3 | 6 | | 2 | 5 | 5 | 5 | | | 3 | 0 | 0 | | 1,10,6,4,8,9 | | 4 | 10 | 10 | 10,3 | | | 5 | 0 | 0 | | 2,7 | | 6 | 1 | 1 | 1,3 | | | 7 | 5 | 5 | 5 | | | 8 | 10 | 10 | 10,3 | | | 9 | 10 | 10 | 10,3 | | | 10 | 3 | 3 | 3 | 4,8,9 | +----+-----------+---------------------+-----------------+-------------------+ 10 rows in set (0.01 sec)

やってみよう！！！

a_horse_with_no_name · Answer

指定されたノードのすべてのparentsを取得する：

WITH RECURSIVE tree AS ( SELECT id, name, parent_id, 1 as level FROM the_table WHERE name = 'foo' UNION ALL SELECT p.id, p.name, p.parent_id, t.level + 1 FROM the_table p JOIN tree t ON t.parent_id = p.id ) SELECT * FROM tree

ルートノードを取得するには、たとえば、 ORDER BY levelと最初の行を取ります

指定されたノードのすべてのchildrenを取得します。

WITH RECURSIVE tree AS ( SELECT id, name, parent_id, 1 as level FROM the_table WHERE name = 'foo' UNION ALL SELECT p.id, p.name, p.parent_id, t.level + 1 FROM your_table p JOIN tree t ON t.id = p.parent_id ) SELECT * FROM tree

（ステートメントの再帰部分での結合の交換条件に注意してください）

私の知る限り、次のDBMSは再帰CTEをサポートしています。

FirebirdSQL 2.1（実際には、それらを実装する最初のオープンソースDBMS）
PostgreSQL 8.4
DB2（正確なバージョンは不明）
Oracle（11.2以降）
SQL Server 2005以降
Teradata
H2
Sybase（正確なバージョンがわからない）

編集

次の例では、サンプルデータに基づいて、追加の列として各ノードの完全なパスを含むすべてのサブツリーをテーブルから取得します。

with recursive obs_tree as ( select id, parent_id, '/'||cast(id as varchar) as tree from observations where parent_id is null union all select t.id, t.parent_id, p.tree||'/'||cast(t.id as varchar) from observations t join obs_tree p on t.parent_id = p.id ) select id, parent_id, tree from obs_tree order by tree

出力は次のようになります。

 id | parent_id |ツリー ---- + ----------- + --------- 3 | | /3 1 | 3 | /3/1 6 | 1 | /3/1/6 10 | 3 | /3/10 4 | 10 | /3/10/4 8 | 10 | /3/10/8 9 | 10 | /3/10/9 5 | | /5 2 | 5 | /5/2 7 | 5 | /5/7

Sivakumar Natarayan · Answer

Rolandoの回答のGetFamilyTree関数は、指定されたIDが4整数を超える場合は機能しません。ストアド関数GetFamilyTreeを次のように大きな整数IDで動作するように変更しました。

WHILE queue_length > 0 DO IF queue_length = 1 THEN SET front_id = queue; SET queue = ''; ELSE SET front_id = SUBSTR(queue,1,LOCATE(',',queue)-1); SET pos = LOCATE(',',queue) + 1; SET q = SUBSTR(queue,pos); SET queue = q; END IF;

if elseループ内で定義されたfront_id。