純粋なSQLで解決できると信じている興味深い難問があります。次のような表があります。
responses:
user_id | question_id | body
----------------------------
1 | 1 | Yes
2 | 1 | Yes
1 | 2 | Yes
2 | 2 | No
1 | 3 | No
2 | 3 | No
questions:
id | body
-------------------------
1 | Do you like apples?
2 | Do you like oranges?
3 | Do you like carrots?
そして、私は次の出力を得たいです
user_id | Do you like apples? | Do you like oranges? | Do you like carrots?
---------------------------------------------------------------------------
1 | Yes | Yes | No
2 | Yes | No | No
質問がいくつあるかわかりませんし、それらは動的であるため、すべての質問をコーディングすることはできません。私はPostgreSQLを使用しており、これは転置と呼ばれていますが、SQLでこれを行う標準的な方法を示すものを見つけることができないようです。私は大学のデータベースクラスでこれを行ったことを覚えていますが、それはMySQLで行われたので、正直なところ、どのように行ったか覚えていません。
結合とGROUP BY
ステートメントの組み合わせになると想定していますが、開始方法を理解することすらできません。
誰もこれを行う方法を知っていますか?どうもありがとう!
編集1:クロスタブ の使用に関する情報を見つけましたが、これは私が望むものですが、問題があります理にかなっています。より良い記事へのリンクは大歓迎です!
使用する:
SELECT r.user_id,
MAX(CASE WHEN r.question_id = 1 THEN r.body ELSE NULL END) AS "Do you like apples?",
MAX(CASE WHEN r.question_id = 2 THEN r.body ELSE NULL END) AS "Do you like oranges?",
MAX(CASE WHEN r.question_id = 3 THEN r.body ELSE NULL END) AS "Do you like carrots?"
FROM RESPONSES r
JOIN QUESTIONS q ON q.id = r.question_id
GROUP BY r.user_id
これは標準のピボットクエリです。これは、データを行から列データに「ピボット」するためです。
特定のクラスの回答をハードコーディングしたり、外部モジュール/拡張機能を使用したりすることなく、この問題を処理するための真に動的な関数を実装しました。また、列の順序を完全に制御し、複数のキーおよびクラス/属性列をサポートします。
ここで見つけることができます: https://github.com/jumpstarter-io/colpivot
この特定の問題を解決する例:
begin;
create temporary table responses (
user_id integer,
question_id integer,
body text
) on commit drop;
create temporary table questions (
id integer,
body text
) on commit drop;
insert into responses values (1,1,'Yes'), (2,1,'Yes'), (1,2,'Yes'), (2,2,'No'), (1,3,'No'), (2,3,'No');
insert into questions values (1, 'Do you like apples?'), (2, 'Do you like oranges?'), (3, 'Do you like carrots?');
select colpivot('_output', $$
select r.user_id, q.body q, r.body a from responses r
join questions q on q.id = r.question_id
$$, array['user_id'], array['q'], '#.a', null);
select * from _output;
rollback;
この出力:
user_id | 'Do you like apples?' | 'Do you like carrots?' | 'Do you like oranges?'
---------+-----------------------+------------------------+------------------------
1 | Yes | No | Yes
2 | Yes | No | No
crosstab 関数を使用してこの例を解決できます
drop table if exists responses;
create table responses (
user_id integer,
question_id integer,
body text
);
drop table if exists questions;
create table questions (
id integer,
body text
);
insert into responses values (1,1,'Yes'), (2,1,'Yes'), (1,2,'Yes'), (2,2,'No'), (1,3,'No'), (2,3,'No');
insert into questions values (1, 'Do you like apples?'), (2, 'Do you like oranges?'), (3, 'Do you like carrots?');
select * from crosstab('select responses.user_id, questions.body, responses.body from responses, questions where questions.id = responses.question_id order by user_id') as ct(userid integer, "Do you like apples?" text, "Do you like oranges?" text, "Do you like carrots?" text);
まず、tablefunc拡張機能をインストールする必要があります。バージョン9.1以降、拡張機能の作成を使用して実行できます。
CREATE EXTENSION tablefunc;
動的クエリを生成する関数を作成しました。クロスタブのsqlを生成し、ビューを作成します(存在する場合は最初に削除します)。ビューから選択して結果を得ることができます。
関数は次のとおりです。
CREATE OR REPLACE FUNCTION public.c_crosstab (
eavsql_inarg varchar,
resview varchar,
rowid varchar,
colid varchar,
val varchar,
agr varchar
)
RETURNS void AS
$body$
DECLARE
casesql varchar;
dynsql varchar;
r record;
BEGIN
dynsql='';
for r in
select * from pg_views where lower(viewname) = lower(resview)
loop
execute 'DROP VIEW ' || resview;
end loop;
casesql='SELECT DISTINCT ' || colid || ' AS v from (' || eavsql_inarg || ') eav ORDER BY ' || colid;
FOR r IN EXECUTE casesql Loop
dynsql = dynsql || ', ' || agr || '(CASE WHEN ' || colid || '=''' || r.v || ''' THEN ' || val || ' ELSE NULL END) AS ' || agr || '_' || r.v;
END LOOP;
dynsql = 'CREATE VIEW ' || resview || ' AS SELECT ' || rowid || dynsql || ' from (' || eavsql_inarg || ') eav GROUP BY ' || rowid;
RAISE NOTICE 'dynsql %1', dynsql;
EXECUTE dynsql;
END
$body$
LANGUAGE 'plpgsql'
VOLATILE
CALLED ON NULL INPUT
SECURITY INVOKER
COST 100;
そして、ここに私がそれを使用する方法があります:
SELECT c_crosstab('query_txt', 'view_name', 'entity_column_name', 'attribute_column_name', 'value_column_name', 'first');
例:実行する拳:
SELECT c_crosstab('Select * from table', 'ct_view', 'usr_id', 'question_id', 'response_value', 'first');
より:
Select * from ct_view;
contrib/tablefunc/
にこの例があります。