タイプbigint
の配列がありますが、その配列の重複値を削除するにはどうすればよいですか?
例:_array[1234, 5343, 6353, 1234, 1234]
_
_array[1234, 5343, 6353, ...]
_を取得する必要があります
PostgresマニュアルのサンプルSELECT uniq(sort('{1,2,3,2,1}'::int[]))
をテストしましたが、機能していません。
sort(int[])
およびuniq(int[])
関数は、intarray contribモジュールによって提供されます。
使用を有効にするには、postgresqlインストールのcontribディレクトリにある_int.sqlファイルを実行してモジュールを登録する必要があります。
Debian/Ubuntuシステムでは、postgresql-contrib-8.4パッケージをインストールする必要があります。ファイルは/usr/share/postgresql/8.4/contrib/_int.sqlの下にあります(バージョン番号は異なる場合があります)
Intarray contribモジュールを使用したくない場合、または異なるタイプの配列から重複を削除する必要がある場合、他の2つの方法があります。
少なくともPostgreSQL 8.4があれば、unnest(anyarray)
関数を利用できます
SELECT ARRAY(SELECT DISTINCT UNNEST('{1,2,3,2,1}'::int[]) ORDER BY 1);
?column?
----------
{1,2,3}
(1 row)
または、これを行う独自の関数を作成できます
CREATE OR REPLACE FUNCTION array_sort_unique (ANYARRAY) RETURNS ANYARRAY
LANGUAGE SQL
AS $body$
SELECT ARRAY(
SELECT DISTINCT $1[s.i]
FROM generate_series(array_lower($1,1), array_upper($1,1)) AS s(i)
ORDER BY 1
);
$body$;
次に呼び出しの例を示します。
SELECT array_sort_unique('{1,2,3,2,1}'::int[]);
array_sort_unique
-------------------
{1,2,3}
(1 row)
私は同じことに直面しました。しかし、私の場合、配列はarray_agg
関数を介して作成されます。そして幸いなことに、[〜#〜] distinct [〜#〜]の値を集約することができます。
array_agg(DISTINCT value)
これは私のために動作します。
...statandardlibrary(?)この種類のarray_Xユーティリティ??
検索してみてください...いくつかの標準を参照してください:
postgres.cz/wiki/Array_based_functions :良いリファレンス!
JDBurnZ/postgresql-anyarray 、良いイニシアチブですが、強化するにはいくつかのコラボレーションが必要です。
wiki.postgresql.org/Snippets 、欲求不満のイニシアチブですが、「公式wiki」は、強化するために何らかのコラボレーションが必要です。
MADlib :いいね! ....しかし、それは「純粋なSQLスニペットlib」ではなく、象です。
array_distinct()
snippet-lib関数ここで、array_unique()
またはarray_distinct()
の最も単純でおそらくより高速な実装:
CREATE FUNCTION array_distinct(anyarray) RETURNS anyarray AS $f$
SELECT array_agg(DISTINCT x) FROM unnest($1) t(x);
$f$ LANGUAGE SQL IMMUTABLE;
注:配列の配列を除き、どのデータ型でも期待どおりに動作します。
SELECT array_distinct( array[3,3,8,2,6,6,2,3,4,1,1,6,2,2,3,99] ),
array_distinct( array['3','3','hello','hello','bye'] ),
array_distinct( array[array[3,3],array[3,3],array[3,3],array[5,6]] );
-- "{1,2,3,4,6,8,99}", "{3,bye,hello}", "{3,5,6}"
「副作用」は、要素セット内のすべての配列を爆発させることです。
PS:JSONB配列でうまく動作しますが、
SELECT array_distinct( array['[3,3]'::JSONB, '[3,3]'::JSONB, '[5,6]'::JSONB] );
-- "{"[3, 3]","[5, 6]"}"
編集:より複雑だが便利な、「nullをドロップ」パラメーター
CREATE FUNCTION array_distinct(
anyarray, -- input array
boolean DEFAULT false -- flag to ignore nulls
) RETURNS anyarray AS $f$
SELECT array_agg(DISTINCT x)
FROM unnest($1) t(x)
WHERE CASE WHEN $2 THEN x IS NOT NULL ELSE true END;
$f$ LANGUAGE SQL IMMUTABLE;
anyarray
という造語を使用したPostgreSQLの配列処理の欠如に対処するために、一連のストアドプロシージャ(関数)を作成しました。これらの関数は、intarrayのように整数だけでなく、あらゆる配列データ型で機能するように設計されています。 https://www.github.com/JDBurnZ/anyarray
あなたの場合、本当に必要なのは_anyarray_uniq.sql
_だけです。そのファイルの内容をコピーしてPostgreSQLクエリに貼り付け、実行して関数を追加します。配列の並べ替えも必要な場合は、_anyarray_sort.sql
_も追加します。
そこから、次のように簡単なクエリを実行できます。
SELECT ANYARRAY_UNIQ(ARRAY[1234,5343,6353,1234,1234])
次のようなものを返します:_ARRAY[1234, 6353, 5343]
_
または、ソートが必要な場合:
SELECT ANYARRAY_SORT(ANYARRAY_UNIQ(ARRAY[1234,5343,6353,1234,1234]))
正確に返す:_ARRAY[1234, 5343, 6353]
_
これが「インライン」の方法です。
SELECT 1 AS anycolumn, (
SELECT array_agg(c1)
FROM (
SELECT DISTINCT c1
FROM (
SELECT unnest(ARRAY[1234,5343,6353,1234,1234]) AS c1
) AS t1
) AS t2
) AS the_array;
最初に配列からセットを作成し、個別のエントリのみを選択してから、配列に集約します。
DISTINCT
を使用すると、配列が暗黙的にソートされます。重複を削除するときに配列要素の相対順序を保持する必要がある場合、関数は次のように設計できます:(9.4以降で動作するはずです)
CREATE OR REPLACE FUNCTION array_uniq_stable(anyarray) RETURNS anyarray AS
$body$
SELECT
array_agg(distinct_value ORDER BY first_index)
FROM
(SELECT
value AS distinct_value,
min(index) AS first_index
FROM
unnest($1) WITH ORDINALITY AS input(value, index)
GROUP BY
value
) AS unique_input
;
$body$
LANGUAGE 'sql' IMMUTABLE STRICT;
まだpostgres 8.2を処理しなければならない私のような人々にとって、この再帰関数は配列のソートを変更することなく重複を排除することができます
CREATE OR REPLACE FUNCTION my_array_uniq(bigint[])
RETURNS bigint[] AS
$BODY$
DECLARE
n integer;
BEGIN
-- number of elements in the array
n = replace(split_part(array_dims($1),':',2),']','')::int;
IF n > 1 THEN
-- test if the last item belongs to the rest of the array
IF ($1)[1:n-1] @> ($1)[n:n] THEN
-- returns the result of the same function on the rest of the array
return my_array_uniq($1[1:n-1]);
ELSE
-- returns the result of the same function on the rest of the array plus the last element
return my_array_uniq($1[1:n-1]) || $1[n:n];
END IF;
ELSE
-- if array has only one item, returns the array
return $1;
END IF;
END;
$BODY$
LANGUAGE 'plpgsql' VOLATILE;
例えば :
select my_array_uniq(array[3,3,8,2,6,6,2,3,4,1,1,6,2,2,3,99]);
あげる
{3,8,2,6,4,1,99}