web-dev-qa-db-ja.com

postgresで重複する配列値を削除する

タイプbigintの配列がありますが、その配列の重複値を削除するにはどうすればよいですか?

例:_array[1234, 5343, 6353, 1234, 1234]_

_array[1234, 5343, 6353, ...]_を取得する必要があります

PostgresマニュアルのサンプルSELECT uniq(sort('{1,2,3,2,1}'::int[]))をテストしましたが、機能していません。

66
GVK

sort(int[])およびuniq(int[])関数は、intarray contribモジュールによって提供されます。

使用を有効にするには、postgresqlインストールのcontribディレクトリにある_int.sqlファイルを実行してモジュールを登録する必要があります。

Debian/Ubuntuシステムでは、postgresql-contrib-8.4パッケージをインストールする必要があります。ファイルは/usr/share/postgresql/8.4/contrib/_int.sqlの下にあります(バージョン番号は異なる場合があります)

Intarray contribモジュールを使用したくない場合、または異なるタイプの配列から重複を削除する必要がある場合、他の2つの方法があります。

少なくともPostgreSQL 8.4があれば、unnest(anyarray)関数を利用できます

SELECT ARRAY(SELECT DISTINCT UNNEST('{1,2,3,2,1}'::int[]) ORDER BY 1);
 ?column? 
----------
 {1,2,3}
(1 row)

または、これを行う独自の関数を作成できます

CREATE OR REPLACE FUNCTION array_sort_unique (ANYARRAY) RETURNS ANYARRAY
LANGUAGE SQL
AS $body$
  SELECT ARRAY(
    SELECT DISTINCT $1[s.i]
    FROM generate_series(array_lower($1,1), array_upper($1,1)) AS s(i)
    ORDER BY 1
  );
$body$;

次に呼び出しの例を示します。

SELECT array_sort_unique('{1,2,3,2,1}'::int[]);
 array_sort_unique 
-------------------
 {1,2,3}
(1 row)
69
mnencia

私は同じことに直面しました。しかし、私の場合、配列はarray_agg関数を介して作成されます。そして幸いなことに、[〜#〜] distinct [〜#〜]の値を集約することができます。

  array_agg(DISTINCT value)

これは私のために動作します。

...statandardlibrary(?)この種類のarray_Xユーティリティ??

検索してみてください...いくつかの標準を参照してください:

  • postgres.cz/wiki/Array_based_functions :良いリファレンス!

  • JDBurnZ/postgresql-anyarray 、良いイニシアチブですが、強化するにはいくつかのコラボレーションが必要です。

  • wiki.postgresql.org/Snippets 、欲求不満のイニシアチブですが、「公式wiki」は、強化するために何らかのコラボレーションが必要です。

  • MADlib :いいね! ....しかし、それは「純粋なSQLスニペットlib」ではなく、象です。


最も簡単で高速なarray_distinct() snippet-lib関数

ここで、array_unique()またはarray_distinct()の最も単純でおそらくより高速な実装:

CREATE FUNCTION array_distinct(anyarray) RETURNS anyarray AS $f$
  SELECT array_agg(DISTINCT x) FROM unnest($1) t(x);
$f$ LANGUAGE SQL IMMUTABLE;

注:配列の配列を除き、どのデータ型でも期待どおりに動作します。

SELECT  array_distinct( array[3,3,8,2,6,6,2,3,4,1,1,6,2,2,3,99] ), 
        array_distinct( array['3','3','hello','hello','bye'] ), 
        array_distinct( array[array[3,3],array[3,3],array[3,3],array[5,6]] );
 -- "{1,2,3,4,6,8,99}",  "{3,bye,hello}",  "{3,5,6}"

「副作用」は、要素セット内のすべての配列を爆発させることです。

PS:JSONB配列でうまく動作しますが、

SELECT array_distinct( array['[3,3]'::JSONB, '[3,3]'::JSONB, '[5,6]'::JSONB] );
 -- "{"[3, 3]","[5, 6]"}"

編集:より複雑だが便利な、「nullをドロップ」パラメーター

CREATE FUNCTION array_distinct(
      anyarray, -- input array 
      boolean DEFAULT false -- flag to ignore nulls
) RETURNS anyarray AS $f$
      SELECT array_agg(DISTINCT x) 
      FROM unnest($1) t(x) 
      WHERE CASE WHEN $2 THEN x IS NOT NULL ELSE true END;
$f$ LANGUAGE SQL IMMUTABLE;
14
Peter Krauss

anyarrayという造語を使用したPostgreSQLの配列処理の欠如に対処するために、一連のストアドプロシージャ(関数)を作成しました。これらの関数は、intarrayのように整数だけでなく、あらゆる配列データ型で機能するように設計されています。 https://www.github.com/JDBurnZ/anyarray

あなたの場合、本当に必要なのは_anyarray_uniq.sql_だけです。そのファイルの内容をコピーしてPostgreSQLクエリに貼り付け、実行して関数を追加します。配列の並べ替えも必要な場合は、_anyarray_sort.sql_も追加します。

そこから、次のように簡単なクエリを実行できます。

SELECT ANYARRAY_UNIQ(ARRAY[1234,5343,6353,1234,1234])

次のようなものを返します:_ARRAY[1234, 6353, 5343]_

または、ソートが必要な場合:

SELECT ANYARRAY_SORT(ANYARRAY_UNIQ(ARRAY[1234,5343,6353,1234,1234]))

正確に返す:_ARRAY[1234, 5343, 6353]_

13
Joshua Burns

これが「インライン」の方法です。

SELECT 1 AS anycolumn, (
  SELECT array_agg(c1)
  FROM (
    SELECT DISTINCT c1
    FROM (
      SELECT unnest(ARRAY[1234,5343,6353,1234,1234]) AS c1
    ) AS t1
  ) AS t2
) AS the_array;

最初に配列からセットを作成し、個別のエントリのみを選択してから、配列に集約します。

7
alexkovelsky

DISTINCTを使用すると、配列が暗黙的にソートされます。重複を削除するときに配列要素の相対順序を保持する必要がある場合、関数は次のように設計できます:(9.4以降で動作するはずです)

CREATE OR REPLACE FUNCTION array_uniq_stable(anyarray) RETURNS anyarray AS
$body$
SELECT
    array_agg(distinct_value ORDER BY first_index)
FROM 
    (SELECT
        value AS distinct_value, 
        min(index) AS first_index 
    FROM 
        unnest($1) WITH ORDINALITY AS input(value, index)
    GROUP BY
        value
    ) AS unique_input
;
$body$
LANGUAGE 'sql' IMMUTABLE STRICT;
5
tbussmann

まだpostgres 8.2を処理しなければならない私のような人々にとって、この再帰関数は配列のソートを変更することなく重複を排除することができます

CREATE OR REPLACE FUNCTION my_array_uniq(bigint[])
  RETURNS bigint[] AS
$BODY$
DECLARE
    n integer;
BEGIN

    -- number of elements in the array
    n = replace(split_part(array_dims($1),':',2),']','')::int;

    IF n > 1 THEN
        -- test if the last item belongs to the rest of the array
        IF ($1)[1:n-1] @> ($1)[n:n] THEN
            -- returns the result of the same function on the rest of the array
            return my_array_uniq($1[1:n-1]);
        ELSE
            -- returns the result of the same function on the rest of the array plus the last element               
            return my_array_uniq($1[1:n-1]) || $1[n:n];
        END IF;
    ELSE
        -- if array has only one item, returns the array
        return $1;
    END IF;
END;
$BODY$
  LANGUAGE 'plpgsql' VOLATILE;

例えば ​​:

select my_array_uniq(array[3,3,8,2,6,6,2,3,4,1,1,6,2,2,3,99]);

あげる

{3,8,2,6,4,1,99}
2
bayonatof