Herokuを使用するために、MySQLクエリの一部をPostgreSQLに移行しています。ほとんどのクエリは正常に機能しますが、group byを使用すると同様のエラーが繰り返し発生します。
エラー:列「XYZ」はGROUP BY句に表示されるか、集計関数で使用される必要があります
誰かが私が間違っていることを教えてくれますか?
100%動作するMySQL:
SELECT `availables`.*
FROM `availables`
INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056 AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
GROUP BY availables.bookdate
ORDER BY availables.updated_at
PostgreSQLエラー:
ActiveRecord :: StatementInvalid:PGError:ERROR:列 "availables.id"はGROUP BY句に現れるか、集約関数で使用されなければなりません:
SELECT "availables"。* FROM "availables" INNER JOIN "rooms" ON "rooms" .id = "availables" .room_id WHERE(rooms.hotel_id = 5056 AND availables.bookdate BETWEEN E'2009-10- 21 'およびE'2009-10-23')GROUP BY availables.bookdate ORDER BY availables.updated_at
SQLを生成するルビーコード:
expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => 'availables.bookdate',
:order => 'availables.updated_at')
期待される出力(動作中のMySQLクエリから):
+ ----- + ------- + ------- + ------------ + --------- + --------------- + --------------- + | id |価格|スポット|ブックデート| room_id | created_at | updated_at | + ----- + ------- + ------- + ------------ + ------- -+ --------------- + --------------- + | 414 | 38.0 | 1 | 2009-11-22 | 1762 | 2009-11-20 ... | 2009-11-20 ... | | 415 | 38.0 | 1 | 2009-11-23 | 1762 | 2009-11-20 ... | 2009-11-20 ... | | 416 | 38.0 | 2 | 2009-11-24 | 1762 | 2009-11-20 ... | 2009-11-20 ... | + ----- + ------- + ------- + ------------ + --------- + --------------- + --------------- + 3行セットする
MySQLの完全に非標準に準拠GROUP BY
は、PostgresのDISTINCT ON
。このことを考慮:
SELECT a,b,c,d,e FROM table GROUP BY a
これにより、a
の値ごとに1行が配信されます(実際にはわかりません)。 MySQLはハッシュ集約を知らないため、実際には推測できます。したがって、おそらくソートを使用しますが、a
でのみソートされるため、行の順序はランダムになる可能性があります。ソートの代わりに複数列インデックスを使用しない限り。とにかく、クエリでは指定されていません。
SELECT DISTINCT ON (a) a,b,c,d,e FROM table ORDER BY a,b,c
これは、a
の値ごとに1行を配信します。この行は、ORDER BY
クエリで指定。シンプル。
ここで、それは私が計算している集合体ではないことに注意してください。そう GROUP BY
は実際には意味がありません。 DISTINCT ON
は、はるかに理にかなっています。
RailsはMySQLと結婚しているため、Postgresで機能しないSQLが生成されることは驚くことではありません。
PostgreSQLは、MySQLよりもSQLに準拠しています。出力のすべてのフィールド(集計関数を含む計算フィールドを除く)は、GROUP BY句に存在する必要があります。
MySQLのGROUP BYは、集計関数なしで使用でき(SQL標準に反します)、グループの最初の行を返します(どの基準に基づいているのかわかりません)が、PostgreSQLには集計関数(MAX、 GROUP BY句が発行される列のSUMなど)。
正しい、これを解決する解決策は、:selectを使用し、結果のオブジェクトをデコレーションしたい各フィールドを選択し、それらをグループ化することです。
意地悪-しかし、それは、group by shouldがどのように機能するかということです。MySQLがグループのフィールドを固定しない場合の意味を推測することで、MySQLがどのように機能するかとは対照的です。
正しく覚えていれば、PostgreSQLでは、GROUP BY句が適用されるテーブルからフェッチするすべての列を追加する必要がありますto GROUP BY句。
きれいな解決策ではありませんが、モデルのすべての列を出力するようにグループパラメーターを変更すると、PostgreSQLで機能します。
expiration = Available.find(:all,
:joins => [ :room ],
:conditions => [ "rooms.hotel_id = ? AND availables.bookdate BETWEEN ? AND ?", hostel_id, date.to_s, (date+days-1).to_s ],
:group => Available.column_names.collect{|col| "availables.#{col}"},
:order => 'availables.updated_at')
Postgresqlで、結合フィールドを含む任意のフィールドで並べ替える方法を探している他の人のために、サブクエリを使用します。
SELECT * FROM(
SELECT DISTINCT ON(availables.bookdate) `availables`.*
FROM `availables` INNER JOIN `rooms` ON `rooms`.id = `availables`.room_id
WHERE (rooms.hotel_id = 5056
AND availables.bookdate BETWEEN '2009-11-22' AND '2009-11-24')
) AS distinct_selected
ORDER BY availables.updated_at
or arel:
subquery = SomeRecord.select("distinct on(xx.id) xx.*, jointable.order_field")
.where("").joins(")
result = SomeRecord.select("*").from("(#{subquery.to_sql}) AS distinct_selected").order(" xx.order_field ASC, jointable.order_field ASC")
MySQLの「Debuking GROUP BY Myths」によると http://dev.mysql.com/tech-resources/articles/debunking-group-by-myths.html 。 SQL(2003バージョンの標準)では、クエリのSELECTリストで参照される列がGROUP BY句にも表示される必要はありません。
.uniq [1]が問題を解決すると思います。
[1] Available.select('...').uniq
http://guides.rubyonrails.org/active_record_querying.html#selecting-specific-fields をご覧ください