Postgresql DBインスタンスが現在の作業データを処理するために、さらにRAMメモリが必要かどうかを確認するにはどうすればよいですか?
Linuxを使用している場合、I/Oを最小限に抑えるために、物理的な合計RAMはディスク上のデータベースサイズよりも大きくする必要があります。最終的には、データベース全体がOS読み取りキャッシュにあり、 I/Oは、ディスクへの変更のコミットに限定されます。「du -shc $ PGDATA/base」を実行してDBサイズを見つけることをお勧めします-この方法では、すべてのデータベースが1つの数値に集約されます。 、大丈夫です。
さらに、ヒープおよびインデックスブロックフェッチのキャッシュヒット率を確認できます。これらは、PostgreSQLの共有バッファへのヒット率を測定します。数値は少し誤解を招く可能性があります。共有バッファキャッシュでミスがあったとしても、OS読み取りキャッシュでヒットする可能性があります。それでも、共有バッファでのヒットは、OS読み取りキャッシュでのヒットよりも安価です(そのため、ディスクに戻る必要がある場合よりも数桁も安価です)。
共有バッファのヒット率を調べるために、次のクエリを使用します。
SELECT relname, heap_blks_read, heap_blks_hit,
round(heap_blks_hit::numeric/(heap_blks_hit + heap_blks_read),3)
FROM pg_statio_user_tables
WHERE heap_blks_read > 0
ORDER BY 4
LIMIT 25;
これにより、「ディスク」から少なくとも1つのブロックをフェッチする必要があるすべてのテーブルでバッファキャッシュが失われる、上位25の最悪の違反者がわかります(これも、OS読み取りキャッシュまたは実際のディスクI/Oのいずれかです)。 WHERE句の値を増やすか、heap_blks_hitに別の条件を追加して、使用頻度の低いテーブルを除外できます。
同じ基本的なクエリを使用して、文字列「heap」を「idx」でグローバルに置き換えることにより、テーブルごとの合計インデックスヒット率を確認できます。 pg_statio_user_indexesを見て、インデックスごとの内訳を取得してください。
共有バッファに関する簡単なメモ:Linuxでこれを行うには、設定パラメータshared_buffersをRAMの1/4に設定しますが、8GB以下にしてください。これは厳格な規則ではなく、サーバーをチューニングするための良い出発点です。データベースが4 GBのみで32 GBのサーバーを使用している場合、8 GBの共有バッファーは実際には過剰であり、これを5 GBまたは6 GBに設定しても、将来の拡張の余地があります。
テーブルとディスクヒット率を示すために、このSQLを作成しました。
-- perform a "select pg_stat_reset();" when you want to reset counter statistics
with
all_tables as
(
SELECT *
FROM (
SELECT 'all'::text as table_name,
sum( (coalesce(heap_blks_read,0) + coalesce(idx_blks_read,0) + coalesce(toast_blks_read,0) + coalesce(tidx_blks_read,0)) ) as from_disk,
sum( (coalesce(heap_blks_hit,0) + coalesce(idx_blks_hit,0) + coalesce(toast_blks_hit,0) + coalesce(tidx_blks_hit,0)) ) as from_cache
FROM pg_statio_all_tables --> change to pg_statio_USER_tables if you want to check only user tables (excluding postgres's own tables)
) a
WHERE (from_disk + from_cache) > 0 -- discard tables without hits
),
tables as
(
SELECT *
FROM (
SELECT relname as table_name,
( (coalesce(heap_blks_read,0) + coalesce(idx_blks_read,0) + coalesce(toast_blks_read,0) + coalesce(tidx_blks_read,0)) ) as from_disk,
( (coalesce(heap_blks_hit,0) + coalesce(idx_blks_hit,0) + coalesce(toast_blks_hit,0) + coalesce(tidx_blks_hit,0)) ) as from_cache
FROM pg_statio_all_tables --> change to pg_statio_USER_tables if you want to check only user tables (excluding postgres's own tables)
) a
WHERE (from_disk + from_cache) > 0 -- discard tables without hits
)
SELECT table_name as "table name",
from_disk as "disk hits",
round((from_disk::numeric / (from_disk + from_cache)::numeric)*100.0,2) as "% disk hits",
round((from_cache::numeric / (from_disk + from_cache)::numeric)*100.0,2) as "% cache hits",
(from_disk + from_cache) as "total hits"
FROM (SELECT * FROM all_tables UNION ALL SELECT * FROM tables) a
ORDER BY (case when table_name = 'all' then 0 else 1 end), from_disk desc
Heroku docで述べられているように、それも機能します:
SELECT
'cache hit rate' AS name,
sum(heap_blks_hit) / (sum(heap_blks_hit) + sum(heap_blks_read)) AS ratio
FROM pg_statio_user_tables;