jq を使用してjsonファイルをフィルタリングしたい:
jq . some.json
オブジェクトの配列を含むJSONを考えます:
{
"theList": [
{
"id": 1,
"name": "Horst"
},
{
"id": 2,
"name": "Fritz"
},
{
"id": 3,
"name": "Walter"
},
{
"id": 4,
"name": "Gerhart"
},
{
"id": 5,
"name": "Harmut"
}
]
}
このリストをフィルター処理して、値が2と4のidを持つ要素のみを表示するため、期待される出力は次のようになります。
{
"id": 2,
"name": "Fritz"
},
{
"id": 4,
"name": "Gerhart"
}
Jqを使用してjsonをフィルタリングするにはどうすればよいですか?私はselectとmapをいじってみましたが、動作するものはありませんでした、例えば:
$ jq '.theList[] | select(.id == 2) or select(.id == 4)' array.json
true
ドキュメントから:
jq '.[] | select(.id == "second")'
入力
[{"id": "first", "val": 1}, {"id": "second", "val": 2}]
出力
{"id": "second", "val": 2}
次のようなことができると思います:
jq '.theList[] | select(.id == 2 or .id == 4)' array.json
select
内でmap
を使用できます。
.theList | map(select(.id == (2, 4)))
またはよりコンパクト:
[ .theList[] | select(.id == (2, 4)) ]
式は比較されるすべての値に対して複製されるため、そのように書かれたとしても少し非効率的です。次のように書くと、より効率的で、おそらく読みやすくなります。
[ .theList[] | select(any(2, 4; . == .id)) ]
ここでselect(.id == (2, 4))
を使用することは一般に非効率的です(以下を参照)。
JqにIN/1
がある場合、それを使用してより効率的なソリューションを実現できます。
.theList[] | select( .id | IN(2,3))
JqにIN/1
がない場合は、次のように定義できます。
def IN(s): first(select(s == .)) // false;
効率
非効率を確認する1つの方法は、debug
を使用することです。たとえば、次の式では、debug
の呼び出しが10回行われますが、実際には同等性のチェックは9回だけ必要です。
.theList[] | select( (.id == (2,3)) | debug )
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
"id": 2,
"name": "Fritz"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",true]
{
"id": 3,
"name": "Walter"
}
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]
["DEBUG:",false]
インデックス/ 1
原則として、index/1
の使用は効率的ですが、この執筆(2017年10月)の時点では、その実装は高速ですが(Cで記述されています)、非効率的です。
indices を使用したソリューションは次のとおりです。
.theList | [ .[map(.id)|indices(2,4)[]] ]