深さが不明な複雑な辞書を完全にトラバースする方法は？

Question

JSONからインポートすると、非常に複雑でネストされた構造を取得できます。例えば：

{u'body': [{u'declarations': [{u'id': {u'name': u'i', u'type': u'Identifier'}, u'init': {u'type': u'Literal', u'value': 2}, u'type': u'VariableDeclarator'}], u'kind': u'var', u'type': u'VariableDeclaration'}, {u'declarations': [{u'id': {u'name': u'j', u'type': u'Identifier'}, u'init': {u'type': u'Literal', u'value': 4}, u'type': u'VariableDeclarator'}], u'kind': u'var', u'type': u'VariableDeclaration'}, {u'declarations': [{u'id': {u'name': u'answer', u'type': u'Identifier'}, u'init': {u'left': {u'name': u'i', u'type': u'Identifier'}, u'operator': u'*', u'right': {u'name': u'j', u'type': u'Identifier'}, u'type': u'BinaryExpression'}, u'type': u'VariableDeclarator'}], u'kind': u'var', u'type': u'VariableDeclaration'}], u'type': u'Program'}

上記のような複雑な構造を歩くための推奨される方法は何ですか？

いくつかのリストのほかに、ほとんどが辞書がありますが、構造はさらに複雑になる可能性があるため、一般的な解決策が必要です。

Valentin Bryukhanov · Accepted Answer

辞書をフラットリストに変換するには、再帰ジェネレーターを使用できます。

def dict_generator(indict, pre=None): pre = pre[:] if pre else [] if isinstance(indict, dict): for key, value in indict.items(): if isinstance(value, dict): for d in dict_generator(value, [key] + pre): yield d Elif isinstance(value, list) or isinstance(value, Tuple): for v in value: for d in dict_generator(v, [key] + pre): yield d else: yield pre + [key, value] else: yield indict

返す

[u'body', u'kind', u'var'] [u'init', u'declarations', u'body', u'type', u'Literal'] [u'init', u'declarations', u'body', u'value', 2] [u'declarations', u'body', u'type', u'VariableDeclarator'] [u'id', u'declarations', u'body', u'type', u'Identifier'] [u'id', u'declarations', u'body', u'name', u'i'] [u'body', u'type', u'VariableDeclaration'] [u'body', u'kind', u'var'] [u'init', u'declarations', u'body', u'type', u'Literal'] [u'init', u'declarations', u'body', u'value', 4] [u'declarations', u'body', u'type', u'VariableDeclarator'] [u'id', u'declarations', u'body', u'type', u'Identifier'] [u'id', u'declarations', u'body', u'name', u'j'] [u'body', u'type', u'VariableDeclaration'] [u'body', u'kind', u'var'] [u'init', u'declarations', u'body', u'operator', u'*'] [u'right', u'init', u'declarations', u'body', u'type', u'Identifier'] [u'right', u'init', u'declarations', u'body', u'name', u'j'] [u'init', u'declarations', u'body', u'type', u'BinaryExpression'] [u'left', u'init', u'declarations', u'body', u'type', u'Identifier'] [u'left', u'init', u'declarations', u'body', u'name', u'i'] [u'declarations', u'body', u'type', u'VariableDeclarator'] [u'id', u'declarations', u'body', u'type', u'Identifier'] [u'id', u'declarations', u'body', u'name', u'answer'] [u'body', u'type', u'VariableDeclaration'] [u'type', u'Program']

Hans Then · Answer

辞書をたどるだけなら、辞書を取り、その要素を再帰的にたどる再帰walk関数を使用することをお勧めします。このようなもの：

def walk(node): for key, item in node.items(): if item is a collection: walk(item) else: It is a leaf, do your thing

また、要素の検索、または特定の基準に合格する複数の要素のクエリを行う場合は、 jsonpath モジュールをご覧ください。

danza · Answer

独自のパーサーを作成する代わりに、タスクに応じて、標準ライブラリjsonモジュールからエンコーダーとデコーダーを拡張できます。

カスタムクラスに属するオブジェクトをjsonにエンコードする必要がある場合は特にこれをお勧めします。 JSONの文字列表現でも実行できる操作を実行する必要がある場合は、JSONEncoder（）。iterencodeの反復処理も検討してください

両方の参照は http://docs.python.org/2/library/json.html#encoders-and-decoders です

Blckknght · Answer

データの意味がわかっている場合は、parse関数を作成して、ネストされたコンテナーをカスタム型のオブジェクトのツリーに変換することをお勧めします。次に、これらのカスタムオブジェクトのメソッドを使用して、データを処理するために必要なことをすべて行います。

サンプルのデータ構造では、Program、VariableDeclaration、VariableDeclarator、Identifier、Literal、およびBinaryExpressionを作成できます。クラス、次にパーサーに次のようなものを使用します。

def parse(d): t = d[u"type"] if t == u"Program": body = [parse(block) for block in d[u"body"]] return Program(body) else if t == u"VariableDeclaration": kind = d[u"kind"] declarations = [parse(declaration) for declaration in d[u"declarations"]] return VariableDeclaration(kind, declarations) else if t == u"VariableDeclarator": id = parse(d[u"id"]) init = parse(d[u"init"]) return VariableDeclarator(id, init) else if t == u"Identifier": return Identifier(d[u"name"]) else if t == u"Literal": return Literal(d[u"value"]) else if t == u"BinaryExpression": operator = d[u"operator"] left = parse(d[u"left"]) right = parse(d[u"right"]) return BinaryExpression(operator, left, right) else: raise ValueError("Invalid data structure.")

Fabiano Silos · Answer

多分助けることができます：

def walk(d): global path for k,v in d.items(): if isinstance(v, str) or isinstance(v, int) or isinstance(v, float): path.append(k) print "{}={}".format(".".join(path), v) path.pop() Elif v is None: path.append(k) ## do something special path.pop() Elif isinstance(v, dict): path.append(k) walk(v) path.pop() else: print "###Type {} not recognized: {}.{}={}".format(type(v), ".".join(path),k, v) mydict = {'Other': {'Stuff': {'Here': {'Key': 'Value'}}}, 'root1': {'address': {'country': 'Brazil', 'city': 'Sao', 'x': 'Pinheiros'}, 'surname': 'Fabiano', 'name': 'Silos', 'height': 1.9}, 'root2': {'address': {'country': 'Brazil', 'detail': {'neighbourhood': 'Central'}, 'city': 'Recife'}, 'surname': 'My', 'name': 'Friend', 'height': 1.78}} path = [] walk(mydict)

次のような出力が生成されます。

Other.Stuff.Here.Key=Value root1.height=1.9 root1.surname=Fabiano root1.name=Silos root1.address.country=Brazil root1.address.x=Pinheiros root1.address.city=Sao root2.height=1.78 root2.surname=My root2.name=Friend root2.address.country=Brazil root2.address.detail.neighbourhood=Central root2.address.city=Recife

BurAk · Answer

上記のソリューションへの追加（リストを含むJSONを処理するため）

#!/usr/bin/env python import json def walk(d): global path for k,v in d.items(): if isinstance(v, str) or isinstance(v, int) or isinstance(v, float): path.append(k) print("{}={}".format(".".join(path), v)) path.pop() Elif v is None: path.append(k) # do something special path.pop() Elif isinstance(v, list): path.append(k) for v_int in v: walk(v_int) path.pop() Elif isinstance(v, dict): path.append(k) walk(v) path.pop() else: print("###Type {} not recognized: {}.{}={}".format(type(v), ".".join(path),k, v)) with open('abc.json') as f: myjson = json.load(f) path = [] walk(myjson)