web-dev-qa-db-ja.com

入れ子になったJSONオブジェクトを平坦化/非平坦化する最速の方法

複雑な/ネストされたJSONオブジェクトを平坦化および非平坦化するためにいくつかのコードを一緒に投げました。動作しますが、少し遅いです(「長いスクリプト」の警告をトリガーします)。

平坦化された名前には、「。」が必要です。デリミタおよび配列の[INDEX]として。

例:

un-flattened | flattened
---------------------------
{foo:{bar:false}} => {"foo.bar":false}
{a:[{b:["c","d"]}]} => {"a[0].b[0]":"c","a[0].b[1]":"d"}
[1,[2,[3,4],5],6] => {"[0]":1,"[1].[0]":2,"[1].[1].[0]":3,"[1].[1].[1]":4,"[1].[2]":5,"[2]":6}

〜使用例をシミュレートするベンチマークを作成しました http://jsfiddle.net/WSzec/

  • ネストされたJSONオブジェクトを取得する
  • 平らにする
  • それに目を通し、平坦化されている間に変更する可能性
  • 元のネストされたフォーマットに戻して出荷する

より高速なコードが欲しい:明確にするために、JSFiddleベンチマークを完了するコード( http://jsfiddle.net/WSzec/ )大幅に高速(〜20%+ニース)IE 9 +、FF 24+、およびChrome 29+で。

関連するJavaScriptコードは次のとおりです。Current Fastest: http://jsfiddle.net/WSzec/6/

JSON.unflatten = function(data) {
    "use strict";
    if (Object(data) !== data || Array.isArray(data))
        return data;
    var result = {}, cur, prop, idx, last, temp;
    for(var p in data) {
        cur = result, prop = "", last = 0;
        do {
            idx = p.indexOf(".", last);
            temp = p.substring(last, idx !== -1 ? idx : undefined);
            cur = cur[prop] || (cur[prop] = (!isNaN(parseInt(temp)) ? [] : {}));
            prop = temp;
            last = idx + 1;
        } while(idx >= 0);
        cur[prop] = data[p];
    }
    return result[""];
}
JSON.flatten = function(data) {
    var result = {};
    function recurse (cur, prop) {
        if (Object(cur) !== cur) {
            result[prop] = cur;
        } else if (Array.isArray(cur)) {
             for(var i=0, l=cur.length; i<l; i++)
                 recurse(cur[i], prop ? prop+"."+i : ""+i);
            if (l == 0)
                result[prop] = [];
        } else {
            var isEmpty = true;
            for (var p in cur) {
                isEmpty = false;
                recurse(cur[p], prop ? prop+"."+p : p);
            }
            if (isEmpty)
                result[prop] = {};
        }
    }
    recurse(data, "");
    return result;
}

EDIT 1上記を@Bergiの実装に変更しました。これは現在最速です。余談ですが、「regex.exec」の代わりに「.indexOf」を使用すると、FFでは約20%高速になりますが、Chromeでは20%遅くなります。それで、私は正規表現をより簡単にしているので、これを使い続けます(indexOfを使用して正規表現を置き換える試みです http://jsfiddle.net/WSzec/2/ )。

EDIT 2@Bergiのアイデアに基づいて、高速の非正規表現バージョンを作成できました(FFでは3倍、Chromeでは〜10%高速) 。 http://jsfiddle.net/WSzec/6/ この(現在の)実装では、キー名の規則は単純であり、キーは整数で始まったりピリオドを含むことはできません。

例:

  • {"foo":{"bar":[0]}} => {"foo.bar.0":0}

EDIT 3@AaditMShahのインラインパス解析アプローチ(String.splitではなく)を追加すると、フラット化されていないパフォーマンスが向上しました。全体的なパフォーマンスの改善に非常に満足しています。

最新のjsfiddleおよびjsperf:

http://jsfiddle.net/WSzec/14/

http://jsperf.com/flatten-un-flatten/4

136
Louis Ricci

これは私のはるかに短い実装です:

Object.unflatten = function(data) {
    "use strict";
    if (Object(data) !== data || Array.isArray(data))
        return data;
    var regex = /\.?([^.\[\]]+)|\[(\d+)\]/g,
        resultholder = {};
    for (var p in data) {
        var cur = resultholder,
            prop = "",
            m;
        while (m = regex.exec(p)) {
            cur = cur[prop] || (cur[prop] = (m[2] ? [] : {}));
            prop = m[2] || m[1];
        }
        cur[prop] = data[p];
    }
    return resultholder[""] || resultholder;
};

flattenはあまり変更されていません(そして、これらのisEmptyのケースが本当に必要かどうかはわかりません):

Object.flatten = function(data) {
    var result = {};
    function recurse (cur, prop) {
        if (Object(cur) !== cur) {
            result[prop] = cur;
        } else if (Array.isArray(cur)) {
             for(var i=0, l=cur.length; i<l; i++)
                 recurse(cur[i], prop + "[" + i + "]");
            if (l == 0)
                result[prop] = [];
        } else {
            var isEmpty = true;
            for (var p in cur) {
                isEmpty = false;
                recurse(cur[p], prop ? prop+"."+p : p);
            }
            if (isEmpty && prop)
                result[prop] = {};
        }
    }
    recurse(data, "");
    return result;
}

一緒に、 ベンチマークを実行 約半分の時間(Opera 12.16:〜1900msの代わりに〜900ms、Chrome 29:〜1600msの代わりに〜800ms)。

185
Bergi

JSON変数flattenおよびunflattenに2つの関数を作成しました。


JSONオブジェクトのフラット化

var flatten = (function (isArray, wrapped) {
    return function (table) {
        return reduce("", {}, table);
    };

    function reduce(path, accumulator, table) {
        if (isArray(table)) {
            var length = table.length;

            if (length) {
                var index = 0;

                while (index < length) {
                    var property = path + "[" + index + "]", item = table[index++];
                    if (wrapped(item) !== item) accumulator[property] = item;
                    else reduce(property, accumulator, item);
                }
            } else accumulator[path] = table;
        } else {
            var empty = true;

            if (path) {
                for (var property in table) {
                    var item = table[property], property = path + "." + property, empty = false;
                    if (wrapped(item) !== item) accumulator[property] = item;
                    else reduce(property, accumulator, item);
                }
            } else {
                for (var property in table) {
                    var item = table[property], empty = false;
                    if (wrapped(item) !== item) accumulator[property] = item;
                    else reduce(property, accumulator, item);
                }
            }

            if (empty) accumulator[path] = table;
        }

        return accumulator;
    }
}(Array.isArray, Object));

パフォーマンス

  1. Operaの現在のソリューションよりも高速です。現在のソリューションは、Operaで26%遅くなります。
  2. Firefoxの現在のソリューションよりも高速です。現在のソリューションは、Firefoxで9%遅くなります。
  3. Chromeの現在のソリューションよりも高速です。現在のソリューションは、Chromeで29%低速です。

JSONオブジェクトの非平坦化

function unflatten(table) {
    var result = {};

    for (var path in table) {
        var cursor = result, length = path.length, property = "", index = 0;

        while (index < length) {
            var char = path.charAt(index);

            if (char === "[") {
                var start = index + 1,
                    end = path.indexOf("]", start),
                    cursor = cursor[property] = cursor[property] || [],
                    property = path.slice(start, end),
                    index = end + 1;
            } else {
                var cursor = cursor[property] = cursor[property] || {},
                    start = char === "." ? index + 1 : index,
                    bracket = path.indexOf("[", start),
                    dot = path.indexOf(".", start);

                if (bracket < 0 && dot < 0) var end = index = length;
                else if (bracket < 0) var end = index = dot;
                else if (dot < 0) var end = index = bracket;
                else var end = index = bracket < dot ? bracket : dot;

                var property = path.slice(start, end);
            }
        }

        cursor[property] = table[path];
    }

    return result[""];
}

パフォーマンス

  1. Operaの現在のソリューションよりも高速です。現在のソリューションはOperaで5%遅いです。
  2. Firefoxの現在のソリューションよりも低速です。私のソリューションはFirefoxで26%遅くなります。
  3. Chromeの現在のソリューションよりも低速です。私の解決策はChromeで6%遅くなります。

JSONオブジェクトを平坦化および非平坦化

全体的に、私のソリューションは現在のソリューションと同等かそれ以上のパフォーマンスを発揮します。

パフォーマンス

  1. Operaの現在のソリューションよりも高速です。現在のソリューションは、Operaで21%低速です。
  2. Firefoxの現在のソリューションと同じくらい高速です。
  3. Firefoxの現在のソリューションよりも高速です。現在のソリューションは、Chromeで20%遅くなります。

出力形式

平坦化されたオブジェクトは、オブジェクトプロパティにドット表記を使用し、配列インデックスにブラケット表記を使用します。

  1. {foo:{bar:false}} => {"foo.bar":false}
  2. {a:[{b:["c","d"]}]} => {"a[0].b[0]":"c","a[0].b[1]":"d"}
  3. [1,[2,[3,4],5],6] => {"[0]":1,"[1][0]":2,"[1][1][0]":3,"[1][1][1]":4,"[1][2]":5,"[2]":6}

私の意見では、この形式はドット表記のみを使用するよりも優れています。

  1. {foo:{bar:false}} => {"foo.bar":false}
  2. {a:[{b:["c","d"]}]} => {"a.0.b.0":"c","a.0.b.1":"d"}
  3. [1,[2,[3,4],5],6] => {"0":1,"1.0":2,"1.1.0":3,"1.1.1":4,"1.2":5,"2":6}

利点

  1. オブジェクトの平坦化は、現在のソリューションよりも高速です。
  2. オブジェクトの平坦化と非平坦化は、現在のソリューションと同じかそれより高速です。
  3. フラット化されたオブジェクトは、読みやすいようにドット表記とブラケット表記の両方を使用します。

欠点

  1. ほとんどの場合(すべてではありませんが)、オブジェクトの平坦化は現在のソリューションよりも遅くなります。

現在の JSFiddle demo は、出力として次の値を与えました。

Nested : 132175 : 63
Flattened : 132175 : 564
Nested : 132175 : 54
Flattened : 132175 : 508

更新された JSFiddle demo は、出力として次の値を提供しました。

Nested : 132175 : 59
Flattened : 132175 : 514
Nested : 132175 : 60
Flattened : 132175 : 451

私はそれが何を意味するのかよく分からないので、jsPerfの結果に固執します。結局、jsPerfはパフォーマンスベンチマークユーティリティです。 JSFiddleはそうではありません。

19
Aadit M Shah

@Bergiのコードに基づいて、平坦化する//平坦化を解除する単純なWebページを作成しました。

http://fiddle.jshell.net/blowsie/S2hsS/show/light/

enter image description here

JSON.flatten = function (data) {
    var result = {};

    function recurse(cur, prop) {
        if (Object(cur) !== cur) {
            result[prop] = cur;
        } else if (Array.isArray(cur)) {
            for (var i = 0, l = cur.length; i < l; i++)
            recurse(cur[i], prop + "[" + i + "]");
            if (l == 0) result[prop] = [];
        } else {
            var isEmpty = true;
            for (var p in cur) {
                isEmpty = false;
                recurse(cur[p], prop ? prop + "." + p : p);
            }
            if (isEmpty && prop) result[prop] = {};
        }
    }
    recurse(data, "");
    return result;
};
JSON.unflatten = function (data) {
    "use strict";
    if (Object(data) !== data || Array.isArray(data)) return data;
    var regex = /\.?([^.\[\]]+)|\[(\d+)\]/g,
        resultholder = {};
    for (var p in data) {
        var cur = resultholder,
            prop = "",
            m;
        while (m = regex.exec(p)) {
            cur = cur[prop] || (cur[prop] = (m[2] ? [] : {}));
            prop = m[2] || m[1];
        }
        cur[prop] = data[p];
    }
    return resultholder[""] || resultholder;
};


$("#process").click(function () {
    var flatten = $("#flatten").is(":checked");

    var result = flatten ? JSON.stringify(JSON.flatten(JSON.parse($("#input").val())), null, "\t") : JSON.stringify(JSON.unflatten(JSON.parse($("#input").val())), null, "\t")

    $("#output").val(result);
    $("#formatted").text(result);
});
body {
    padding:20px;
}
<link href="http://netdna.bootstrapcdn.com/bootstrap/3.1.1/css/bootstrap.min.css" rel="stylesheet"/>
<h1>JSON Flattener</h1>

<div class="form-group">
    <label>Mode:</label>
    <label class="radio-inline">
        <input id="flatten" name="mode" type="radio" value="flatten" checked="">Flatten</label>
    <label class="radio-inline">
        <input name="mode" type="radio" value="unflatten">Unflatten</label>
</div>
<div class="form-group">
    <label>Input:</label>
    <input class="form-control" type="text" name="" id="input">
</div>
<div class="form-group">
    <label>Output:</label>
    <textarea class="form-control" name="" id="output" cols="30" rows="5"></textarea>
</div>
<button id="process" class="btn btn-primary">Process</button>
<br/>
<br/>
<label>Formatted:</label>
<pre><code id="formatted"></code></pre>
10
Blowsie

3½年後...

私自身のプロジェクトでは、JSONオブジェクトを mongoDBドット表記 でフラット化し、簡単な解決策を考え出しました。

/**
 * Recursively flattens a JSON object using dot notation.
 *
 * NOTE: input must be an object as described by JSON spec. Arbitrary
 * JS objects (e.g. {a: () => 42}) may result in unexpected output.
 * MOREOVER, it removes keys with empty objects/arrays as value (see
 * examples bellow).
 *
 * @example
 * // returns {a:1, 'b.0.c': 2, 'b.0.d.e': 3, 'b.1': 4}
 * flatten({a: 1, b: [{c: 2, d: {e: 3}}, 4]})
 * // returns {a:1, 'b.0.c': 2, 'b.0.d.e.0': true, 'b.0.d.e.1': false, 'b.0.d.e.2.f': 1}
 * flatten({a: 1, b: [{c: 2, d: {e: [true, false, {f: 1}]}}]})
 * // return {a: 1}
 * flatten({a: 1, b: [], c: {}})
 *
 * @param obj item to be flattened
 * @param {Array.string} [prefix=[]] chain of prefix joined with a dot and prepended to key
 * @param {Object} [current={}] result of flatten during the recursion
 *
 * @see https://docs.mongodb.com/manual/core/document/#dot-notation
 */
function flatten (obj, prefix, current) {
  prefix = prefix || []
  current = current || {}

  // Remember kids, null is also an object!
  if (typeof (obj) === 'object' && obj !== null) {
    Object.keys(obj).forEach(key => {
      this.flatten(obj[key], prefix.concat(key), current)
    })
  } else {
    current[prefix.join('.')] = obj
  }

  return current
}

機能および/または注意事項

  • JSONオブジェクトのみを受け入れます。したがって、{a: () => {}}のようなものを渡すと、必要なものが得られない可能性があります。
  • 空の配列とオブジェクトを削除します。したがって、この{a: {}, b: []}{}にフラット化されます。
9
Yan Foto

上記の回答よりも遅い(約1000ミリ秒)実行する別のアプローチがありますが、興味深いアイデアがあります:-)

各プロパティチェーンを反復処理する代わりに、最後のプロパティを選択し、残りのルックアップテーブルを使用して中間結果を保存します。このルックアップテーブルは、プロパティチェーンがなくなり、すべての値が連結されていないプロパティに存在するまで繰り返されます。

JSON.unflatten = function(data) {
    "use strict";
    if (Object(data) !== data || Array.isArray(data))
        return data;
    var regex = /\.?([^.\[\]]+)$|\[(\d+)\]$/,
        props = Object.keys(data),
        result, p;
    while(p = props.shift()) {
        var m = regex.exec(p),
            target;
        if (m.index) {
            var rest = p.slice(0, m.index);
            if (!(rest in data)) {
                data[rest] = m[2] ? [] : {};
                props.Push(rest);
            }
            target = data[rest];
        } else {
            target = result || (result = (m[2] ? [] : {}));
        }
        target[m[2] || m[1]] = data[p];
    }
    return result;
};

現在、テーブルのdata入力パラメーターを使用し、その上に多くのプロパティを配置します-非破壊バージョンも可能です。たぶん、賢いlastIndexOfの使用は、正規表現よりも優れたパフォーマンスを発揮します(正規表現エンジンに依存します)。

実際の動作を参照

6
Bergi

ES6バージョン:

const flatten = (obj, path = '') => {        
    if (!(obj instanceof Object)) return {[path.replace(/\.$/g, '')]:obj};

    return Object.keys(obj).reduce((output, key) => {
        return obj instanceof Array ? 
             {...output, ...flatten(obj[key], path +  '[' + key + '].')}:
             {...output, ...flatten(obj[key], path + key + '.')};
    }, {});
}

例:

console.log(flatten({a:[{b:["c","d"]}]}));
console.log(flatten([1,[2,[3,4],5],6]));
6
Guy

https://github.com/hughsk/flat を使用できます

ネストされたJavascriptオブジェクトを取得してフラット化するか、区切られたキーでオブジェクトをフラット化解除します。

ドキュメントの例

var flatten = require('flat')

flatten({
    key1: {
        keyA: 'valueI'
    },
    key2: {
        keyB: 'valueII'
    },
    key3: { a: { b: { c: 2 } } }
})

// {
//   'key1.keyA': 'valueI',
//   'key2.keyB': 'valueII',
//   'key3.a.b.c': 2
// }


var unflatten = require('flat').unflatten

unflatten({
    'three.levels.deep': 42,
    'three.levels': {
        nested: true
    }
})

// {
//     three: {
//         levels: {
//             deep: 42,
//             nested: true
//         }
//     }
// }
3
Tom Esterez

このコードは、JSONオブジェクトを再帰的にフラット化します。

コードにタイミングメカニズムを含めたところ、1ミリ秒が得られましたが、それが最も正確かどうかはわかりません。

            var new_json = [{
              "name": "fatima",
              "age": 25,
              "neighbour": {
                "name": "taqi",
                "location": "end of the street",
                "property": {
                  "built in": 1990,
                  "owned": false,
                  "years on market": [1990, 1998, 2002, 2013],
                  "year short listed": [], //means never
                }
              },
              "town": "Mountain View",
              "state": "CA"
            },
            {
              "name": "qianru",
              "age": 20,
              "neighbour": {
                "name": "joe",
                "location": "opposite to the park",
                "property": {
                  "built in": 2011,
                  "owned": true,
                  "years on market": [1996, 2011],
                  "year short listed": [], //means never
                }
              },
              "town": "Pittsburgh",
              "state": "PA"
            }]

            function flatten(json, flattened, str_key) {
                for (var key in json) {
                  if (json.hasOwnProperty(key)) {
                    if (json[key] instanceof Object && json[key] != "") {
                      flatten(json[key], flattened, str_key + "." + key);
                    } else {
                      flattened[str_key + "." + key] = json[key];
                    }
                  }
                }
            }

        var flattened = {};
        console.time('flatten'); 
        flatten(new_json, flattened, "");
        console.timeEnd('flatten');

        for (var key in flattened){
          console.log(key + ": " + flattened[key]);
        }

出力:

flatten: 1ms
.0.name: fatima
.0.age: 25
.0.neighbour.name: taqi
.0.neighbour.location: end of the street
.0.neighbour.property.built in: 1990
.0.neighbour.property.owned: false
.0.neighbour.property.years on market.0: 1990
.0.neighbour.property.years on market.1: 1998
.0.neighbour.property.years on market.2: 2002
.0.neighbour.property.years on market.3: 2013
.0.neighbour.property.year short listed: 
.0.town: Mountain View
.0.state: CA
.1.name: qianru
.1.age: 20
.1.neighbour.name: joe
.1.neighbour.location: opposite to the park
.1.neighbour.property.built in: 2011
.1.neighbour.property.owned: true
.1.neighbour.property.years on market.0: 1996
.1.neighbour.property.years on market.1: 2011
.1.neighbour.property.year short listed: 
.1.town: Pittsburgh
.1.state: PA
2
sfrizvi6

マイナーコードのリファクタリングと関数名前空間外への再帰関数の移動により、選択した回答に+/- 10-15%の効率を追加しました。

私の質問を参照してください: 名前空間化された関数は呼び出しごとに再評価されますか? ネストされた関数が遅くなる理由について。

function _flatten (target, obj, path) {
  var i, empty;
  if (obj.constructor === Object) {
    empty = true;
    for (i in obj) {
      empty = false;
      _flatten(target, obj[i], path ? path + '.' + i : i);
    }
    if (empty && path) {
      target[path] = {};
    }
  } 
  else if (obj.constructor === Array) {
    i = obj.length;
    if (i > 0) {
      while (i--) {
        _flatten(target, obj[i], path + '[' + i + ']');
      }
    } else {
      target[path] = [];
    }
  }
  else {
    target[path] = obj;
  }
}

function flatten (data) {
  var result = {};
  _flatten(result, data, null);
  return result;
}

ベンチマーク を参照してください。

1
jtrumbull

これが私のサイズの大きなオブジェクトで、Google Apps Scriptで2ミリ秒未満で実行されます。区切り文字にドットではなくダッシュを使用し、質問者の質問のように配列を特別に処理しませんが、これは私が使用したかったものです。

function flatten (obj) {
  var newObj = {};
  for (var key in obj) {
    if (typeof obj[key] === 'object' && obj[key] !== null) {
      var temp = flatten(obj[key])
      for (var key2 in temp) {
        newObj[key+"-"+key2] = temp[key2];
      }
    } else {
      newObj[key] = obj[key];
    }
  }
  return newObj;
}

例:

var test = {
  a: 1,
  b: 2,
  c: {
    c1: 3.1,
    c2: 3.2
  },
  d: 4,
  e: {
    e1: 5.1,
    e2: 5.2,
    e3: {
      e3a: 5.31,
      e3b: 5.32
    },
    e4: 5.4
  },
  f: 6
}

Logger.log("start");
Logger.log(JSON.stringify(flatten(test),null,2));
Logger.log("done");

出力例:

[17-02-08 13:21:05:245 CST] start
[17-02-08 13:21:05:246 CST] {
  "a": 1,
  "b": 2,
  "c-c1": 3.1,
  "c-c2": 3.2,
  "d": 4,
  "e-e1": 5.1,
  "e-e2": 5.2,
  "e-e3-e3a": 5.31,
  "e-e3-e3b": 5.32,
  "e-e4": 5.4,
  "f": 6
}
[17-02-08 13:21:05:247 CST] done
1
paulwal222

このライブラリを使用します。

npm install flat

使用法( https://www.npmjs.com/package/flat から):

平坦化:

    var flatten = require('flat')


    flatten({
        key1: {
            keyA: 'valueI'
        },
        key2: {
            keyB: 'valueII'
        },
        key3: { a: { b: { c: 2 } } }
    })

    // {
    //   'key1.keyA': 'valueI',
    //   'key2.keyB': 'valueII',
    //   'key3.a.b.c': 2
    // }

平坦化解除:

var unflatten = require('flat').unflatten

unflatten({
    'three.levels.deep': 42,
    'three.levels': {
        nested: true
    }
})

// {
//     three: {
//         levels: {
//             deep: 42,
//             nested: true
//         }
//     }
// }
0
o.z

上記のjsFiddlerを使用したプローブによると、現在選択されているものよりもわずかに速い、新しいバージョンのflatten case(これが必要です:))を追加したいと思います。さらに、私は個人的にこのスニペットをもう少し読みやすくしています。これはもちろん、マルチ開発者プロジェクトにとって重要です。

function flattenObject(graph) {
    let result = {},
        item,
        key;

    function recurr(graph, path) {
        if (Array.isArray(graph)) {
            graph.forEach(function (itm, idx) {
                key = path + '[' + idx + ']';
                if (itm && typeof itm === 'object') {
                    recurr(itm, key);
                } else {
                    result[key] = itm;
                }
            });
        } else {
            Reflect.ownKeys(graph).forEach(function (p) {
                key = path + '.' + p;
                item = graph[p];
                if (item && typeof item === 'object') {
                    recurr(item, key);
                } else {
                    result[key] = item;
                }
            });
        }
    }
    recurr(graph, '');

    return result;
}
0
GullerYA