多くのデータ構造は、"left-child、right-sibling"と呼ばれる表現を使用して、多分木を二分木として格納します。表現。これは何を意味するのでしょうか?なぜあなたはそれを使うのですか?
左子、右兄弟表現(LCRS)は、多方向ツリー(ツリー)をエンコードする方法です。 二分木(各ノードができるツリー構造)を使用して、各ノードが任意の数の子を持つことができる構造)最大で2人の子供がいます)。
この表現がどのように機能するかを動機付けるために、次のような単純な多方向ツリーを検討することから始めましょう。
A
//|\ \
/ / | \ \
B C D E F
| /|\ / \
G H I J K L
(低品質の謝罪ASCIIアートワーク!)
このツリー構造では、ツリー内の任意のノードからその子のいずれかに下向きにナビゲートできます。たとえば、AからB、AからC、AからDなどに移行できます。
このようなツリーでノードを表現したい場合は、通常、ここでこのようなノード構造/ノードクラスを使用します(C++で記述)。
struct Node {
DataType value;
std::vector<Node*> children;
};
LCRS表現では、各ノードが最大2つのポインターを必要とする方法で多方向ツリーを表現します。これを行うために、ツリーの形状を少し変更します。ツリー内の各ノードにすべての子へのポインターを格納させるのではなく、各ノードにその子の1つ(LCRSでは左端の子)へのポインターのみを格納させることにより、ツリーを少し異なる方法で構造化します。次に、各ノードに、同じ親ノードの子であるツリー内の次のノードである、その右の兄弟へのポインターを格納させます。上記のツリーの場合、次のようにツリーを表すことができます。
A
/
/
/
B -> C -> D -> E -> F
/ / /
G H->I->J K->L
この新しい構造では、親ノードからそのk番目の子(ゼロインデックス)にナビゲートできることに注意してください。そのための手順は次のとおりです。
たとえば、ルートノードAの3番目(インデックスがゼロの子)を見つけるには、左端の子(B)に降りてから、3つの右リンク(B、C、D、最後にEにアクセス)をたどります。次に、ノードAの3番目の子を保持するEのノードに到達します。
この方法でツリーを表現する主な理由は、どのノードにも任意の数の子が存在する場合でも、表現には各ノードに最大2つのポインターが必要であるためです。1つは左端の子を格納し、もう1つは右の兄弟を格納します。その結果、はるかに単純なノード構造を使用して多方向ツリーを格納できます。
struct Node {
DataType data;
Node* leftChild;
Node* rightSibling;
};
このノード構造は、バイナリツリー内のノードとまったく同じ形状です(データと2つのポインター)。その結果、LCRS表現により、ノードごとに2つのポインターを使用するだけで、任意の多方向ツリーを表現できます。
ここで、マルチウェイツリーの2つの異なる表現の時間と空間の複雑さと、その上でのいくつかの基本的な操作を見てみましょう。
最初の「子の動的配列」表現に必要な合計スペース使用量を確認することから始めましょう。 nノードツリーの合計メモリ使用量はどれくらいになりますか?まあ、私たちは次のことを知っています:
各ノードは、子の数に関係なく、格納されている生データ用のスペース(sizeof(data))と動的配列のスペースオーバーヘッドに貢献します。動的配列には(通常)1つのポインター(割り当てられた配列を指す)、動的配列の要素の総数を表す1つのマシンワード、および(オプションで)配列の割り当てられた容量を表す1つのマシンワードが格納されます。これは、各ノードがsizeof(Data)+ sizeof(Node *)+ 2 * sizeof(machine Word)スペースを占めることを意味します。
ツリー内のn個のノードには親があるため、ツリー内のすべての動的配列全体で、子へのn-1個のポインターがあります。これにより、(n --1)* sizeof(Node *)係数が追加されます。
したがって、合計スペース使用量は次のようになります。
n・(sizeof(Data)+ sizeof(Node *)+ 2 * sizeof(machine Word))+(n --1)* sizeof(Node *)
= n * sizeof(Data)+(2n-1)* sizeof(Node *)+ 2n * sizeof(machine Word)
それでは、LCRSツリーと対比してみましょう。 LCRSツリーの各ノードは2つのポインター(2 * sizeof(Node *))と1つのデータ要素(sizeof(Data))を格納するため、その合計スペースは次のようになります。
n * sizeof(Data)+ 2n * sizeof(Node *)
そして、ここで勝利が見られます。割り当てられた配列サイズを追跡するために、2n * sizeof(machine Word)の追加メモリをnot格納していないことに注意してください。これは、LCRS表現が通常のマルチウェイツリーよりもかなり少ないメモリを使用することを意味します。
ただし、LCRSツリー構造の基本的な操作は、通常のマルチウェイツリーの対応する操作よりも時間がかかる傾向があります。具体的には、標準形式で表される多方向ツリー(各ノードは子ポインターの配列を格納します)では、1つのノードからそのk番目の子にナビゲートするのに必要な時間は、単一のポインターをたどるのに必要な時間で与えられます。一方、LCRS表現では、これを行うために必要な時間は、k + 1個のポインター(1個の左の子ポインター、次にk個の右の子ポインター)をたどるのに必要な時間で与えられます。その結果、ツリーの分岐係数が大きい場合、LCRSツリー構造でのルックアップの実行は、対応するマルチウェイツリー構造よりもはるかに遅くなる可能性があります。
したがって、LCRS表現は、データ構造のストレージスペースとアクセス時間の間に 時空間のトレードオフ を提供するものと考えることができます。 LCRS表現は、元のマルチウェイツリーよりもメモリオーバーヘッドが少なく、マルチウェイツリーはその各子の一定時間のルックアップを提供します。
LCRS表現には時空間のトレードオフが伴うため、LCRS表現は通常、次の2つの基準のいずれかが当てはまらない限り使用されません。
ケース(1)は、驚くほど巨大なマルチウェイツリーをメインメモリに格納する必要がある場合に発生する可能性があります。たとえば、頻繁に更新される多くの異なる種を含む 系統樹 を保存する必要がある場合は、LCRS表現が適切な場合があります。
ケース(2)は、ツリー構造が非常に特殊な方法で使用されている特殊なデータ構造で発生します。たとえば、多方向ツリーを使用する多くのタイプの ヒープデータ構造 は、LCRS表現を使用してスペースを最適化できます。これの主な理由は、ヒープデータ構造では、最も一般的な操作は
操作(1)は、LCRS表現で非常に効率的に実行できます。 LCRS表現では、ツリーのルートに右の子が存在することはありません(兄弟がないため)。したがって、ルートを削除するとは、ルートノードを剥がして、左側のサブツリーに降りることを意味します。そこから、残りのツリーの右の背骨を歩いて各ノードを順番に処理するだけで、各子の処理を実行できます。
操作(2)も非常に効率的に行うことができます。上から、LCRS表現では、ツリーのルートに正しい子がないことを思い出してください。したがって、次のように、LCRS表現で2つのツリーを結合するのは非常に簡単です。このような2本の木から始めます。
R1 R2
/ /
(children 1) (children 2)
この方法で木を融合することができます:
R1
/
R2
/ \
(children 2) (children 1)
これはO(1)時間で実行でき、非常に簡単です。LCRS表現にこのプロパティがあるという事実は、 ()などの多くのタイプのヒープ優先度キュー)を意味します二項ヒープ または ランクペアリングヒープ は通常、LCRSツリーとして表されます。
お役に立てれば!