PythonのNetworkxモジュールを使用してページランクアルゴリズムに取り組んでいます。リストの辞書があります。辞書のキーはページのタイトルであり、その値はそのページで参照されているすべてのタイトルです。
したがって、視覚化を作成するために、私は最初にこれを行いました:
G = nx.DiGraph()
G = nx.from_dict_of_lists(ref_dict)
ここで、ref_dict
は上記の辞書です。
グラフを作成した後、Networkxのwrite_edgelist
関数を使用してグラフをcsv形式で保存しています。
nx.write_edgelist(subG,'PageRanks2.csv')
ここに私の問題があります。 csvファイルはエッジを次のように保存しています。
node1 node2 {} node1 node3 {}
このファイルをGephiで直接使用している場合、{}はノードとして扱われ、それに応じて視覚化が表示されます。では、networkxグラフを保存して視覚化するのに最適な形式は何でしょうか。
Nx.write_gexf(G、 "test.gexf")のようなwrite_gexf関数を使用し、Gephiを使用してファイルを開くと、getphiに表示されます。
data
引数を指定して、networkxに{}
を追加しないように指示できます。
nx.write_edgelist(subG,'PageRanks2.csv', data=False)
Networkxとgephyの両方がサポートする他の形式(GraphMLなど)があり、データに属性が関連付けられている場合は、はるかに複雑なデータ視覚化タスクを実行できます。