PythonでSciPy/Numpyを使用してスパース行列を連結する最も効率的な方法は何でしょうか?
ここで私は以下を使用しました:
>>> np.hstack((X, X2))
array([ <49998x70000 sparse matrix of type '<class 'numpy.float64'>'
with 1135520 stored elements in Compressed Sparse Row format>,
<49998x70000 sparse matrix of type '<class 'numpy.int64'>'
with 1135520 stored elements in Compressed Sparse Row format>],
dtype=object)
回帰で両方の予測子を使用したいのですが、現在の形式は明らかに私が探しているものではありません。以下を取得することは可能ですか?
<49998x1400000 sparse matrix of type '<class 'numpy.float64'>'
with 2271040 stored elements in Compressed Sparse Row format>
大きすぎてディープフォーマットに変換できません。
scipy.sparse.hstack
を使用できます。
from scipy.sparse import hstack
hstack((X, X2))
numpy.hstack
を使用すると、2つの疎行列オブジェクトを持つ配列が作成されます。