web-dev-qa-db-ja.com

gensim Word2vecで複数のモデルファイルが作成されるのはなぜですか?

Word2vecモデル(ネガティブサンプリングのスキップグラム)を作成しようとすると、次のように3つのファイルが出力されました。

Word2vec (File)
Word2vec.syn1nef.npy (NPY file)
Word2vec.wv.syn0.npy (NPY file)

Word2vecでの以前のテスト例のように、なぜこれが発生するのか心配です。受け取ったモデルは1つだけです(npyファイルはありません)。

私を助けてください。

14
user8871463

より大きな内部ベクトル配列を持つモデルは、Python 'pickle'を介して単一のファイルに保存できないため、特定のしきい値を超えると、gensim save()メソッドは補助を格納しますnumpy配列のより効率的なraw形式(_.npy_形式)を使用した、個別のファイル内の配列。

ルートモデルのファイル名を指定するだけで、モデルをload()することができます。補助配列が必要な場合、ロードコードはサイドファイルを検索します-それらがルートファイルの横に保持されている限り。したがって、モデルを別の場所に移動するときは、同じルートファイル名を持つすべてのファイルを一緒に保持するようにしてください。

27
gojomo