事前にトレーニングされたWord2vec
モデルを使用したいのですが、Pythonでロードする方法がわかりません。
このファイルはモデルファイル(703 MB)です。ここからダウンロードできます:
http://devmount.github.io/GermanWordEmbeddings/
ロードするだけ
import gensim
# Load pre-trained Word2Vec model.
model = gensim.models.Word2Vec.load("modelName.model")
これで、通常どおりモデルをトレーニングできます。また、保存して複数回再トレーニングできるようにしたい場合は、次のようにする必要があります。
model.train(//insert proper parameters here//)
"""
If you don't plan to train the model any further, calling
init_sims will make the model much more memory-efficient
If `replace` is set, forget the original vectors and only keep the normalized
ones = saves lots of memory!
replace=True if you want to reuse the model
"""
model.init_sims(replace=True)
# save the model for later use
# for loading, call Word2Vec.load()
model.save("modelName.model")