ウィキペディアなどのように、大量のデータセットを含む事前トレーニング済みのdoc2vecモデルはありますか?
いいものは知りません。 このプロジェクト からリンクされているものがありますが、
長い時間とかなりの量の作業RAMが必要ですが、gensimに含まれているWikipediaからのDoc2Vec
モデルの作成を示すJupyterノートブックがあります。
https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-wikipedia.ipynb
したがって、私はあなたの試みの間違いを修正することをお勧めします。 (そして、モデルの作成に成功し、他の人のためにそれを文書化したい場合、他の人が再利用できるようにどこかにアップロードすることができます。)
はい!私はこれで2つの事前訓練されたdoc2vecモデルを見つけることができました link
しかし、ツイートでトレーニングされた事前トレーニング済みのdoc2vecモデルはまだ見つかりませんでした