spaCy
を使用してNERモデルをトレーニングし、場所、(人)名、組織を特定しようとしています。 spaCy
がテキスト内のエンティティをどのように認識するかを理解しようとしていますが、答えを見つけることができませんでした。 Githubの この問題 および この例 から、spaCyは、POSタグ、プレフィックス、サフィックス、その他の文字や単語など、テキストに存在する多くの機能を使用しているようです。平均化されたパーセプトロンをトレーニングするためのテキスト内のベースの機能。
ただし、コードのどこにもspaCy
がGLoVe埋め込みを使用しているようには見えません(ただし、GLoVeコーパスに存在する場合、文/ドキュメント内の各単語にGLoVe埋め込みがあるように見えます)。
私の質問は-
spaCy
がWordベクトルをどのように使用しているかを知ることができますか?Cythonコードを調べてみましたが、ラベリングシステムがWordの埋め込みを使用しているかどうかがわかりません。