英語の有効なすべての単語のデータベースが必要です。 /usr/share/dict/words
ファイルをチェックしましたが、含まれている単語は10万語未満です。ウィキペディアによると、英語には475k語があります。完全なリスト(アメリカのスペル)はどこで入手できますか?
また、アジアやヨーロッパの言語など、他の言語の単語も提供する単一のWebサイトはありますか?
編集:追加するのを忘れた、名前などは必要ありません、有効な英語の単語だけです。
必要なものは infochimps.org で見つけることができます。
無料でダウンロードできる350,000の単純な(つまり、非複合)単語のリストがあります。
他の言語については、ウィクショナリーを調べてみてください。ここにすべての データベースバックアップ へのリンクがあります-情報はほとんど整理されていませんが、言語があれば、SQL形式でデータをダウンロードできます。
私は http://wordlist.sourceforge.net/ が表示されていませんが、このようなものを探していた場合にそこから始めます(そして、私はこの質問につまずいたときでした) )。
あなたがそこに欲しいものを見つけることができず、あなたが欲しいものが英語の単語のリストである場合、あなたはおそらくあなたがそれが何であるかを認識する方法を説明するために余分な時間を費やす必要があります。
「完全な」リストのようなものはありません。人によって測定方法は異なります。たとえば、スラング、新語、複数単語のフレーズ、攻撃的な用語、外国語、動詞の活用などがあります。一部の人々は数えさえしています 百万語 !そのため、Wordリストで何をしたいかを決める必要があります。
*spell
en-GB辞書 Mozilla、OpenOffice、その他の多くのソフトウェアで使用されているものを確認できます。
このリストが何のために必要なのかを言わなかった。パスワードチェックのブラックリストとして使用されるもので十分な場合は、 cracklib が適している可能性があります。 150万語以上が含まれています。