ユーザーが英語の文字を使用するドメインパスワード監査を実行しようとしていますが、40%が北京語を話す可能性があるため、北京語で書かれた名前、フレーズ、または単語が多数あると予想されます(ただし、英語の文字セット)。
ハイブリッド攻撃を実行したいので、辞書リストを拡張して、英語以外のフレーズ/単語/名前を含めたいが、英語の文字セットを入力したいと考えています。
この説明に適合するリソース、またはそのような辞書/単語リストにアクセスできるリソースを知っている人はいますか?グーグルをしましたが、あまり見つかりませんでした。
入力に感謝します。
私は中国語を話しませんが、あなたのグーグル検索に使用する操作上の単語は「拼音」だと思います。これは、中国語のテキストをラテン文字にエンコードする公式の方法です(ただし、これだけではありません)。したがって、「拼音の北京語リスト」が必要です。
そのような用語で、私は このダウンロード可能な辞書 これは有望に見えます。の中に .u8
ファイル、次のような行が見つかります:
北極熊 北极熊 [bei3 ji2 xiong2] /polar bear/
角括弧の間に拼音の転写がある[
および]
。このファイルからワードリストを作成できるはずです。
単語ベースの辞書攻撃はアルファベット言語の慣習であり、中国語のような文字ベースの言語ではそれほど効果的ではないと思います。
ほとんどの漢字はそれ自体が「単語」と見なすことができ、中国人はしばしば単語ではなく文字の単位で考えます。たとえば、词典(「単語帳」、単語辞書)の代わりに字典(文字通り「文字帳」、文字辞書)を使用します。したがって、中国人が意味のある文字シーケンスを思い付くのは自然なことですが、Wordリストには表示されません(中国語版のpassw0rd
のようなものです)。
たとえば、トムの答えの例北极熊
は、北(北)、极(極、北をたどると極として理解される)、熊(熊)で構成されています。誰かがパスワードとして南极熊
(南極のクマ)を簡単に思い付く可能性がありますが、これは本物ではないため、どのWordリストにも表示されない可能性があります。同様に、ほとんどの人の名前は単語としては意味がなく、パスワードで使用する可能性が非常に高くなります。
より徹底的なアプローチは、拼音で可能なすべての文字の発音を考え出し、辞書でそれらを使用することです。これは、中国語のアルファベットを作成するようなものです。これは、一部のソースの「単語リスト」がはるかに小さい理由を説明している可能性があります。
もちろん、複数文字の単語を追加してプロセスを高速化することもできます。
Windowsに付属している中国語のIME(Input Method Editor)と、人気のあるサードパーティ製のIMEを調べる必要があります。ただし、これらはすべてほとんど同じように動作します。基本的に、単語を発音してラテン文字を入力して単語を入力すると、コンピューターが可能性のリストを表示し、メニューから1つを選択します。パスワードを書くとき、ほとんどの中国人は音を入力するだけです。 「xeixei」。