web-dev-qa-db-ja.com

パスワードクラッキング北京語単語英語文字セット

ユーザーが英語の文字を使用するドメインパスワード監査を実行しようとしていますが、40%が北京語を話す可能性があるため、北京語で書かれた名前、フレーズ、または単語が多数あると予想されます(ただし、英語の文字セット)。

ハイブリッド攻撃を実行したいので、辞書リストを拡張して、英語以外のフレーズ/単語/名前を含めたいが、英語の文字セットを入力したいと考えています。

この説明に適合するリソース、またはそのような辞書/単語リストにアクセスできるリソースを知っている人はいますか?グーグルをしましたが、あまり見つかりませんでした。

入力に感謝します。

1
nopnosrac

私は中国語を話しませんが、あなたのグーグル検索に使用する操作上の単語は「拼音」だと思います。これは、中国語のテキストをラテン文字にエンコードする公式の方法です(ただし、これだけではありません)。したがって、「拼音の北京語リスト」が必要です。

そのような用語で、私は このダウンロード可能な辞書 これは有望に見えます。の中に .u8ファイル、次のような行が見つかります:

 北極熊 北极熊 [bei3 ji2 xiong2] /polar bear/

角括弧の間に拼音の転写がある[および]。このファイルからワードリストを作成できるはずです。

3
Tom Leek

単語ベースの辞書攻撃はアルファベット言語の慣習であり、中国語のような文字ベースの言語ではそれほど効果的ではないと思います。

ほとんどの漢字はそれ自体が「単語」と見なすことができ、中国人はしばしば単語ではなく文字の単位で考えます。たとえば、词典(「単語帳」、単語辞書)の代わりに字典(文字通り「文字帳」、文字辞書)を使用します。したがって、中国人が意味のある文字シーケンスを思い付くのは自然なことですが、Wordリストには表示されません(中国語版のpassw0rdのようなものです)。

たとえば、トムの答えの例北极熊は、北(北)、极(極、北をたどると極として理解される)、熊(熊)で構成されています。誰かがパスワードとして南极熊(南極のクマ)を簡単に思い付く可能性がありますが、これは本物ではないため、どのWordリストにも表示されない可能性があります。同様に、ほとんどの人の名前は単語としては意味がなく、パスワードで使用する可能性が非常に高くなります。

より徹底的なアプローチは、拼音で可能なすべての文字の発音を考え出し、辞書でそれらを使用することです。これは、中国語のアルファベットを作成するようなものです。これは、一部のソースの「単語リスト」がはるかに小さい理由を説明している可能性があります。

もちろん、複数文字の単語を追加してプロセスを高速化することもできます。

0
billc.cn

Windowsに付属している中国語のIME(Input Method Editor)と、人気のあるサードパーティ製のIMEを調べる必要があります。ただし、これらはすべてほとんど同じように動作します。基本的に、単語を発音してラテン文字を入力して単語を入力すると、コンピューターが可能性のリストを表示し、メニューから1つを選択します。パスワードを書くとき、ほとんどの中国人は音を入力するだけです。 「xeixei」。

0
user25221