web-dev-qa-db-ja.com

暗号化の解読に統計的手法はどの程度効果的ですか?

統計エンジンがオンライントランスレーターを実行する方法と、それらがどのように構築されるかを見ると、新しい言語を調べて statistical model を実行し、何を検索するのかがわかりますおそらくたとえばロシア語から英語への正しい翻訳。

確かに、暗号化はデータを「スクランブル」して「デスクランブル」コードを取得するためのモデル化された方法であるため、厳密には変換ではありません(これはmight難読化に似ています)。ただし、これらのエンジンが多くの言語のモデルを構築する能力を見ると、各言語が統計モデルの未発見の鍵と暗号のように見え始めるのがわかります。

この方法で統計モデルを使用して暗号化を解こうとする既知の攻撃はありますか?彼らは効果的ですか?彼らの欠点は何ですか?

2
Incognito

短縮版:

  • はい、既知の暗号文攻撃または統計分析を説明しています
  • それらは古い暗号システムまたは欠陥のある暗号システムで有効であり、新しい暗号システムの標準および基本的なテストキットと見なすことができます。
  • 彼らの欠点は、現代の暗号化システムがその特定の攻撃を阻止するように設計されており、その理論と実践は現時点ではかなりよく理解されていることです

蛇行バージョン:

言語翻訳は、1対1または1対数の音訳を、並べ替えて処理します。各言語には、明確な相関関係がある有限の辞書があり、各言語には、単語を入れる構造を定義するルールがあります。翻訳エンジンはこれらの相関関係に依存しています。

これは暗号化とはまったく異なります。暗号化では、クリアテキストと暗号文の間のそのようなすべての接続を数学的に解くことを目的としています。あなたが説明したことは、第二次世界大戦時代の暗号システムでうまく機能しましたが、今日はうまくいきませんでした。 Wikipediaを引用すると(常に危険だと私は知っています) " すべての最新の暗号は、暗号文のみの攻撃に対する保護を提供しようとします。新しい暗号設計標準の審査プロセスには、通常、何年もかかり、大規模なランダムノイズからの統計的逸脱のための暗号文の量

これは、統計分析が使用されていない、または成功できないと言っているのではありません。たとえば、WEPのいくつかの弱点 は統計攻撃を有効にして平文を回復します。 ただし、成功すると、暗号化設計者が通常よりも愚かなことをした場合として扱われます。最先端の攻撃テクニック。

編集-最後の文を補強するために、上にリンクされたWEP論文の結論から引用させてください:「[WEP]の問題は一部の暗号化プリミティブの誤解、したがってそれらを安全でない方法で組み合わせる。」へえ。

4
gowenfawr

この方法で統計モデルを使用して暗号化を解こうとする既知の攻撃はありますか?

はい。 gowenfawrが指摘したように、これらは通常、モノアルファベット置換暗号と呼ばれる古いクラスの暗号化アルゴリズムに対して効果的です。これらの暗号では、アルファベットの文字が記号と交換されます。同じ文字は常に同じ記号で置き換えられます。たとえば、すべてのaをiで置き換え、すべてのbをlで置き換えます。この単純な置換により、各文字の統計的性質が保持されます。モノアルファベット置換暗号を攻撃するには、使用されている元の言語と各文字の統計的頻度を知る必要があります。暗号文で最も一般的な記号を見つけて、元の言語で最も一般的な文字に置き換えます。英語の場合、最も一般的な文字はeです。

モノアルファベット置換からの次の進行は、多アルファベット置換です。このタイプの暗号は、アルファベットの表を使用して、プレーンテキストの文字の代わりにsymolを選択します。これは、置換を元の文字だけでなく、キーと文字の関数にすることで、統計的攻撃を効果的に鈍らせる可能性があります(キーが十分に長い場合)。

より現代的なアルゴリズムでは、各文字の暗号化が多くの入力の関数になり、統計パターンの検出が非常に困難になります。入力の1つは、通常はランダムデータの一部であるキーです。ランダム性を入力として使用すると、暗号分析者がパターンを検出する能力が鈍くなります。

ただし、統計分析は、暗号化されたデータの分析において役割を果たすことができます。これは通常、いわゆるサイドチャネル攻撃という形で発生します。サイドチャネルは、暗号化されたデータの送信の副作用であるデータの送信です。最近の論文 "Uncrypting Spoken Phrases in Encrypted VoIP Conversations" は、可変ビットレートエンコーディングが暗号化された音声データのサイドチャネルをどのように生成したかを説明しています。

可変ビットレートエンコーディング

音がデータに変換されるとき、それは情報のビットになります。すべての単語と音がそれらを表すために同じ量のデータを必要とするわけではありません。音声データを送信する1つの方法は、一定のビットレートです。 F音声エンコーダー(暗号化機能ではありません)は、音声をデータに変換し、暗号化して送信します。毎秒一定のビットレートでは、音の1秒ごとに同じ量のデータが生成されます。その1秒の間に生成されたサウンドが送信する必要があるビットよりも少ないビットを生成する場合、エンコーダーは残りのビットを無音で埋めます。したがって、固定ビットレートには意味のないデータが多数含まれています。可変ビットレートにより、エンコーダーは、各サンプル/サウンドのフレームのサイズによって、サウンドによって生成されたのと同じ数のビットを送信できます。一部の暗号化アルゴリズムは、プレーンテキストデータとまったく同じサイズの暗号化データを生成します。可変ビットレートエンコーディングで長さを維持する暗号化アルゴリズムを使用する場合、攻撃者は各サウンドサンプルの長さと連続するサンプルの長さを確認し、人々が話している方法に関する統計を使用していくつかのフレーズを選択できます。

それらは効果的ですか?彼らの欠点は何ですか?

統計は特別な場合に効果的です。統計の分類は、現在のコミュニケーションのより小さなコンポーネントであるスピーチとプレーンテキストに限定される傾向があるということです。

1
this.josh