web-dev-qa-db-ja.com

ライティングスタイルを匿名化する方法は何ですか?

誰かがオンラインで利用可能なライティングのサンプルを持っている特定の実在の人物である匿名のオンラインペルソナ(ブログやソーシャルメディアなど)を疑った場合、ライティングのスタイルを比較できると思います。これを防ぐ方法は何ですか?テクニックは匿名アカウントまたは識別可能なアカウントで実行する必要がありますか?

5
user187395

Javaと呼ばれる Anonymouth で書かれたプログラムがあり、これを支援します:

Anonymouthは、ユーザーが作成したドキュメントの匿名化を開始するために必要なツールと知識をユーザーに提供することを目的としたJavaベースのアプリケーションです。これは、JStyloライブラリ(PSALによって開発された作成者検出アプリケーション)を起動して、スタイルのパターンを検出し、スタイルを確認するためにユーザーが削除/追加する必要がある機能(単語の長さ、バイグラム、トライグラムなど)を決定することによって行われます。身元。

それだけでは、アノニマスの価値は限られています。筆跡分析を匿名化するには、言語学と文体学の基本的な理解が必要です。基本的なスタイル測定には、いわゆる5機能分析が含まれます。ここでは、5つの主要な書体スタイ​​ルの機能が分析されます(Wikipediaから言い換え):

  1. 字句的特徴-著者の語彙の選択である辞書の分析。人々が異なれば、使用する単語の比率も異なるため、非常にユニークなものになります。たとえば、私はWordtendを頻繁に使用する傾向があります。もし私が自分の書き込みを隠したいなら、私はそれを避ける必要があるでしょう。シンプルで短く、一般的な単語を使用すると、この機能の可能性を減らすことができます。

  2. 構文上の特徴-句読点、受動態の使用、文の複雑さなど、著者の書き方と文の構造の分析。標準的な書き方で可能な限りシンプルな文章を使用すると、この機能を弱めることができます。

  3. 構造的特徴-著者の作品構成の分析。これには、段落の長さ、間隔、インデント、オックスフォードコンマの使用などが含まれます。2番目の機能をあまり役に立たないようにするのと同じように、この機能をあまり役に立たないようにするには、自然に進化したスタイルを使用するのではなく、標準の書体を使用します。

  4. コンテンツ固有の機能-文章の主題にとって文脈上重要な言語の分析。例には、俗語である可能性のある俗語や頭字語の使用が含まれます。例えば。ボットネットの所有者のセットは、「C&C」、「CnC」、「C2」と言う人に簡単に分けることができます。

  5. 特異な機能-作者に固有のエラーやその他の文法上の要素の分析。これは、これまでで最もひどい機能の1つであり、多くの人々が自分の書き方によって匿名化される原因となっています。 1つの非匿名IDに加えられた小さな間違いは、匿名IDに引き継がれ、それらをリンクする可能性があります。

これらの機能の多くは、完全に適切な文法とスペル、および短くて単純な文を使用した標準的な英語を使用することで匿名化できます。イディオムなどは避けてください。分析をだますために他の作者をエミュレートすることも可能です。他のすべてが失敗した場合は、単に待つだけで解決できます。人のライティングスタイルは長年にわたって変動するため、数年前にあなたが作成したドキュメントが、今書いているものと簡単に結び付く可能性は低いです。これは、それが不可能であることを意味するのではなく、もっと難しいだけです。

1
forest

これには多くのライティングサンプルが必要になりますが、理論的にはある程度の確実性はあります(たとえば、法廷で認められることはないでしょうが、少なくとも納得することができます)。これを防ぐには、意図的に通常とはまったく異なる方法で書く必要があります(または、@ DarkMatterで述べたように、書き方を異なるようにするスクリプトを使用します)。好きな作家の書き方をエミュレートすることは、手動で行う1つの方法かもしれません(たとえば、ライターがH.P. Lovecraftの書き方をエミュレートすることは確かに可能であり、一般的です)。

間違いなく非常に早い時期から書いているので、匿名のペルソナの記述を変更する必要があります。したがって、本当のアイデンティティに関連付けられた多くのデータが存在します。

0
Jonathan

グーグルの数回の翻訳が良い賭けのようです。例えば。平文->中国語->英語->ドイツ語->イタリア語->英語。

各ステップでの不完全な翻訳のために、おそらく多くの意味も失いますが、重要なメッセージが同じであることを確認するために校正できます。

0
loneboat