ロンドンでは、 電話のMACアドレスを追跡するゴミ箱があります そしてある場所から別の場所へのユーザーの移動を監視します。このような個人情報を収集するための、分析だけでなく匿名性も可能にするベストプラクティスがあるかどうかを確認したいと思います。
MACアドレス、場所情報、日時データがバックエンドデータベースに保存されているシナリオを想像してみてください。ただし、データを生の形式で保存するのではなく、要約データまたは傾向データのみを保存します。
私の頭に浮かんだアイデアには、一方向ハッシュ、ホモモルフィック暗号化、統計のいくつかの指標が含まれていました。
私よりはるかに賢い人が、PIIを収集し、匿名化し、トレンド調査や市場調査を可能にするという問題を解決するアプローチを思いついた場合に備えて、ここで質問します。
暗号化がプライバシーの問題に適したツールになることはめったにありません。ここで、ゴミ箱は、WiFi対応デバイス、特に電話による MACアドレス のブロードキャストをリッスンしています。追跡部分は、いくつかのパラメータの組み合わせにより可能になります。
WiFi対応デバイスは定期的にデータをブロードキャストします。これはかなり避けられません。WiFiが実際に発生するには、デバイスまたはアクセスポイントのいずれかが最初に通信する必要があります。特に対処されるまで話さない「隠された」アクセスポイントがあるので、デバイスは絶えず騒ぎ立てる必要があります。
MACアドレスは固定されています。 MACアドレスの重要なポイントは、その一意性です。2つの「変更されていない」デバイスが同じローカルネットワーク上で同じMACアドレスを同時に使用できないようにする必要があります。この一意性を確保するために、ハードウェアベンダーにアドレス範囲が割り当てられる、グローバル割り当てスキームが設計されています。ほとんどのハードウェアでMACアドレスの変更を強制することは可能ですが、これは「眉をひそめる」ものです。
家にいないときは、WiFiをオフにしないでください。彼らはすべきです(特に、WiFiを使用しないとバッテリーの寿命が延びます)が、そうではありません。
この例では、ゴミ箱はすべてのブロードキャストをリッスンし、データを相互に関連付けて、電話(したがって、おそらく電話の所有者)の所在を「追跡」します。単独のビンはあまり興味深いデータを取得しませんが、多くのビンが一緒になって、人々の移動行動のかなり完全なマップとともに現れる可能性があります。 MACアドレスは所有者IDまでさかのぼることはできませんが、グローバルMAC割り当てシステムにより、少なくともハードウェアベンダー名を明らかにすることができます。 パブリック 。
新しいプロトコルを自由に定義できると仮定して、できることは、固定の48ビットMACアドレスをランダムな128ビットアドレスに置き換えることです(頻繁に再生成されます。たとえば、毎分は実際にはアクセスポイントに接続されません)。 128ビットのランダムアドレスは、多くのデバイスが同じ場所にある場合でも、十分に高い確率で一意性を保証します。たとえば、60000人でいっぱいのスタジアムがあり、それぞれに電話があり、全員がWiFiを実行しようとすると、128ビットのランダムMACアドレスにより、約2の確率で衝突が発生する可能性があります。-97、つまり「起こりません」。しかし、ここでは、新しいWiFiプロトコルを定義し、すべてのデバイスとアクセスポイントが単にそれに切り替えることを望んでおり、既存のWiFiアクセスポイントとの互換性の試みをすべて失います。この種の変化は、今後数年以内に発生する可能性は低いです。
それまでの間、プライバシーを重視する場合は、単にWiFiをシャットダウンしてください!
主要な問題の1つは、IDの匿名化の方法に関係なく、 ソーシャルネットワーク分析 を使用して人々の活動のネットワークを逆転させることができることです。あなたが管理していない外部データと相まって、そのような情報は身元を明らかにする可能性があります。
このようなデータを収集するときに匿名のままにしたい場合は、そこに存在する関係を削除する必要があります。ユーザー123が8:20に電車Aに乗り、次に8:50に電車Bに乗り、次に17:05に電車Bに乗り、17:30に電車Aに乗り、そのユーザーの地図を作成していることを追跡します。あなたの目標を確認してください。列車の乗客数を決定しようとしている場合、同じユーザーがこれらの各区間を使用していることを知る必要はありません。列車Aが8:20に+1し、17:30に別の+1を持っているだけです。