最近、私たちは銀行である潜在的な将来の顧客との挑戦に直面しました。当社の製品では、銀行の顧客の静的データ(住所、ローン、過去50件の取引など)を収集する必要があります。これらの銀行はパブリッククラウドでPoCを実行します。銀行は、クライアントのアドレスのように機密性の低いデータを処理することはできますが、これが機密性の高いものとして分類されるため、以前のローンのようなデータを持つことは許可されていません。現時点では行き詰まっており、銀行がMLアルゴリズムのデータを提供するための正しい方法を説得または提供する方法がわかりません。
これはサードパーティの問題だけではありません。銀行は、制御が本番環境と同じ厳格さを満たしていない場合に、開発環境で使用できるPIIについて厳しい規制を設けています。
通常のルートは、匿名化または疑似匿名化です。から https://gdpr.report/news/2017/11/07/data-masking-anonymisation-pseudonymisation/ :
匿名化では、データ主体の識別子として機能する可能性のある情報がないかデータがスクラブされます。仮名化は、データからすべての識別情報を削除するのではなく、データセットと個人の元のIDとのリンク可能性を低下させるだけです(暗号化スキームなどを介して)。
GDPRでは、仮名化と匿名化の両方が推奨されており、その制約を満たすことができます。したがって、これらの手法は一般化され、繰り返される必要があります。個人データを所有している人は、リスクを最小限に抑えるためにこれらの手法のいずれかを実装する必要があり、自動化によってコンプライアンスのコストを削減できます。
それが不可能な場合は、銀行の安全なテスト/開発環境内で学習フェーズを実行できるようにすることを検討しましたか?検討する価値があります。