web-dev-qa-db-ja.com

Word予測キーボードをP300ベースのBCI(Brain Computer Interface)システムに統合する方法は?

Cognitive Sciences でこの質問を参照してください。

P300ベースのBCIは、閉じ込められた患者が通信できるように設計されています。P300は、意思決定の過程で誘発される脳波です。 FarwellとDonchin(1988)は、6x6のスペルマトリックスを備えたシステムについて説明しており、さまざまな列または行が強調表示されています。 「列または行に被験者が伝えたい文字が含まれている場合、P300の応答が引き出されます(この文字は「特別」であるため、典型的なオッドボールパラダイムで説明されているターゲット刺激です。)誘発した行と列の組み合わせ応答により、目的の文字が検索されます。」(図1の例を参照)。 Rumi P.がコメントしたように、このシステムはブラックボックスとして表示されますが、ターゲットユーザーが患者に閉じ込められているため、ユーザー(Jayfangからのコメント)で刺激(P300)をトリガーするには点滅表示が必要です。 Word予測を追加する目的は、その速度を上げることです。現在、患者は3.4〜4.3文字/分を正確に綴ることができます。

このシステムによれば、毎回1つのターゲットしか検出できないため、画面上で点滅するグループ(行と列)は1つだけです。このシステムでWord予測キーボードを使用する場合、文字が選択されると、予測された単語が画面に表示されます。予測された単語が行と列とともに点滅する場合、システムはどちらを選択するか(単語または文字)を判別できません。このシステムにWord予測キーボードを統合する最良の方法は何ですか?以下の2つのアイデア:

  1. 文字を選択した後にキーボードを非表示にするには、予測された単語のみを画面に表示したままにします。限られた時間内に何も選択されない場合は、単語を削除するとキーボードが戻ってきて、対象はスペルを続けます。
  2. 上記と同じアイデアです。キーボードを取り外すのではなく、文字が選択された後に予測された単語が点滅しているときにキーボードが点滅しないようにするだけです。ただし、件名に3文字以下の単語しか必要ない場合は、どちらもスペルチェックプロセスの速度が低下する可能性があります。他のアイデアはありますか?

図1.イーストテネシー州立大学のBrain-Computer Interface Laboratoryの例[単語「DOG」を綴るには、行と列が連続して点滅するため、ユーザーは文字「D」(ターゲット)が点滅します。これにより、ターゲットを含む行または列が点滅するたびにP300応答が生成されます。 12フラッシュシリーズは、所定の回数繰り返されます。各行と列の応答が平均化され、分類子が適用されて、平均化された各応答がP300にどの程度類似しているかを判断します。最高の分類値を持つ行と列の交点が選択されます。この場合、ターゲット文字「D」を含む行と列が選択され、マトリックスの上部に表示されている単語「DOG」の下の行にフィードバックとして「D」がユーザーに表示されます。]

Farwell、L. A.&Donchin、E.(1988)。頭の上の話:イベント関連の脳電位を利用した精神補綴に向けて。脳波と臨床神経生理学、70(6)、510-523。 doi:10.1016/0013-4694(88)90149-6

4
Sophy

私はこの種のデバイスで作業したことがないので、明確な答えではありません。しかし、あなたがこの分野にいるなら、それは追求する価値のある提案でしょう。

私が理解すると、システムはwhatが認識されたと認識します--timeが認識されたためです。 「D」をスペルしたいユーザーは「D」のフラッシュを見ると、システムはDがフラッシュしたときに脳がP300を生成したことに気づき、システムはユーザーがDをスペルしたかったと結論付けます。同時に画面に表示されます。これらのどれがP300をトリガーしたかはわかりません。そのため、刺激を連続して表示することに行き詰まり、反応を待ちます。

UXスペシャリストとして、私の最初のアイデアは、システムを視線記録デバイスと組み合わせることです。これらは今日では非常に一般的なテクノロジーであり、EEGセットアップと比較した場合、価格はおそらくごくわずかです。それらの時間分解能は十分に良好であり、個々のサッカードを記録できます。

決定は神経学的にいくらか遅れがありますが、それは数百ミリ秒の規模であり、変動はそれほど大きくはないと思います。最後の数ミリ秒の間に患者が注視していた場所がわかっている場合は、決定をトリガーした可能性のある注視固定を非常に小さな数に制限することが可能です。したがって、同じ画面上に複数の刺激を表示し、決定のきっかけとして(それらが表示された時間に基づいて)それらを区別できるはずです。原作者がそれを考えなかった理由は、80年代に視線認識技術が非常に原始的だったからだと思います。彼らがそれを知っていれば、おそらく十分な時間的および空間的解像度を提供していませんでした。

このアプローチの実現可能性については神経科医に相談してください。私の神経科学の知識はより基本的な資料に限定されており、見落としている明らかな問題があるかもしれません。そのようなプロジェクトに取り組むとき、あなたがドメインの専門家にアクセスできることを願っています。

2
Rumi P.

予測テキストを表示または提供する前に、入力する文字の量を増やすことを検討しましたか?ゲートを–たとえば– 3文字に設定することで、ショートワードの問題を回避し、予測される選択に対して可能な応答のリストを大幅に削減できます。

その後、最初に予測テキストを点滅させてから、通常のパターンでコンテンツ間を移動するという独自の提案に従うことができます。

2
Josh Burgess