皮肉を検出するアルゴリズムを書くように頼まれましたが、ロジックに欠陥(またはそのように見えるもの)に遭遇しました。
たとえば、人が言う場合
A:ジャスティンビーバーが大好きです。あなたは彼が好きですか?
B:うん。承知しました。 私は絶対に彼を愛しています。
今、これは皮肉と見なされるかもしれません、そして知る唯一の方法はBが深刻であるかどうかを知ることであるようです。
(私は深くなるはずがありませんでした。私たちはたくさんのフレーズを与えられ、これらが文の中にあるならそれは皮肉だと言われましたが、私は興味を持ちましたか?)
これを回避する方法はありますか?それとも、皮肉に関しては、コンピューターは絶対に立ち往生していますか?
(話者の口調にもよると思いますが、入力はテキストです)
それを試みた研究があるように見えますが、彼らはまだうまく機能するアルゴリズムを考え出していません。
差出人 González-Ibáñez、R。etal。「Twitterで皮肉を特定する:詳しく見る」
皮肉と皮肉は、言語学、心理学、認知科学でよく研究されている現象です[...]。しかし、テキストマイニングの文献では、皮肉の自動検出は難しい問題と見なされており[...]、いくつかの研究でしか取り上げられていません。 [...]私たちの仕事に最も密接に関連している仕事は、Davidovらの仕事です。 (2010)、その目的は、TwitterおよびAmazonの製品レビューで皮肉な発話と皮肉でない発話を識別することでした。この論文では、皮肉なツイートと非皮肉なツイートを区別するというやや難しい問題について考察します。
彼らは結論します:
おそらく当然のことながら、人間の裁判官も機械学習技術もあまりうまく機能しません。 [...]私たちの結果は、語用論的特徴だけでは皮肉を特定するのに十分ではなく、実用的および文脈的特徴はさらなる研究に値することを示唆しています
ここに別の最近の関連する論文があります:
Reyes、A。「ユーモアの認識から皮肉な検出へ:ソーシャルメディアの比喩的な言葉」
...文はユーザーによって書かれています。 2人の間でシミュレートされた会話。
皮肉を検出することは、1つのフレーズではほぼ不可能ですが、コンテキストを使用すると、もう少し実行可能になる可能性があります。文を解析してその文字通りの意味を解釈できると仮定しましょう(簡単な作業ではありませんが、その問題は少なくともある程度解決されています)。
これで、次のコンテキストが得られます。
#1を活用するには、すべてのフレーズを相互参照することができます。それらのいずれかが直接矛盾していますか?
例:
スピーカー1:ジャスティンビーバーが大好きです。あなたは?
スピーカー2:完全に!私は、彼を愛しています。
スピーカー1:彼の好きなところは何ですか?
スピーカー2:彼の素晴らしい音楽!
スピーカー1:本当に?好きな歌は何ですか?
スピーカー2:さあ、私が彼の音楽を嫌っているのはご存知でしょう。
「私は彼を愛しています!」という2つの矛盾したフレーズがあることを私たちは知っています。そして「私は彼の音楽が嫌いです」。少なくとも皮肉が発生した可能性があります。
アプローチ#2はより効果的である可能性があります(または役に立たない...おそらく皮肉は知られていますが、2つの当事者の間で話されていません)。
例:
スピーカー1:ジャスティンビーバーは町にいます。私はSO彼に会いに行くつもりです。
スピーカー2:ハ。
もう一つの例:
スピーカー1:ジャスティンビーバーが大好きです。あなたは?
スピーカー2:ベッドの上に彼の巨大なポスターがあります。
スピーカー1:そうですね。
さらに複雑になると、ヒューリスティックを適用して、特定のフレーズの後で会話がどれだけ急激に逸脱したかを判断できます。
スピーカー1:私はジャスティンビーバーに完全に夢中です!!!あなたですか?
スピーカー1は強調した声明を出しました
スピーカー2:ええ、確かに。
皮肉な。私たちはそれを知りませんが、会話の他の人は知っています。
スピーカー1は今どの方向に進んでいますか?彼らは主題を変えますか?会話がどれだけ鋭く変わるかに応じて、それは彼らが知覚された反応にどのように反応したかを示しているかもしれません。
とはいえ、これのほとんどは高度な処理を必要とし、せいぜい非常に低い精度を期待します。しかし、それは魅力的な質問です。
では、文化や言語の観点から見た皮肉とは正確には何でしょうか。この複雑な問題を解決したい場合は、それを明確にする必要があります。ある人間の言語のサームでAIを使用するように求められるため、問題は非常に複雑です。いくつかのインスピレーションについては A.L.I.C.E。 をご覧ください。