web-dev-qa-db-ja.com

AVX比較述語バリアントの選択方法

Advanced Vector Extensions(AVX)では、 _ m256_cmp_ps のような比較命令では、最後の引数は比較述語です。述語の選択は私を圧倒します。それらは、タイプ、順序付け、シグナリングのトリプルのようです。例えば。 _CMP_LE_OSは、 '以下の順序付けられたシグナリングです。

手始めに、シグナリングまたは非シグナリングを選択するパフォーマンス上の理由がありますか?同様に、他よりも速く順序付けまたは順序付け解除されますか?

そして、「非シグナリング」とはどういう意味ですか?私はこれをドキュメントでまったく見つけることができません。いつ何を選択するかについての経験則はありますか?

Avxintrin.hからの述語の選択肢は次のとおりです。

/* Compare */
#define _CMP_EQ_OQ    0x00 /* Equal (ordered, non-signaling)  */
#define _CMP_LT_OS    0x01 /* Less-than (ordered, signaling)  */
#define _CMP_LE_OS    0x02 /* Less-than-or-equal (ordered, signaling)  */
#define _CMP_UNORD_Q  0x03 /* Unordered (non-signaling)  */
#define _CMP_NEQ_UQ   0x04 /* Not-equal (unordered, non-signaling)  */
#define _CMP_NLT_US   0x05 /* Not-less-than (unordered, signaling)  */
#define _CMP_NLE_US   0x06 /* Not-less-than-or-equal (unordered, signaling)  */
#define _CMP_ORD_Q    0x07 /* Ordered (nonsignaling)   */
#define _CMP_EQ_UQ    0x08 /* Equal (unordered, non-signaling)  */
#define _CMP_NGE_US   0x09 /* Not-greater-than-or-equal (unord, signaling)  */
#define _CMP_NGT_US   0x0a /* Not-greater-than (unordered, signaling)  */
#define _CMP_FALSE_OQ 0x0b /* False (ordered, non-signaling)  */
#define _CMP_NEQ_OQ   0x0c /* Not-equal (ordered, non-signaling)  */
#define _CMP_GE_OS    0x0d /* Greater-than-or-equal (ordered, signaling)  */
#define _CMP_GT_OS    0x0e /* Greater-than (ordered, signaling)  */
#define _CMP_TRUE_UQ  0x0f /* True (unordered, non-signaling)  */
#define _CMP_EQ_OS    0x10 /* Equal (ordered, signaling)  */
#define _CMP_LT_OQ    0x11 /* Less-than (ordered, non-signaling)  */
#define _CMP_LE_OQ    0x12 /* Less-than-or-equal (ordered, non-signaling)  */
#define _CMP_UNORD_S  0x13 /* Unordered (signaling)  */
#define _CMP_NEQ_US   0x14 /* Not-equal (unordered, signaling)  */
#define _CMP_NLT_UQ   0x15 /* Not-less-than (unordered, non-signaling)  */
#define _CMP_NLE_UQ   0x16 /* Not-less-than-or-equal (unord, non-signaling)  */
#define _CMP_ORD_S    0x17 /* Ordered (signaling)  */
#define _CMP_EQ_US    0x18 /* Equal (unordered, signaling)  */
#define _CMP_NGE_UQ   0x19 /* Not-greater-than-or-equal (unord, non-sign)  */
#define _CMP_NGT_UQ   0x1a /* Not-greater-than (unordered, non-signaling)  */
#define _CMP_FALSE_OS 0x1b /* False (ordered, signaling)  */
#define _CMP_NEQ_OS   0x1c /* Not-equal (ordered, signaling)  */
#define _CMP_GE_OQ    0x1d /* Greater-than-or-equal (ordered, non-signaling)  */
#define _CMP_GT_OQ    0x1e /* Greater-than (ordered, non-signaling)  */
#define _CMP_TRUE_US  0x1f /* True (unordered, signaling)  */
39
Bram

順序付きvs順序なしは、オペランドの1つにNaNが含まれている場合に比較が真であるかどうかと関係があります( 順序付き/順序なしの比較とはどういう意味ですか? を参照)。シグナリング(S)と非シグナリング(Qはクワイエット?)は、オペランドにNaNが含まれている場合に例外が発生するかどうかを決定します。

パフォーマンスの観点から、これらはすべて同じである必要があります(もちろん例外が発生しないと仮定します)。 NaNがあるときにアラートを受け取りたい場合は、シグナリングが必要です。順序付けと順序付けなしについては、すべてNaNをどのように処理するかによって異なります。

32
Thiago