web-dev-qa-db-ja.com

ThreadSanitizerがこのロックフリーの例でレースを報告するのはなぜですか?

私はこれを簡単な自己完結型の例に要約しました。メインスレッドは1000個のアイテムをエンキューし、ワーカースレッドは同時にデキューを試みます。 ThreadSanitizerは、要素を保護する取得と解放のメモリバリアシーケンスがあるにもかかわらず、要素の1つの読み取りと書き込みの間に競合があると不平を言います。

#include <atomic>
#include <thread>
#include <cassert>

struct FakeQueue
{
    int items[1000];
    std::atomic<int> m_enqueueIndex;
    int m_dequeueIndex;

    FakeQueue() : m_enqueueIndex(0), m_dequeueIndex(0) { }

    void enqueue(int x)
    {
        auto tail = m_enqueueIndex.load(std::memory_order_relaxed);
        items[tail] = x;              // <- element written
        m_enqueueIndex.store(tail + 1, std::memory_order_release);
    }

    bool try_dequeue(int& x)
    {
        auto tail = m_enqueueIndex.load(std::memory_order_acquire);
        assert(tail >= m_dequeueIndex);
        if (tail == m_dequeueIndex)
            return false;
        x = items[m_dequeueIndex];    // <- element read -- tsan says race!
        ++m_dequeueIndex;
        return true;
    }
};


FakeQueue q;

int main()
{
    std::thread th([&]() {
        int x;
        for (int i = 0; i != 1000; ++i)
            q.try_dequeue(x);
    });

    for (int i = 0; i != 1000; ++i)
        q.enqueue(i);

    th.join();
}

ThreadSanitizerの出力:

==================
WARNING: ThreadSanitizer: data race (pid=17220)
  Read of size 4 at 0x0000006051c0 by thread T1:
    #0 FakeQueue::try_dequeue(int&) /home/cameron/projects/concurrentqueue/tests/tsan/issue49.cpp:26 (issue49+0x000000402bcd)
    #1 main::{lambda()#1}::operator()() const <null> (issue49+0x000000401132)
    #2 _M_invoke<> /usr/include/c++/5.3.1/functional:1531 (issue49+0x0000004025e3)
    #3 operator() /usr/include/c++/5.3.1/functional:1520 (issue49+0x0000004024ed)
    #4 _M_run /usr/include/c++/5.3.1/thread:115 (issue49+0x00000040244d)
    #5 <null> <null> (libstdc++.so.6+0x0000000b8f2f)

  Previous write of size 4 at 0x0000006051c0 by main thread:
    #0 FakeQueue::enqueue(int) /home/cameron/projects/concurrentqueue/tests/tsan/issue49.cpp:16 (issue49+0x000000402a90)
    #1 main /home/cameron/projects/concurrentqueue/tests/tsan/issue49.cpp:44 (issue49+0x000000401187)

  Location is global 'q' of size 4008 at 0x0000006051c0 (issue49+0x0000006051c0)

  Thread T1 (tid=17222, running) created by main thread at:
    #0 pthread_create <null> (libtsan.so.0+0x000000027a67)
    #1 std::thread::_M_start_thread(std::shared_ptr<std::thread::_Impl_base>, void (*)()) <null> (libstdc++.so.6+0x0000000b9072)
    #2 main /home/cameron/projects/concurrentqueue/tests/tsan/issue49.cpp:41 (issue49+0x000000401168)

SUMMARY: ThreadSanitizer: data race /home/cameron/projects/concurrentqueue/tests/tsan/issue49.cpp:26 FakeQueue::try_dequeue(int&)
==================
ThreadSanitizer: reported 1 warnings

コマンドライン:

g++ -std=c++11 -O0 -g -fsanitize=thread issue49.cpp -o issue49 -pthread

g ++バージョン:5.3.1

Tsanがこれがデータ競合であると考える理由を誰かが明らかにすることができますか?


[〜#〜]更新[〜#〜]

これは誤検知のようです。 ThreadSanitizerをなだめるために、注釈を追加しました(サポートされている注釈については、 ここ を、例については ここ を参照してください)。マクロを介してGCCでtsanが有効になっているかどうかの検出は 最近追加されたばかりです であるため、今のところ手動で-D__SANITIZE_THREAD__をg ++に渡す必要がありました。

#if defined(__SANITIZE_THREAD__)
#define TSAN_ENABLED
#Elif defined(__has_feature)
#if __has_feature(thread_sanitizer)
#define TSAN_ENABLED
#endif
#endif

#ifdef TSAN_ENABLED
#define TSAN_ANNOTATE_HAPPENS_BEFORE(addr) \
    AnnotateHappensBefore(__FILE__, __LINE__, (void*)(addr))
#define TSAN_ANNOTATE_HAPPENS_AFTER(addr) \
    AnnotateHappensAfter(__FILE__, __LINE__, (void*)(addr))
extern "C" void AnnotateHappensBefore(const char* f, int l, void* addr);
extern "C" void AnnotateHappensAfter(const char* f, int l, void* addr);
#else
#define TSAN_ANNOTATE_HAPPENS_BEFORE(addr)
#define TSAN_ANNOTATE_HAPPENS_AFTER(addr)
#endif

struct FakeQueue
{
    int items[1000];
    std::atomic<int> m_enqueueIndex;
    int m_dequeueIndex;

    FakeQueue() : m_enqueueIndex(0), m_dequeueIndex(0) { }

    void enqueue(int x)
    {
        auto tail = m_enqueueIndex.load(std::memory_order_relaxed);
        items[tail] = x;
        TSAN_ANNOTATE_HAPPENS_BEFORE(&items[tail]);
        m_enqueueIndex.store(tail + 1, std::memory_order_release);
    }

    bool try_dequeue(int& x)
    {
        auto tail = m_enqueueIndex.load(std::memory_order_acquire);
        assert(tail >= m_dequeueIndex);
        if (tail == m_dequeueIndex)
            return false;
        TSAN_ANNOTATE_HAPPENS_AFTER(&items[m_dequeueIndex]);
        x = items[m_dequeueIndex];
        ++m_dequeueIndex;
        return true;
    }
};

// main() is as before

これで、ThreadSanitizerは実行時に満足しています。

21
Cameron

ThreadSanitizer はカウントが苦手で、アイテムへの書き込みが常に読み取りの前に行われることを理解できません。

ThreadSanitizerは、m_enqueueIndexのストアがロードの前に発生することを検出できますが、items[m_dequeueIndex]の場合、ロードの前にtail > m_dequeueIndexへのストアが発生する必要があることを理解していません。

5
user1887915

これは https://gcc.gnu.org/bugzilla/show_bug.cgi?id=78158 のように見えます。 GCCによって生成されたバイナリを逆アセンブルすると、O0でのアトミック操作が計測されないことがわかります。回避策として、-O1/-O2を使用してGCCでコードをビルドするか、新しいClangビルドを取得してそれを使用してThreadSanitizerを実行できます(TSanはClangの一部としてのみ開発されているため、これが推奨される方法です。 GCCにバックポートされます)。

上記のコメントは無効です。TSanは、コード内のアトミック間の発生前の関係を簡単に理解できます(ClangのTSanで上記の再現機能を実行することで確認できます)。

また、次の2つの理由から、AnnotateHappensBefore()/ AnnotateHappensAfter()の使用はお勧めしません。

  • ほとんどの場合、それらは必要ありません。それらは、コードが本当に複雑なことをしていることを示しています(その場合、あなたはそれが正しく行われていることを再確認したいかもしれません)。

  • ロックフリーコードでエラーが発生した場合、アノテーションをスプレーするとそのエラーがマスクされ、TSanが気付かない可能性があります。

7
Glider