異なるタイプのN個の引数を取り、この方法で個々のタイプごとにテンプレート化されたN個の関数に転送できる次の関数があります(2つの引数を持つ例)。
template <typename T1, typename T2>
bool func(int& counter, T1 x1, T2 x2) {
switch (counter) {
case 0:
if (func2<T1>(x1)) {
counter++;
return true;
} else {
return false;
}
case 1:
if (func2<T2>(x2)) {
counter++;
return true;
} else {
return false;
}
default:
return true;
}
}
この関数を可変個引数テンプレートを使用して記述し、型セーフな方法で任意の数の引数を処理できるようにします。再帰関数を使用して、カウンターと可変個引数インデックスを渡し、それらが等しいかどうかを比較するソリューションを見ることができますが、これは上記のswitchステートメント(ジャンプテーブルと比較した一連のif-checks)よりもはるかに効率の悪いコードを生成するようです)。
これはテンプレートメタプログラミングを使用して効率的に実行できますか、それとも各アリティにオーバーロードを提供する必要がありますか?
これはmaxと同様のソリューションですが、a)一般的なパーツをソリューションに固有のパーツから明確に分離し、b)clangがそれを完全に最適化することを示します。基本的な考え方は、コンパイル時に、連続する整数シーケンスからスイッチケースを作成することです。私たちはこのようにします:
template <class T, T ... Is, class F>
auto compile_switch(T i, std::integer_sequence<T, Is...>, F f) {
using return_type = std::common_type_t<decltype(f(std::integral_constant<T, Is>{}))...>;
return_type ret;
std::initializer_list<int> ({(i == Is ? (ret = f(std::integral_constant<T, Is>{})),0 : 0)...});
return ret;
}
整数は整数定数型としてラムダに渡されるため、コンパイル時のコンテキストで使用できます。現在の問題でこれを使用するには、可変個引数パックをタプルに転送し、インデックスシーケンスを使用して通常のトリックを適用するだけです。
template <class T, std::size_t ... Is>
bool func_impl(std::size_t& counter, T&& t, std::index_sequence<Is...> is) {
auto b = compile_switch(counter, is, [&] (auto i) -> bool {
return func2(std::get<i>(std::move(t)));
});
if (b) ++counter;
return b;
}
template <class ... Ts>
bool func(std::size_t & counter, Ts&& ... ts) {
return func_impl(counter,
std::forward_as_Tuple(std::forward<Ts>(ts)...),
std::index_sequence_for<Ts...>{});
}
このfunc2
の定義を使用して、いくつかのアセンブリを確認します。
template <class T>
bool func2(const T& t) { std::cerr << t; return std::is_trivial<T>::value; }
ここを見てください: https://godbolt.org/g/6idVPS 次の手順に気づきました:
auto compile_switch<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul, bool func_impl<std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>(unsigned long&, std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>&&, std::integer_sequence<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>)::{lambda(auto:1)#1}>(unsigned long, std::integer_sequence<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>, bool func_impl<std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>(unsigned long&, std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>&&, std::integer_sequence<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>)::{lambda(auto:1)#1}): # @auto compile_switch<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul, bool func_impl<std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>(unsigned long&, std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>&&, std::integer_sequence<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>)::{lambda(auto:1)#1}>(unsigned long, std::integer_sequence<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>, bool func_impl<std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>(unsigned long&, std::Tuple<int&, double&, int&, unsigned long&, char const*&, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> > const&>&&, std::integer_sequence<unsigned long, 0ul, 1ul, 2ul, 3ul, 4ul, 5ul>)::{lambda(auto:1)#1})
Push r14
Push rbx
Push rax
mov bl, 1
cmp rdi, 5
ja .LBB2_11
jmp qword ptr [8*rdi + .LJTI2_0]
そのラベルを見下ろすと、次のことがわかります。
.LJTI2_0:
.quad .LBB2_2
.quad .LBB2_4
.quad .LBB2_5
.quad .LBB2_6
.quad .LBB2_7
.quad .LBB2_10
言い換えれば、clangはこれをジャンプテーブルに変え、とはfunc2
へのすべての呼び出しをインライン化しました。一部の人が示唆しているように(少なくともコンパイラがそれを行うのを見たことがない)、関数ポインタのテーブルを使用してこれを行うことはできません。悲しいことに、gccはアセンブリをそれほど良く生成しませんが、それでもまともです。
楽しみのために、私は次の方法を提案します
template <typename ... Ts>
bool func (int & cnt, Ts ... xs)
{
using unused = int[];
int i { -1 };
bool ret { true };
(void)unused { 0, ((++i == cnt ? (ret = func<Ts>(xs)) : true), 0)... };
if ( ret && (cnt <= i) )
++cnt;
return ret;
}
しかし、私はスイッチウェイとして効率的な方法ではないと思います。
また、楽しみのために、これは少し複雑すぎるかもしれません
#include<type_traits>
#include<array>
template<typename T>
void g(T&& t)
{
// This function gets called
}
template<typename T>
void entry(void* p)
{
g(*(std::remove_reference_t<T>*)p);
}
template<size_t N>
using table_t = std::array<void (*)(void*), N>;
template<typename... Ts>
constexpr auto make_table()
{
return table_t<sizeof...(Ts)>{
entry<Ts>...
};
}
template<size_t N>
void f_(const table_t<N>&, int)
{
}
template<size_t N, typename T, typename... Ts>
void f_(const table_t<N>& table, int select, T&& t, Ts&&... ts)
{
if(select == N - sizeof...(Ts) - 1)
table[select]((void*)&t);
else
f_(table, select, std::forward<Ts>(ts)...);
}
template<typename... Ts>
void f(int select, Ts&&... ts)
{
static constexpr auto table = make_table<Ts...>();
if(select < 0 || select >= int(sizeof...(Ts)))
throw "out of bounds";
f_(table, select, std::forward<Ts>(ts)...);
}
これはf
でvtableをロールし、それに応じてg
にディスパッチします。
理論的には、パラメータインデックスのバイナリ検索を自分で行うことができます。
#include <type_traits>
#include <Tuple>
#include <typeinfo>
#include <iostream>
#include <algorithm>
template <std::size_t I>
using ic = std::integral_constant<std::size_t, I>;
template <class T>
bool func2(T) {
std::cout<<typeid(T).name()<<std::endl;
return true;
}
template <std::size_t N, class T>
bool func_impl(ic<0>, ic<N>, std::size_t &, T &&tup) {
constexpr int index = std::min(N - 1, std::Tuple_size<T>{} - 1);
if (func2<std::Tuple_element_t<index, std::decay_t<T>>>(std::get<index>(tup)))
return true;
return false;
}
template <std::size_t K, std::size_t N, class T>
bool func_impl(ic<K>, ic<N> n, std::size_t &counter, T &&tup) {
if (counter == N - 1) {
return func_impl(ic<0>{}, n, counter, std::forward<T>(tup));
}
if (counter < N) {
return func_impl(ic<K/2>{}, ic<N - K>{}, counter, std::forward<T>(tup));
} else {
return func_impl(ic<K/2>{}, ic<N + K>{}, counter, std::forward<T>(tup));
}
}
template <class... Ts>
bool func(std::size_t& counter, Ts&&... xs) {
return func_impl(ic<sizeof...(Ts)/2>{}, ic<sizeof...(Ts)/2>{}, counter, std::forward_as_Tuple(xs...));
}
int main() {
std::size_t i = 0;
func<int, float, double, char>(i, 1, 2, 3, 4);
}