Удобное объявление строк времени компиляции в переполнении стека

Возможность создавать и манипулировать строками во время компиляции в C ++ имеет несколько полезных приложений. Хотя в C ++ можно создавать строки времени компиляции, этот процесс очень громоздкий, так как строка должна быть объявлена ​​как переменная последовательность символов, например,

using str = sequence<'H', 'e', 'l', 'l', 'o', ', ', 'w', 'o', 'r', 'l', 'd', '!'>;

Такие операции, как конкатенация строк, извлечение подстрок и многие другие, могут быть легко реализованы как операции над последовательностями символов. Можно ли более удобно объявить строки времени компиляции? Если нет, есть ли в работах предложение, которое позволило бы удобно объявить строки времени компиляции?

Почему существующие подходы терпят неудачу

В идеале мы хотели бы иметь возможность объявить строки времени компиляции следующим образом:

// Approach 1
using str1 = sequence<"Hello, world!">;

или, используя пользовательские литералы,

// Approach 2
constexpr auto str2 = "Hello, world!"_s;

где decltype(str2) будет иметь constexpr конструктор. Более сложную версию подхода 1 можно реализовать, воспользовавшись тем, что вы можете сделать следующее:

template <unsigned Size, const char Array[Size]>
struct foo;

Однако массив должен иметь внешнюю связь, поэтому для того, чтобы подход 1 работал, нам нужно написать что-то вроде этого:

/* Implementation of array to sequence goes here. */

constexpr const char str[] = "Hello, world!";

int main()
{
using s = string<13, str>;
return 0;
}

Излишне говорить, что это очень неудобно. Подход 2 фактически невозможно реализовать. Если бы мы должны были объявить (constexpr) оператор литерала, то как бы мы указали тип возвращаемого значения? Так как нам нужен оператор для возврата переменной последовательности символов, поэтому нам нужно использовать const char* Параметр для указания типа возвращаемого значения:

constexpr auto
operator"" _s(const char* s, size_t n) -> /* Some metafunction using `s` */

Это приводит к ошибке компиляции, потому что s это не constexpr, Попытка обойти это, делая следующее, не очень помогает.

template <char... Ts>
constexpr sequence<Ts...> operator"" _s() { return {}; }

Стандарт диктует, что эта конкретная форма литерального оператора зарезервирована для целочисленных типов и типов с плавающей точкой. В то время как 123_s должно сработать, abc_s не будет. Что если мы вообще отбросим пользовательские литералы и просто используем обычные constexpr функционировать?

template <unsigned Size>
constexpr auto
string(const char (&array)[Size]) -> /* Some metafunction using `array` */

Как и прежде, мы сталкиваемся с проблемой, что массив, теперь параметр constexpr функция, сама по себе больше не constexpr тип.

Я считаю, что должна быть возможность определить макрос препроцессора C, который принимает строку и размер строки в качестве аргументов и возвращает последовательность, состоящую из символов в строке (используя BOOST_PP_FOR, stringification, индексы массива и тому подобное). Однако у меня нет времени (или достаточного интереса) для реализации такого макроса =)

125

Решение

Я не видел ничего, что соответствовало бы элегантности Скотт Шурр str_const представлен на C ++ сейчас 2012. Это требует constexpr хоть.

Вот как вы можете его использовать и что он может делать:

int
main()
{
constexpr str_const my_string = "Hello, world!";
static_assert(my_string.size() == 13, "");
static_assert(my_string[4] == 'o', "");
constexpr str_const my_other_string = my_string;
static_assert(my_string == my_other_string, "");
constexpr str_const world(my_string, 7, 5);
static_assert(world == "world", "");
//  constexpr char x = world[5]; // Does not compile because index is out of range!
}

Это не намного круче, чем проверка диапазона времени компиляции!

И использование, и реализация свободны от макросов. И нет никаких искусственных ограничений на размер строки. Я бы опубликовал реализацию здесь, но я уважаю скрытое авторское право Скотта. Реализация находится на одном слайде его презентации, связанной с выше.

115

Другие решения

Я считаю, что должно быть возможно определить макрос препроцессора C, который
принимает строку и размер строки в качестве аргументов и возвращает
последовательность, состоящая из символов в строке (используя
BOOST_PP_FOR, форматирование строк, индексы массивов и т. П.).
Тем не менее, у меня нет времени (или достаточно интереса), чтобы реализовать такие
макрос

это можно реализовать, не полагаясь на повышение, используя очень простой макрос и некоторые функции C ++ 11:

  1. лямбда-вариад
  2. шаблоны
  3. обобщенные константные выражения
  4. инициализаторы нестатических элементов данных
  5. равномерная инициализация

(последние два здесь не обязательны)

  1. нам нужно иметь возможность создавать экземпляр шаблона переменной с указанными пользователем значениями от 0 до N — инструмент, также полезный, например, для расширения кортежа в аргумент функции шаблона переменной (см. вопросы: Как развернуть кортеж в аргументы функции шаблона переменной?
    "распаковка" кортеж для вызова соответствующего указателя на функцию)

    namespace  variadic_toolbox
    {
    template<unsigned  count,
    template<unsigned...> class  meta_functor, unsigned...  indices>
    struct  apply_range
    {
    typedef  typename apply_range<count-1, meta_functor, count-1, indices...>::result  result;
    };
    
    template<template<unsigned...> class  meta_functor, unsigned...  indices>
    struct  apply_range<0, meta_functor, indices...>
    {
    typedef  typename meta_functor<indices...>::result  result;
    };
    }
    
  2. затем определите шаблон переменной с именем string с нетиповым типом
    параметр char:

    namespace  compile_time
    {
    template<char...  str>
    struct  string
    {
    static  constexpr  const char  chars[sizeof...(str)+1] = {str..., '\0'};
    };
    
    template<char...  str>
    constexpr  const char  string<str...>::chars[sizeof...(str)+1];
    }
    
  3. Теперь самое интересное — передать символьные литералы в строку
    шаблон:

    namespace  compile_time
    {
    template<typename  lambda_str_type>
    struct  string_builder
    {
    template<unsigned... indices>
    struct  produce
    {
    typedef  string<lambda_str_type{}.chars[indices]...>  result;
    };
    };
    }
    
    #define  CSTRING(string_literal)                                                        \
    []{                                                                                 \
    struct  constexpr_string_type { const char * chars = string_literal; };         \
    return  variadic_toolbox::apply_range<sizeof(string_literal)-1,                 \
    compile_time::string_builder<constexpr_string_type>::produce>::result{};    \
    }()
    

простая демонстрация конкатенации показывает использование:

    namespace  compile_time
{
template<char...  str0, char...  str1>
string<str0..., str1...>  operator*(string<str0...>, string<str1...>)
{
return  {};
}
}

int main()
{
auto  str0 = CSTRING("hello");
auto  str1 = CSTRING(" world");

std::cout << "runtime concat: " <<  str_hello.chars  << str_world.chars  << "\n <=> \n";
std::cout << "compile concat: " <<  (str_hello * str_world).chars  <<  std::endl;
}

https://ideone.com/8Ft2xu

39

Редактировать: как отметил Говард Хиннант (и я в своем комментарии к ОП), вам может не понадобиться тип с каждым отдельным символом строки в качестве одного аргумента шаблона.
Если вам это нужно, ниже приведено решение без макросов.

Я обнаружил один трюк, пытаясь работать со строками во время компиляции. Требуется ввести другой тип помимо «строки шаблона», но внутри функций вы можете ограничить область действия этого типа.

Он не использует макросы, а скорее некоторые функции C ++ 11.

#include <iostream>

// helper function
constexpr unsigned c_strlen( char const* str, unsigned count = 0 )
{
return ('\0' == str[0]) ? count : c_strlen(str+1, count+1);
}

// helper "function" struct
template < char t_c, char... tt_c >
struct rec_print
{
static void print()
{
std::cout << t_c;
rec_print < tt_c... > :: print ();
}
};
template < char t_c >
struct rec_print < t_c >
{
static void print() { std::cout << t_c; }
};// destination "template string" type
template < char... tt_c >
struct exploded_string
{
static void print()
{
rec_print < tt_c... > :: print();
}
};

// struct to explode a `char const*` to an `exploded_string` type
template < typename T_StrProvider, unsigned t_len, char... tt_c >
struct explode_impl
{
using result =
typename explode_impl < T_StrProvider, t_len-1,
T_StrProvider::str()[t_len-1],
tt_c... > :: result;
};

template < typename T_StrProvider, char... tt_c >
struct explode_impl < T_StrProvider, 0, tt_c... >
{
using result = exploded_string < tt_c... >;
};

// syntactical sugar
template < typename T_StrProvider >
using explode =
typename explode_impl < T_StrProvider,
c_strlen(T_StrProvider::str()) > :: result;int main()
{
// the trick is to introduce a type which provides the string, rather than
// storing the string itself
struct my_str_provider
{
constexpr static char const* str() { return "hello world"; }
};

auto my_str = explode < my_str_provider >{};    // as a variable
using My_Str = explode < my_str_provider >;    // as a type

my_str.print();
}
17

Если вы не хотите использовать Ускоренное решение Вы можете создать простой макрос, который будет делать похожую вещь:

#define MACRO_GET_1(str, i) \
(sizeof(str) > (i) ? str[(i)] : 0)

#define MACRO_GET_4(str, i) \
MACRO_GET_1(str, i+0),  \
MACRO_GET_1(str, i+1),  \
MACRO_GET_1(str, i+2),  \
MACRO_GET_1(str, i+3)

#define MACRO_GET_16(str, i) \
MACRO_GET_4(str, i+0),   \
MACRO_GET_4(str, i+4),   \
MACRO_GET_4(str, i+8),   \
MACRO_GET_4(str, i+12)

#define MACRO_GET_64(str, i) \
MACRO_GET_16(str, i+0),  \
MACRO_GET_16(str, i+16), \
MACRO_GET_16(str, i+32), \
MACRO_GET_16(str, i+48)

#define MACRO_GET_STR(str) MACRO_GET_64(str, 0), 0 //guard for longer strings

using seq = sequence<MACRO_GET_STR("Hello world!")>;

Единственная проблема — фиксированный размер 64 символа (плюс дополнительный ноль). Но это может быть легко изменено в зависимости от ваших потребностей.

8

Я считаю, что должна быть возможность определить макрос препроцессора C, который принимает строку и размер строки в качестве аргументов и возвращает последовательность, состоящую из символов в строке (используя BOOST_PP_FOR, stringification, индексы массива и тому подобное)

Есть статья: Использование строк в метапрограммах шаблона C ++ Абель Синковичс и Дейв Абрахамс.

Это немного улучшило вашу идею использования макроса + BOOST_PP_REPEAT — это не требует передачи явного размера в макрос. Короче говоря, он основан на фиксированном верхнем пределе размера строки и «защите от переполнения строки»:

template <int N>
constexpr char at(char const(&s)[N], int i)
{
return i >= N ? '\0' : s[i];
}

плюс условный повышение :: MPL :: push_back.


Я изменил свой принятый ответ на решение Янкиса, поскольку оно решает эту конкретную проблему и делает это элегантно без использования constexpr или сложного кода препроцессора.

Если вы принимаете конечные нули, рукописный цикл макросов, 2x повторение строки в расширенном макросе, и не имеет Boost — тогда я согласен — это лучше. Хотя с Boost это будет всего три строки:

LIVE DEMO

#include <boost/preprocessor/repetition/repeat.hpp>
#define GET_STR_AUX(_, i, str) (sizeof(str) > (i) ? str[(i)] : 0),
#define GET_STR(str) BOOST_PP_REPEAT(64,GET_STR_AUX,str) 0
6

Коллега попросил меня объединить строки в памяти во время компиляции. Он также включает в себя создание отдельных строк во время компиляции. Полный список кодов здесь:

//Arrange strings contiguously in memory at compile-time from string literals.
//All free functions prefixed with "my" to faciliate grepping the symbol tree
//(none of them should show up).

#include <iostream>

using std::size_t;

//wrapper for const char* to "allocate" space for it at compile-time
template<size_t N>
struct String {
//C arrays can only be initialised with a comma-delimited list
//of values in curly braces. Good thing the compiler expands
//parameter packs into comma-delimited lists. Now we just have
//to get a parameter pack of char into the constructor.
template<typename... Args>
constexpr String(Args... args):_str{ args... } { }
const char _str[N];
};

//takes variadic number of chars, creates String object from it.
//i.e. myMakeStringFromChars('f', 'o', 'o', '\0') -> String<4>::_str = "foo"template<typename... Args>
constexpr auto myMakeStringFromChars(Args... args) -> String<sizeof...(Args)> {
return String<sizeof...(args)>(args...);
}

//This struct is here just because the iteration is going up instead of
//down. The solution was to mix traditional template metaprogramming
//with constexpr to be able to terminate the recursion since the template
//parameter N is needed in order to return the right-sized String<N>.
//This class exists only to dispatch on the recursion being finished or not.
//The default below continues recursion.
template<bool TERMINATE>
struct RecurseOrStop {
template<size_t N, size_t I, typename... Args>
static constexpr String<N> recurseOrStop(const char* str, Args... args);
};

//Specialisation to terminate recursion when all characters have been
//stripped from the string and converted to a variadic template parameter pack.
template<>
struct RecurseOrStop<true> {
template<size_t N, size_t I, typename... Args>
static constexpr String<N> recurseOrStop(const char* str, Args... args);
};

//Actual function to recurse over the string and turn it into a variadic
//parameter list of characters.
//Named differently to avoid infinite recursion.
template<size_t N, size_t I = 0, typename... Args>
constexpr String<N> myRecurseOrStop(const char* str, Args... args) {
//template needed after :: since the compiler needs to distinguish
//between recurseOrStop being a function template with 2 paramaters
//or an enum being compared to N (recurseOrStop < N)
return RecurseOrStop<I == N>::template recurseOrStop<N, I>(str, args...);
}

//implementation of the declaration above
//add a character to the end of the parameter pack and recurse to next character.
template<bool TERMINATE>
template<size_t N, size_t I, typename... Args>
constexpr String<N> RecurseOrStop<TERMINATE>::recurseOrStop(const char* str,
Args... args) {
return myRecurseOrStop<N, I + 1>(str, args..., str[I]);
}

//implementation of the declaration above
//terminate recursion and construct string from full list of characters.
template<size_t N, size_t I, typename... Args>
constexpr String<N> RecurseOrStop<true>::recurseOrStop(const char* str,
Args... args) {
return myMakeStringFromChars(args...);
}

//takes a compile-time static string literal and returns String<N> from it
//this happens by transforming the string literal into a variadic paramater
//pack of char.
//i.e. myMakeString("foo") -> calls myMakeStringFromChars('f', 'o', 'o', '\0');
template<size_t N>
constexpr String<N> myMakeString(const char (&str)[N]) {
return myRecurseOrStop<N>(str);
}

//Simple tuple implementation. The only reason std::tuple isn't being used
//is because its only constexpr constructor is the default constructor.
//We need a constexpr constructor to be able to do compile-time shenanigans,
//and it's easier to roll our own tuple than to edit the standard library code.

//use MyTupleLeaf to construct MyTuple and make sure the order in memory
//is the same as the order of the variadic parameter pack passed to MyTuple.
template<typename T>
struct MyTupleLeaf {
constexpr MyTupleLeaf(T value):_value(value) { }
T _value;
};

//Use MyTupleLeaf implementation to define MyTuple.
//Won't work if used with 2 String<> objects of the same size but this
//is just a toy implementation anyway. Multiple inheritance guarantees
//data in the same order in memory as the variadic parameters.
template<typename... Args>
struct MyTuple: public MyTupleLeaf<Args>... {
constexpr MyTuple(Args... args):MyTupleLeaf<Args>(args)... { }
};

//Helper function akin to std::make_tuple. Needed since functions can deduce
//types from parameter values, but classes can't.
template<typename... Args>
constexpr MyTuple<Args...> myMakeTuple(Args... args) {
return MyTuple<Args...>(args...);
}

//Takes a variadic list of string literals and returns a tuple of String<> objects.
//These will be contiguous in memory. Trailing '\0' adds 1 to the size of each string.
//i.e. ("foo", "foobar") -> (const char (&arg1)[4], const char (&arg2)[7]) params ->
//                       ->  MyTuple<String<4>, String<7>> return value
template<size_t... Sizes>
constexpr auto myMakeStrings(const char (&...args)[Sizes]) -> MyTuple<String<Sizes>...> {
//expands into myMakeTuple(myMakeString(arg1), myMakeString(arg2), ...)
return myMakeTuple(myMakeString(args)...);
}

//Prints tuple of strings
template<typename T> //just to avoid typing the tuple type of the strings param
void printStrings(const T& strings) {
//No std::get or any other helpers for MyTuple, so intead just cast it to
//const char* to explore its layout in memory. We could add iterators to
//myTuple and do "for(auto data: strings)" for ease of use, but the whole
//point of this exercise is the memory layout and nothing makes that clearer
//than the ugly cast below.
const char* const chars = reinterpret_cast<const char*>(&strings);
std::cout << "Printing strings of total size " << sizeof(strings);
std::cout << " bytes:\n";
std::cout << "-------------------------------\n";

for(size_t i = 0; i < sizeof(strings); ++i) {
chars[i] == '\0' ? std::cout << "\n" : std::cout << chars[i];
}

std::cout << "-------------------------------\n";
std::cout << "\n\n";
}

int main() {
{
constexpr auto strings = myMakeStrings("foo", "foobar",
"strings at compile time");
printStrings(strings);
}

{
constexpr auto strings = myMakeStrings("Some more strings",
"just to show Jeff to not try",
"to challenge C++11 again :P",
"with more",
"to show this is variadic");
printStrings(strings);
}

std::cout << "Running 'objdump -t |grep my' should show that none of the\n";
std::cout << "functions defined in this file (except printStrings()) are in\n";
std::cout << "the executable. All computations are done by the compiler at\n";
std::cout << "compile-time. printStrings() executes at run-time.\n";
}
3

Вот краткое решение C ++ 14 для создания std :: tuple<char …> для каждой пройденной строки времени компиляции.

#include <tuple>
#include <utility>namespace detail {
template <std::size_t ... indices>
decltype(auto) build_string(const char * str, std::index_sequence<indices...>) {
return std::make_tuple(str[indices]...);
}
}

template <std::size_t N>
constexpr decltype(auto) make_string(const char(&str)[N]) {
return detail::build_string(str, std::make_index_sequence<N>());
}

auto HelloStrObject = make_string("hello");

И вот один из них для создания уникального типа во время компиляции, обрезанного по сравнению с другим постом макроса.

#include <utility>

template <char ... Chars>
struct String {};

template <typename Str, std::size_t ... indices>
decltype(auto) build_string(std::index_sequence<indices...>) {
return String<Str().chars[indices]...>();
}

#define make_string(str) []{\
struct Str { const char * chars = str; };\
return build_string<Str>(std::make_index_sequence<sizeof(str)>());\
}()

auto HelloStrObject = make_string("hello");

Очень плохо, что пользовательские литералы пока не могут быть использованы для этого.

3

основанный на идее от Говард Хиннант Вы можете создать литеральный класс, который будет добавлять два литерала вместе.

template<int>
using charDummy = char;

template<int... dummy>
struct F
{
const char table[sizeof...(dummy) + 1];
constexpr F(const char* a) : table{ str_at<dummy>(a)..., 0}
{

}
constexpr F(charDummy<dummy>... a) : table{ a..., 0}
{

}

constexpr F(const F& a) : table{ a.table[dummy]..., 0}
{

}

template<int... dummyB>
constexpr F<dummy..., sizeof...(dummy)+dummyB...> operator+(F<dummyB...> b)
{
return { this->table[dummy]..., b.table[dummyB]... };
}
};

template<int I>
struct get_string
{
constexpr static auto g(const char* a) -> decltype( get_string<I-1>::g(a) + F<0>(a + I))
{
return get_string<I-1>::g(a) + F<0>(a + I);
}
};

template<>
struct get_string<0>
{
constexpr static F<0> g(const char* a)
{
return {a};
}
};

template<int I>
constexpr auto make_string(const char (&a)[I]) -> decltype( get_string<I-2>::g(a) )
{
return get_string<I-2>::g(a);
}

constexpr auto a = make_string("abc");
constexpr auto b = a+ make_string("def"); // b.table == "abcdef"
2
По вопросам рекламы [email protected]