Переполнение стека «Найти магические числа»

Волшебные числа

Целое положительное число является «магическим» тогда и только тогда, когда его можно уменьшить до 1, многократно разделив его на 2, если оно четное, или умножив на 3, а затем добавив 1, если оно нечетное. Так, например, 3 — это магия, потому что 3 уменьшается сначала до 10 (3 * 3 + 1), затем до 5 (10/2), затем до 16 (5 * 3 + 1), затем до 8 (16/2) затем до 4 (8/2), затем до 2 (4/2) и, наконец, до 1 (2/2). Гипотеза о магических числах утверждает, что все натуральные числа являются магическими, или, формально: ∈x ∈ Z, MAGIC (x), где MAGIC (x) — это предикат «x — это магия».

Предполагается, что мы разработаем программу на C ++, чтобы найти «магические числа» от 1 до 5 миллиардов. Это должно занять 80 секунд или меньше, если все сделано правильно. Моя работа занимает около 2 часов, а пример программы, которую нам дали, займет 14 дней. Вот мой код, что я могу сделать, чтобы ускорить его? Я пропускаю очевидные проблемы оптимизации?

#include <iostream>
using namespace std;

bool checkMagic(unsigned long number);

int main()
{
for(unsigned long i = 1; i <= 5000000000; i++)
{
if(i % 1000000 == 0)
{
//only print out every 1000000 numbers to keep track, but slow it down
//by printing out every single number
cout<<i<<endl;
}

if(!checkMagic(i))
{
//not magic
cout<<i<<" not a magic number"<<endl;
break;
}
}
}

bool checkMagic(unsigned long number)
{
if(number % 2 == 0)
{
number = number / 2;
}
else
{
number = (number * 3) + 1;
}

if(number !=  1)
{
checkMagic(number);
}

return 1;
}

8

Решение

Этот вопрос в основном просит проверить Гипотеза Коллатца до 5В.

Я думаю, что ключ здесь, для каждого номера N мы проверяем, чтобы увидеть оптимистический сценарий и пессимистический сценарий, и проверить оптимистический сценарий, прежде чем вернуться к пессимистическому.

В оптимистическом сценарии, как мы модифицируем N в соответствии с н / 2; 3n + 1 Правило, последовательность чисел будет:

  • за конечное число шагов становится меньше, чем N (в этом случае мы можем проверить, что мы знаем об этом меньшем числе).

  • не вызовет переполнение в шагах.

(на который, как правильно отмечает TonyK, мы не можем полагаться (даже не на первый)).

Итак, для оптимистического сценария мы можем использовать следующую функцию:

#include <unordered_set>
#include <set>
#include <iostream>
#include <memory>
#include <list>
#include <gmp.h>

using namespace std;

using found_set = unordered_set<size_t>;

bool fast_verify(size_t i, size_t max_tries, const found_set &found) {
size_t tries = 0;
size_t n = i;
while(n != 1) {
if(++tries == max_tries )
return false;

if(n < i)
return found.empty() || found.find(i) == found.end();
if(n % 2 == 0)
n /= 2;
else if(__builtin_mul_overflow (n, 3, &n) || __builtin_add_overflow(n, 1, &n))
return false;
}

return true;
}

Обратите внимание на следующее:

  1. Функция только пытается проверить гипотезу для числа, которое она получает. Если он вернется true, это было проверено. Если он вернется false, это просто означает, что оно не было проверено (то есть это не означает, что оно было опровергнуто).

  2. Принимает параметр max_triesи проверяет только до этого количества шагов. Если число было превышено, он не пытается определить, является ли это частью бесконечного цикла или нет — он просто возвращает ошибку проверки.

  3. Требуется unordered_set из известных чисел, которые потерпели неудачу (конечно, если гипотеза Коллатца верна, этот набор всегда будет пустым).

  4. Обнаруживает переполнение через __builtin_*_overflow. (К сожалению, это специфично для gcc. Для другой платформы может потребоваться другой набор таких функций.)

Теперь для медленной, но уверенной функции. Эта функция использует GNU MP многоточечная арифметическая библиотека. Он проверяет бесконечный цикл, поддерживая последовательность чисел, с которой он уже сталкивался. Эта функция возвращает true если гипотеза была доказана для этого числа, и false if был опровергнут для этого номера (обратите внимание на отличие от предыдущей быстрой проверки).

bool slow_check(size_t i) {
mpz_t n_;
mpz_init(n_);

mpz_t rem_;
mpz_init(rem_);

mpz_t i_;
mpz_init(i_);

mpz_set_ui(i_, i);
mpz_set_ui(n_, i);

list<mpz_t> seen;

while(mpz_cmp_ui(n_, 1) != 0) {
if(mpz_cmp_ui(n_, i) < 0)
return true;
mpz_mod_ui(rem_, n_, 2);
if(mpz_cmp_ui(rem_, 0) == 0) {
mpz_div_ui(n_, n_, 2);
}
else {
mpz_mul_ui(n_, n_, 3);
mpz_add_ui(n_, n_, 1);
}
seen.emplace_back(n_);
for(const auto &e0: seen)
for(const auto &e1: seen)
if(&e0 != &e1 && mpz_cmp(e0, e1) == 0)
return false;
}

return true;
}

В заключение, main поддерживает unordered_set опровергнутых чисел. для каждого числа он оптимистично пытается проверить гипотезу, а затем, в случае неудачи (для переполнения или превышения количества итераций), использует медленный метод:

int main()
{
const auto max_num = 5000000000;
found_set found;

for(size_t i = 1; i <= max_num; i++) {
if(i % 1000000000 == 0)
cout << "iteration " << i << endl;

auto const f = fast_verify(i, max_num, found);
if(!f && !slow_check(i))
found.insert(i);
}

for(auto e: found)
cout << e << endl;
}

Выполнение полного кода (ниже) дает:

$ g++ -O3 --std=c++11 magic2.cpp -lgmp && time ./a.out
iteration 1000000000
iteration 2000000000
iteration 3000000000
iteration 4000000000
iteration 5000000000

real    1m3.933s
user    1m3.924s
sys 0m0.000s

$ uname -a
Linux atavory 4.4.0-38-generic #57-Ubuntu SMP Tue Sep 6 15:42:33 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
$ sudo lshw | grep -i cpu
*-cpu
description: CPU
product: Intel(R) Core(TM) i7-4720HQ CPU @ 2.60GHz
bus info: cpu@0
version: Intel(R) Core(TM) i7-4720HQ CPU @ 2.60GHz
capabilities: x86-64 fpu fpu_exception wp vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx pdpe1gb rdtscp constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf eagerfpu pni pclmulqdq dtes64 monitor ds_cpl vmx est tm2 ssse3 sdbg fma cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm abm epb tpr_shadow vnmi flexpriority ept vpid fsgsbase tsc_adjust bmi1 avx2 smep bmi2 erms invpcid xsaveopt dtherm ida arat pln pts cpufreq

Т.е. не найдено опровергнутых чисел, а время работы составляет ~ 64 секунды.


Полный код:

#include <unordered_set>
#include <set>
#include <iostream>
#include <memory>
#include <list>
#include <gmp.h>

using namespace std;

using found_set = unordered_set<size_t>;

bool fast_verify(size_t i, size_t max_tries, const found_set &found) {
size_t tries = 0;
size_t n = i;
while(n != 1) {
if(++tries == max_tries )
return false;

if(n < i)
return found.empty() || found.find(i) == found.end();
if(n % 2 == 0)
n /= 2;
else if(__builtin_mul_overflow (n, 3, &n) || __builtin_add_overflow(n, 1, &n))
return false;
}

return true;
}

bool slow_check(size_t i) {
mpz_t n_;
mpz_init(n_);

mpz_t rem_;
mpz_init(rem_);

mpz_t i_;
mpz_init(i_);

mpz_set_ui(i_, i);
mpz_set_ui(n_, i);

list<mpz_t> seen;

while(mpz_cmp_ui(n_, 1) != 0) {
if(mpz_cmp_ui(n_, i) < 0)
return true;
mpz_mod_ui(rem_, n_, 2);
if(mpz_cmp_ui(rem_, 0) == 0) {
mpz_div_ui(n_, n_, 2);
}
else {
mpz_mul_ui(n_, n_, 3);
mpz_add_ui(n_, n_, 1);
}
seen.emplace_back(n_);
for(const auto &e0: seen)
for(const auto &e1: seen)
if(&e0 != &e1 && mpz_cmp(e0, e1) == 0)
return false;
}

return true;
}int main()
{
const auto max_num = 5000000000;
found_set found;

for(size_t i = 1; i <= max_num; i++) {
if(i % 1000000000 == 0)
cout << "iteration " << i << endl;

auto const f = fast_verify(i, max_num, found);
if(!f && !slow_check(i))
found.insert(i);
}

for(auto e: found)
cout << e << endl;

return 0;
}
4

Другие решения

Ваш код и ответ Ами Тавори полностью игнорируют проблему переполнения. Если там мы не магическое число в вашем диапазоне, то итерация Коллатца будет либо входить в цикл, либо увеличиваться без ограничения. Если он увеличивается без ограничений, он непременно переполнится, независимо от размера вашего unsigned long; и если он входит в цикл, он вполне может переполниться, прежде чем попасть туда. Так что вы должен поместите там проверку переполнения:

#include <limits.h>
...
if (number > (ULONG_MAX - 1) / 3)
PrintAnApologyAndDie() ;
number = (number * 3) + 1;
2

что я могу сделать, чтобы ускорить это? Я пропускаю очевидные проблемы оптимизации?

  • для (без знака долго я = 1; я <= 5000000000; я ++)

Цикл for — это не самый быстрый стиль кодирования для вызова метода 5 раз.

В моем коде см. Unwind100 () и innerLoop (). Код, который я кодировал, убрал 99% издержек innerLoop, что сэкономило более 5 секунд (на моем рабочем столе DD5). Ваши сбережения могут отличаться. В Википедии есть статья о том, как раскрутить петлю, с кратким описанием потенциала сбережений.


  • если (я% 1000000 == 0)

Этот код, очевидно, генерирует отчеты о проделанной работе. Обошлось в 5 миллиардов
сравнений, это ничего не дает для проверки магического числа.

Посмотрите мой код externalLoop, который вызывает innerLoop 10 раз. Это обеспечивает
удобное расположение для 1 отчета о ходе работы каждого внешнего цикла. Рассмотреть вопрос о расщеплении
ваши циклы во «внутренний цикл» и «внешний цикл». Тестирование 5 миллиардов раз
дороже, чем добавление 10 вызовов в innerLoops.


  • Как и в комментариях, ваш checkMagic () возвращает «1» независимо от результатов теста. Простая ошибка, но я не знаю, влияет ли эта ошибка на производительность.

Я думаю, что ваш checkMagic () не достигает хвостовой рекурсии, которая действительно замедлит ваш код.

Смотрите мой метод checkMagicR (), который имеет хвостовую рекурсию и возвращает true или
ложный.

Кроме того, в вашем CheckMagic (), в предложении для нечетного ввода, вы игнорируете идею, что (3n + 1) должно быть четным числом, когда n положительно и нечетно. Мой код выполняет «раннее деление на 2», таким образом уменьшая будущие усилия, когда это возможно.


  • В моих методах unwind10 () обратите внимание, что мой код использует известный четный / нечетный шаблон ввода для последовательности (2,5 миллиарда), используя checkMagicRO () (для нечетных входов) и checkMagicRE () (для четного) ,

В моих предыдущих версиях код терял время, обнаруживая, что известный четный ввод был четным, затем делил его на 2 и затем возвращал true. checkMagicRE () пропускает тест и делит, экономя время.

CheckMagicRO () пропускает тест на нечетность, затем выполняет нечетные вещи и переходит к checkMagicR ().


  • if (number! = 1) {checkMagic (number); }

Ваша рекурсия продолжается вплоть до 1 … не обязательно, и, возможно, самый большой удар по общей производительности.

Смотрите мой checkMagicR () «пункт о прекращении рекурсии». Мой код останавливается, когда ((n / 2) < m_N), m_N — тестовое значение, с которого началась рекурсия. Идея состоит в том, что все более мелкие тестовые входы уже доказали свою магию, иначе код бы подтвердил Он также останавливается, когда неизбежно повторение … чего не произошло.


Результаты:

Мой рабочий стол (DD5) старше, медленнее и работает под управлением Ubuntu 15.10 (64). Этот код был разработан с g ++ v5.2.1, и заканчивается только без подтверждения тайм-аута с использованием -O3.

DD5, по-видимому, в 2 раза медленнее, чем машина, используемая Эми Тавори (сравнивая, как его код работал на DD5).

На DD5 мой код завершается через ~ 44 секунды в режиме 1 и 22 секунды в режиме 2.

Более быстрый компьютер может выполнить этот код за 11 секунд (в режиме 2).


Полный код:

// V9

#include <chrono>
#include <iomanip>
#include <iostream>
#include <limits>
#include <sstream>
#include <thread>
#include <vector>
#include <cassert>

// chrono typedef - shorten one long name
typedef std::chrono::high_resolution_clock  Clock_t;class T431_t
{

private:
uint64_t           m_N;             // start-of-current-recursion
const uint64_t     m_upperLimitN;   // wrap-around avoidance / prevention

std::stringstream  m_ssMagic;       // dual threads use separate out streams

uint64_t           m_MaxRcrsDpth;   // diag only
uint64_t           m_Max_n;         // diag only
uint64_t           m_TotalRecurse;  // diag only

Clock_t::time_point  m_startMS;     // Derived req - progress info

std::stringstream  m_ssDuration;

std::ostream*      m_so;            // dual threads - std::cout or m_ssMagic

uint64_t           m_blk;

const int64_t      m_MaxThreadDuration; // single Max80KMs, dual Max40KMs// enum of known type (my preference for 'internal' constants)
enum T431_Constraints : uint64_t
{
ZERO     = 0,
B00      = 1,    // least-significant-bit is bit 0
ONE      = 1,    // lsbit set
TWO      = 2,
THREE    = 3,
//
K        = 1000, // instead of 1024,
//
BlkSize  = ((K * K * K) / 2),  // 0.5 billion
//
MaxSingleCoreMS = (80 * K), // single thread max
MaxDualCoreMS   = (40 * K)  // dual thread max
};

// convenience method:  show both hex and decimal on one line (see dtor)
inline std::string showHexDec(const std::string& label, uint64_t val) {
std::stringstream ss;
ss << "\n" << label
<< " = 0x" << std::hex << std::setfill('0') << std::setw(16) << val
<< "  ("   << std::dec << std::setfill(' ') << std::setw(22) << val << ")";
return (ss.str());
}

// duration: now() - m_startMS
std::chrono::milliseconds  getChronoMillisecond() {
return (std::chrono::duration_cast<std::chrono::milliseconds>
(Clock_t::now() - m_startMS));
}

// reports milliseconds since m_startMS time
void ssDurationPut (const std::string& label)
{
m_ssDuration.str(std::string());  // empty string
m_ssDuration.clear();             // clear ss flags

std::chrono::milliseconds  durationMS = getChronoMillisecond();

uint64_t  durationSec = (durationMS.count() / 1000);
uint64_t durationMSec = (durationMS.count() % 1000);

m_ssDuration
<< label << std::dec << std::setfill(' ') << std::setw(3) << durationSec
<< "."   << std::dec << std::setfill('0') << std::setw(3) << durationMSec
<< " sec";
}

inline void reportProgress()
{
std::chrono::milliseconds  durationMS = getChronoMillisecond();

assert(durationMS.count() < m_MaxThreadDuration); // normal finish -> "no endless loop"//
uint64_t  durationSec = (durationMS.count() / 1000);
uint64_t durationMSec = (durationMS.count() % 1000);

*m_so << " m_blk = " << m_blk
<< "  m_N = 0x" << std::setfill('0') << std::hex << std::setw(16) << m_N
<< "  " << std::dec << std::setfill(' ') << std::setw(3) << durationSec
<< "."  << std::dec << std::setfill('0') << std::setw(3) << durationMSec
<< " sec  (" << std::dec << std::setfill(' ') << std::setw(10) << m_N << ")"<< std::endl;
}public:

T431_t(uint64_t maxDuration = MaxSingleCoreMS) :
m_N                 (TWO),  // start val of current recursion
m_upperLimitN       (initWrapAroundLimit()),
// m_ssMagic        // default ctor ok - empty
m_MaxRcrsDpth       (ZERO),
m_Max_n             (TWO),
m_TotalRecurse      (ZERO),
m_startMS           (Clock_t::now()),
// m_ssDuration     // default ctor ok - empty
m_so                (&std::cout), // default
m_blk               (ZERO),
m_MaxThreadDuration (maxDuration)
{
m_ssMagic.str().reserve(1024*2);
m_ssDuration.str().reserve(256);
}

~T431_t()
{
// m_MaxThreadDuration
// m_blk
// m_so
// m_ssDuration
// m_startMS
// m_Max_n
// m_TotalRecurse
// m_MaxRcrsDpth
if (m_MaxRcrsDpth) // diag only
{
ssDurationPut ("\n      duration = " );

std::cerr << "\n T431() dtor        "//
<< showHexDec("         u64MAX",
std::numeric_limits<uint64_t>::max()) << "\n"//
<< showHexDec("        m_Max_n", m_Max_n)
<< showHexDec("  (3*m_Max_n)+1", ((3*m_Max_n)+1))
<< showHexDec("    upperLimitN", m_upperLimitN)
//                        ^^^^^^^^^^^ no wrap-around possible when n is less
//
<< "\n"<< showHexDec("  m_MaxRcrsDpth",  m_MaxRcrsDpth)
<< "\n"<< showHexDec(" m_TotalRecurse",  m_TotalRecurse)
//
<< m_ssDuration.str() << std::endl;
}
// m_ssMagic
// m_upperLimitN
// m_N
if(m_MaxThreadDuration == MaxSingleCoreMS)
std::cerr << "\n  " << __FILE__ << " by Douglas O. Moen     Compiled on = "<< __DATE__ << "  " << __TIME__ << "\n";
}

private:

inline bool checkMagicRE(uint64_t nE) // n is known even, and the recursion starting point
{
return(true);  // for unit test, comment out this line to run the asserts

// unit test - enable both asserts
assert(nE == m_N);             // confirm recursion start value
assert(ZERO == (nE & B00));    // confirm even
return(true);                  // nothing more to do
}

inline bool checkMagicRO(uint64_t nO) // n is known odd,  and the recursion starting point
{
// unit test - uncomment the following line to measure checkMagicRE() performance
// return (true);  // when both methods do nothing -  0.044

// unit test - enable both these asserts
// assert(nO == m_N);  // confirm recursion start value
// assert(nO & B00);   // confirm odd
uint64_t nxt;
{
assert(nO < m_upperLimitN);  // assert that NO wrap-around occurs
// NOTE: the sum of 4 odd uint's is even, and is destined to be
// divided by 2 in the next recursive invocation.
// we need not wait to divide by 2
nxt = ((nO+nO+nO+ONE)  >> ONE); // combine the arithmetic
//      ||||||||||||   ||||||
//      sum is even    unknown after sum divided by two
}
return (checkMagicR(nxt));
}inline void unwind8()
{
// skip 0, 1
assert(checkMagicRE (m_N)); m_N++;  // 2
assert(checkMagicRO (m_N)); m_N++;  // 3
assert(checkMagicRE (m_N)); m_N++;  // 4
assert(checkMagicRO (m_N)); m_N++;  // 5
assert(checkMagicRE (m_N)); m_N++;  // 6
assert(checkMagicRO (m_N)); m_N++;  // 7
assert(checkMagicRE (m_N)); m_N++;  // 8
assert(checkMagicRO (m_N)); m_N++;  // 9
}

inline void unwind10()
{
assert(checkMagicRE (m_N)); m_N++;  // 0
assert(checkMagicRO (m_N)); m_N++;  // 1
assert(checkMagicRE (m_N)); m_N++;  // 2
assert(checkMagicRO (m_N)); m_N++;  // 3
assert(checkMagicRE (m_N)); m_N++;  // 4
assert(checkMagicRO (m_N)); m_N++;  // 5
assert(checkMagicRE (m_N)); m_N++;  // 6
assert(checkMagicRO (m_N)); m_N++;  // 7
assert(checkMagicRE (m_N)); m_N++;  // 8
assert(checkMagicRO (m_N)); m_N++;  // 9
}

inline void unwind98()
{
unwind8();
unwind10();  // 1
unwind10();  // 2
unwind10();  // 3
unwind10();  // 4
unwind10();  // 5
unwind10();  // 6
unwind10();  // 7
unwind10();  // 8
unwind10();  // 9
}

inline void unwind100()
{
unwind10();  // 0
unwind10();  // 1
unwind10();  // 2
unwind10();  // 3
unwind10();  // 4
unwind10();  // 5
unwind10();  // 6
unwind10();  // 7
unwind10();  // 8
unwind10();  // 9
}

inline void innerLoop (uint64_t start_N, uint64_t end_N)
{
for (uint64_t iLoop = start_N; iLoop < end_N; iLoop += 100)
{
unwind100();
}

reportProgress();
}

inline void outerLoop(const std::vector<uint64_t>&  start_Ns,
const std::vector<uint64_t>&  end_Ns)
{
*m_so << "\n outerLoop \n  m_upperLimitN = 0x"<< std::hex << std::setfill('0') << std::setw(16) << m_upperLimitN
<< "\n            m_N = 0x"      << std::setw(16) << start_Ns[0]
<< "  " << std::dec << std::setfill(' ') << std::setw(3) << 0
<< "."  << std::dec << std::setfill('0') << std::setw(3) << 0
<< " sec  (" << std::dec << std::setfill(' ') << std::setw(10)
<< start_Ns[0] << ")" << std::endl;

size_t szStart = start_Ns.size();
size_t szEnd   = end_Ns.size();
assert(szEnd == szStart);

m_blk = 0;

{  // when blk 0 starts at offset 2 (to skip values 0 and 1)
if(TWO == start_Ns[0])
{
m_N = TWO;  // set m_N start

unwind98(); // skip 0 and 1

assert(100 == m_N); // confirm

innerLoop (100, end_Ns[m_blk]);

m_blk += 1;
}
else // thread 2 blk 0 starts in the middle of 5 billion range
{
m_N = start_Ns[m_blk];  // set m_N start, do full block
}
}

for (; m_blk < szStart;  ++m_blk)
{
innerLoop (start_Ns[m_blk], end_Ns[m_blk]);
}
}// 1 == argc
void  exec1 (void) // no parameters --> check all values
{
const std::vector<uint64_t> start_Ns =
{         TWO, (BlkSize*1), (BlkSize*2), (BlkSize*3), (BlkSize*4),
(BlkSize*5), (BlkSize*6), (BlkSize*7), (BlkSize*8), (BlkSize*9)  };
//    blk 0        blk 1        blk 2        blk 3        blk 4
//    blk 5        blk 6        blk 7        blk 8        blk 9
const std::vector<uint64_t> end_Ns =
{ (BlkSize*1), (BlkSize*2), (BlkSize*3), (BlkSize*4), (BlkSize*5),
(BlkSize*6), (BlkSize*7), (BlkSize*8), (BlkSize*9), (BlkSize*10) };

m_startMS = Clock_t::now();

// outerLoop :  10 blocks generates 10 progressReports()
outerLoop( start_Ns, end_Ns);

ssDurationPut("");

std::cout << "   execDuration = " << m_ssDuration.str() << " " << std::endl;
} // void  exec1 (void)void exec2a ()  //  thread entry a
{
//lower half of test range
const std::vector<uint64_t> start_Ns =
{        TWO , (BlkSize*1), (BlkSize*2), (BlkSize*3), (BlkSize*4) };
//    blk 0        blk 1        blk 2        blk 3        blk 4
const std::vector<uint64_t> end_Ns =
{ (BlkSize*1), (BlkSize*2), (BlkSize*3), (BlkSize*4), (BlkSize*5) };

m_startMS = Clock_t::now();

// m_so to std::cout
// uses 5 blocks to gen 5 progress indicators
outerLoop (start_Ns, end_Ns);

ssDurationPut("");

std::cout << "   execDuration =  " << m_ssDuration.str() << " (a)   " << std::endl;
} // exec2a (void)void exec2b ()  //  thread entry b
{
// upper half of test range
const std::vector<uint64_t> start_Ns =
{ (BlkSize*5), (BlkSize*6), (BlkSize*7), (BlkSize*8), (BlkSize*9)  };
//    blk 5        blk 6        blk 7        blk 8        blk 9
const std::vector<uint64_t> end_Ns =
{ (BlkSize*6), (BlkSize*7), (BlkSize*8), (BlkSize*9), (BlkSize*10) };

m_startMS = Clock_t::now();

m_so = &m_ssMagic;
// uses 5 blocks to gen 5 progress indicators
outerLoop(start_Ns, end_Ns);

ssDurationPut("");

m_ssMagic << "   execDuration =  " << m_ssDuration.str() << " (b)  " << std::endl;
} // exec2b (void)// 3 == argc
int exec3 (std::string argv1,  // recursion start value
std::string argv2)  // values count
{
uint64_t start_N = std::stoull(argv1);
uint64_t length  = std::stoull(argv2);

// range checks
{
std::string note1;
switch (start_N) // limit check
{
case 0: { start_N = 3; length -= 3;
note1 = "... 0 is below test range (change start to 3 ";
} break;

case 1: { start_N = 3; length -= 2;
note1 = "... 1 is defined magic (change start to 3";
} break;

case 2: { start_N = 3; length -= 1;
note1 = "... 2 is trivially magic (change start to 3";
} break;

default:
{  // when start_N from user is even
if (ZERO == (start_N & B00))
{
start_N -= 1;
note1 = "... even is not an interesting starting point";
length  += 1;
}
}
break;

} // switch (start_N)

// start_N not restrained ... allow any manual search
//    but uin64_t wrap-around still preempted

std::cout << "\n start_N: " << start_N << "  " << note1
<< "\n  length: " << length  << "  " << std::endl;
}

m_startMS = Clock_t::now();

for (m_N = start_N;   m_N < (start_N + length);   ++m_N)
{
bool magicNumberFound = checkMagicRD (m_N, 1);

std::cout << m_ssMagic.str() << std::dec << m_N
<< "    m_MaxRcrsDpth: "  << m_MaxRcrsDpth << ";"<< "    m_Max_n: "  << m_Max_n << ";" << std::endl;

m_ssMagic.str(std::string()); // empty string
m_ssMagic.clear();            // clear flags)
if (!magicNumberFound)
{
std::cerr << m_N << " not a magic number!" << std::endl;
break;
}

} // for (uint64_t k = kStart; k < kEnd; ++k)

ssDurationPut("");

std::cout << "   execDuration =  " << m_ssDuration.str() << "    " << std::endl;

return(0);
} // int exec3 (std::string argv1,  std::string argv2)// conversion
std::string ssMagicShow() { return (m_ssMagic.str()); }// D3: use recursion for closer match to definition
bool checkMagicR(uint64_t n)   // recursive Performance
{
uint64_t nxt;
{
if (n & B00) // n-odd
{
if (n >= m_upperLimitN) // wraparound imminent abort
return (false);    // recursion termination clause

// NOTE: the sum of 4 odd uint's is even, and will be halved
// we need not wait for the next recursion to divide-by-2
nxt = ((n+n+n+ONE)  >> ONE); // combine the arithmetic
//     known even
}
else // n-even
{
nxt = (n >> ONE);   // bit shift divide by 2

if (nxt < m_N)      // nxt < m_N start of recursion
return ( true ); // recursion termination clause
// We need not de-curse to 1 because all
// (n < m_N) are asserted as magic
}
}
return (checkMagicR(nxt));  // tail recursion
} // bool  checkMagicR(uint64_t n)// D4: diagnostic text output
bool checkMagicRD (uint64_t n, uint64_t rd)  // rd: recursion depth
{
if (n > m_Max_n) m_Max_n = n;
m_TotalRecurse += 1;

m_ssMagic << "\n" << rd << std::setw(static_cast<int>(rd)) << " "<< " checkMagicRD (" << m_N << ", " << n << ")";

uint64_t nxt;
{
if (n & B00) // n-odd
{
if (n >= m_upperLimitN) // wraparound imminent abort
return ( terminateCheckMagic (nxt, rd, false) );

// NOTE: the sum of 4 odd uint's is even, and will be divided by 2
// we need not wait for the next recursion to divide by 2
nxt = ((n+n+n+ONE)  >> ONE); // combine the arithmetic
//      |||||||||   ||||||
//    sum is even   unknown after divide by two
}
else // n-even
{
nxt = (n >> ONE);     // bit shift divide by 2

if (nxt < m_N)      // nxt < m_N start of recursion
return ( terminateCheckMagic (nxt, rd, true) );
// We need not de-curse to 1 because all
// (n < m_N) are asserted as magic
}
}
return (checkMagicRD (nxt, (rd+1))); // tail recursion
} //  bool checkMagicRD(uint64_t, uint64_t rd)bool terminateCheckMagic (uint64_t n, uint64_t rd, bool rslt)
{
if (rd > m_MaxRcrsDpth) // diag only
{
std::chrono::milliseconds  durationMS = getChronoMillisecond();

uint64_t durationSec  = durationMS.count() / 1000;
uint64_t durationMSec = durationMS.count() % 1000;

m_MaxRcrsDpth = rd;
// generate noise each update - this does not happen often
static uint64_t count = 0;
std::cerr << "\n\n" << std::setfill(' ')
<< std::setw(30) << "["<< std::setw(4) << durationSec << "." << std::setfill('0') << std::setw(3)
<< durationMSec << std::setfill(' ')
<< " sec]   m_N: " << std::setw(10) << m_N
<< "    n: " << std::setw(10) << n
<< "    MaxRcrsDpth: " << std::setw(5) << m_MaxRcrsDpth
<< "    Max_n:  " << std::setw(16) << m_Max_n
<< "   (" << count << ")" << std::flush;
count += 1; // how many times MaxRcrsDpth updated
}

m_ssMagic << "\n " << std::setw(3) << rd << std::setw(static_cast<int>(rd)) << " "<< "  " << (rslt ? "True " : ">>>false<<< ") << m_N << ", ";

return (rslt);
}

uint64_t initWrapAroundLimit()
{
uint64_t upLimit = 0;
uint64_t u64MAX = std::numeric_limits<uint64_t>::max();
// there exist a max number,  m_upperLimitN
// where 3n+1 < u64MAX, i.e.
upLimit = ((u64MAX - 1) / 3);

return (upLimit);
} // uint64_t initWrapAroundLimit()

public:

int exec (int argc, char* argv[])
{
int retVal = -1;

{ time_t t0 = std::time(nullptr); while(t0 == time(nullptr)) { /* do nothing*/ }; }
// result: consistent run time

switch (argc)
{

case 1: // no parameters: 5 billion tests, 10 blocks, this instance, < 80 sec
{
exec1();
retVal = 0;
}
break;

case 2: // one parameter: 2 threads each runs 5/2 billion tests, in 5 blocks,
{  //                     two new instances,  < 40 sec
// 2 new objects
T431_t  t431a(MaxDualCoreMS); // lower test sequence
T431_t  t431b(MaxDualCoreMS); // upper test sequence

// 2 threads
std::thread tA (&T431_t::exec2a, &t431a);
std::thread tB (&T431_t::exec2b, &t431b);

// 2 join's
tA.join();
tB.join();

// lower test sequence (tA) output directly to std::cout
// upper test sequence (tB) captured in T431_t::m_ssMagic.  send it now
std::cout << t431b.ssMagicShow() << std::endl;

retVal = 0;
}
break;case 3: // argv[1] -> start address,  argv[2] -> length,
{
retVal = exec3 (std::string(argv[1]), std::string(argv[2]));
} break;default :
{
std::cerr
<< "\nUsage: "<< "\n argc (= " << argc << ") not expected, should be 0, 1, or 2 parameters."<< "\n   1  (no parameters) : 5 billion tests, 10 blocks, < 80 sec\n"//
<< "\n   2  (one parameter) : 2 threads, each 5/2 billion tests, 5 blocks,  < 40 sec\n"//
<< "\n   3  (two parameters): verbose mode: start argv[1], test count argv[2] \n"//
<< "\n   3.1: \"./dumy431V4 3 1000  1> /tmp/dumy431V4.out2   2> /tmp/dumy431V4.out2a  "<< "\n                     3  1 K    std::cout redirected     std::cerr redirected \n"//
<< "\n   3.2: \"./dumy431V4 3 1000000000  1>  /dev/null      2> /tmp/dumy431V4.out2b   "<< "\n                     3  1 B       discard std::cout  std::cerr redirected \n"//
<< "\n   3.3: \"./dumy431V4 15 100   "<< "\n                     15 100   (cout and cerr to console) \n"<< std::endl;
retVal = 0;
}

} // switch

return(retVal);
} // int exec(int argc, char* argv[])

};  // class T431int main (int argc, char* argv[])
{
std::cout << "argc: " << argc << std::endl;
for (int i=0; i<argc; i+=1) std::cout << argv[i] << " ";
std::cout << std::endl;

setlocale(LC_ALL, "");
std::ios::sync_with_stdio(false);

int retVal;
{
T431_t  t431;
retVal = t431.exec(argc, argv);
}

std::cout << "\nFINI " << std::endl;
return(retVal);
}

Код представлен:

а) использует assert (x) для всех проверок (потому что assert быстр и имеет
побочные эффекты, которые оптимизатор не может игнорировать).

б) обнаруживает любой бесконечный цикл, используя утверждение продолжительности.

в) утверждает, чтобы предотвратить любой переход.

Когда происходит какое-либо утверждение, программа не завершается нормально.

Когда этот код заканчивается нормально, это означает:

 a) no disproven numbers found, and
b) the running time < 80 seconds, so no endless loop occurred      and
c) no wrap-around occurred

Замечания о Рекурсивной проверкеMagicR (uint64_t n):

В рекурсии доступно 3 формы n:

  • формальный параметр n — типичный для рекурсивных вызовов

  • auto var nxt — получает вычисленное значение n для следующего
    рекурсивный вызов

  • Атрибут данных: m_N — начальная точка текущего запущенного
    рекурсивное усилие

0

Я размышлял о том, какие изменения мог бы внести оптимизатор для этой конкретной хвостовой рекурсии.

Поэтому я создал итерационный ответ из своего кода V9 (в моем другом ответе).

Меняться от:

bool checkMagicR(uint64_t n)
{
//.. replace all
}

Изменить на:

// ITERATIVE VERSION
bool checkMagicR(uint64_t n)   // ITERATIVE Performance
{
do
{  uint64_t nxt;

if (n & B00) // n-odd
{
if (n >= m_upperLimitN) // wraparound imminent abort
return (false);    // recursion termination clause.

// NOTE: the sum of 4 odd uint's is even, and will be halved
// we need not wait for the next recursion to divide-by-2
nxt = ((n+n+n+ONE)  >> ONE); // combine the arithmetic
//     known even
}
else // n-even
{
nxt = (n >> ONE);   // bit shift divide by 2

if (nxt < m_N)      // nxt < m_N start of recursion
return ( true );     // recursion termination clause.
// We need not de-curse to 1 because all
// (n < m_N) are asserted as magic
}

n = nxt;
} while(true);  // NO  recursion
}

Не исправить имя. Не исправил комментарии или другие упоминания о «рекурсии» в этом или других методах. Я изменил некоторые комментарии вверху и внизу этого метода.

Результаты:

  • Производительность идентична. (44 секунды)

  • Режим 1 и режим 2 являются итеративными.

  • Режим 3 является (все еще) рекурсивным.

0
По вопросам рекламы [email protected]