Ideone.com

fork download

/******************************************************************************
 * Fast linear search  (AVX-512 ➜ AVX2 ➜ scalar)                              *
 * ‑> reports which implementation ran and how long it took.                 *
 *                                                                            *
 *  g++ -O3 -std=c++17 -mavx512f -mavx2 fast_find.cpp -pthread -o fast_find   *
 *  ./fast_find           # single-thread                                     *
 *  ./fast_find --mt      # multi-thread                                      *
 ******************************************************************************/
 
#include <algorithm>
#include <atomic>
#include <chrono>
#include <cstddef>
#include <cstdint>
#include <immintrin.h>
#include <iostream>
#include <random>
#include <string>
#include <thread>
#include <vector>
 
namespace fast_find {
 
// ---------------------------------------------------------------------------
//  Which implementation was actually used?
// ---------------------------------------------------------------------------
enum class Impl { Scalar, AVX2, AVX512 };
 
// ---------------------------------------------------------------------------
//  1. Scalar fallback
// ---------------------------------------------------------------------------
template <typename T>
inline int scalar(const T* a, std::size_t n, T key) noexcept {
    for (std::size_t i = 0; i < n; ++i)
        if (a[i] == key) return static_cast<int>(i);
    return -1;
}
 
// ---------------------------------------------------------------------------
//  2. AVX2 implementation
// ---------------------------------------------------------------------------
#ifdef __AVX2__
inline int avx2(const int* a, std::size_t n, int key) noexcept {
    constexpr int W = 8;
    const __m256i NEEDLE = _mm256_set1_epi32(key);
 
    std::size_t i = 0;
    const std::size_t limit = n & ~(W * 4 - 1);
 
    for (; i < limit; i += W * 4) {
        __m256i v0 = _mm256_loadu_si256(reinterpret_cast<const __m256i*>(a + i));
        __m256i v1 = _mm256_loadu_si256(reinterpret_cast<const __m256i*>(a + i + W));
        __m256i v2 = _mm256_loadu_si256(reinterpret_cast<const __m256i*>(a + i + W * 2));
        __m256i v3 = _mm256_loadu_si256(reinterpret_cast<const __m256i*>(a + i + W * 3));
 
        int m0 = _mm256_movemask_epi8(_mm256_cmpeq_epi32(v0, NEEDLE));
        if (m0) return i + ((m0 & -m0) % 255) >> 2;
 
        int m1 = _mm256_movemask_epi8(_mm256_cmpeq_epi32(v1, NEEDLE));
        if (m1) return i + W + ((m1 & -m1) % 255) >> 2;
 
        int m2 = _mm256_movemask_epi8(_mm256_cmpeq_epi32(v2, NEEDLE));
        if (m2) return i + W * 2 + ((m2 & -m2) % 255) >> 2;
 
        int m3 = _mm256_movemask_epi8(_mm256_cmpeq_epi32(v3, NEEDLE));
        if (m3) return i + W * 3 + ((m3 & -m3) % 255) >> 2;
    }
    for (; i < n; ++i)
        if (a[i] == key) return static_cast<int>(i);
    return -1;
}
#endif
 
// ---------------------------------------------------------------------------
//  3. AVX-512 implementation
// ---------------------------------------------------------------------------
#ifdef __AVX512F__
inline int avx512(const int* a, std::size_t n, int key) noexcept {
    constexpr int W = 16;
    const __m512i NEEDLE = _mm512_set1_epi32(key);
 
    std::size_t i = 0;
    const std::size_t limit = n & ~(W * 4 - 1);
 
    for (; i < limit; i += W * 4) {
        _mm_prefetch(reinterpret_cast<const char*>(a + i + 64),      _MM_HINT_T0);
        _mm_prefetch(reinterpret_cast<const char*>(a + i + 128),     _MM_HINT_T0);
 
        __mmask16 m0 = _mm512_cmpeq_epi32_mask(_mm512_loadu_si512(a + i), NEEDLE);
        if (m0) return i + _tzcnt_u32(m0);
 
        __mmask16 m1 = _mm512_cmpeq_epi32_mask(_mm512_loadu_si512(a + i + W), NEEDLE);
        if (m1) return i + W + _tzcnt_u32(m1);
 
        __mmask16 m2 = _mm512_cmpeq_epi32_mask(_mm512_loadu_si512(a + i + W * 2), NEEDLE);
        if (m2) return i + W * 2 + _tzcnt_u32(m2);
 
        __mmask16 m3 = _mm512_cmpeq_epi32_mask(_mm512_loadu_si512(a + i + W * 3), NEEDLE);
        if (m3) return i + W * 3 + _tzcnt_u32(m3);
    }
    for (; i < n; ++i)
        if (a[i] == key) return static_cast<int>(i);
    return -1;
}
#endif
 
// ---------------------------------------------------------------------------
//  4. Single-thread façade (returns index + impl used)
// ---------------------------------------------------------------------------
inline int search(const int* data, std::size_t n, int value, Impl& used) noexcept {
#ifdef __AVX512F__
    if (__builtin_cpu_supports("avx512f")) { used = Impl::AVX512; return avx512(data, n, value); }
#endif
#ifdef __AVX2__
    if (__builtin_cpu_supports("avx2"))    { used = Impl::AVX2;   return avx2  (data, n, value); }
#endif
    used = Impl::Scalar;
    return scalar(data, n, value);
}
 
// convenience wrapper when caller doesn't care about impl
inline int search(const int* data, std::size_t n, int value) noexcept {
    Impl dummy;
    return search(data, n, value, dummy);
}
 
// ---------------------------------------------------------------------------
//  5. Multi-thread wrapper (returns index + impl used by *any* thread)
// ---------------------------------------------------------------------------
inline int search_mt(const int* data, std::size_t n, int value,
                     unsigned nThreads,
                     Impl& usedImpl)
{
    if (nThreads == 0) nThreads = 1;
    if (nThreads == 1 || n < 16'384)          // ST faster for small inputs
        return search(data, n, value, usedImpl);
 
    const std::size_t chunk = (n + nThreads - 1) / nThreads;
    std::atomic<int> result{-1};
    std::atomic<Impl> implSeen{Impl::Scalar};
    std::vector<std::thread> pool;
 
    for (unsigned t = 0; t < nThreads; ++t) {
        const std::size_t start = t * chunk;
        if (start >= n) break;
        const std::size_t end = std::min(start + chunk, n);
 
        pool.emplace_back([&, start, end]() {
            Impl localImpl;
            int localIdx = search(data + start, end - start, value, localImpl);
            implSeen.store(localImpl, std::memory_order_relaxed);
 
            if (localIdx != -1) {
                int global = static_cast<int>(start + localIdx);
                int expected = -1;
                result.compare_exchange_strong(expected, global,
                                               std::memory_order_relaxed);
            }
        });
    }
    for (auto& th : pool) th.join();
 
    usedImpl = implSeen.load(std::memory_order_relaxed);
    return result.load();
}
 
}  // namespace fast_find
 
// ═══════════════════════════════════ Demo main ═════════════════════════════
static std::string to_string(fast_find::Impl impl) {
    switch (impl) {
        case fast_find::Impl::Scalar: return "Scalar";
        case fast_find::Impl::AVX2:   return "AVX2";
        case fast_find::Impl::AVX512: return "AVX-512";
    }
    return "Unknown";
}
 
int main(int argc, char** argv) {
    constexpr std::size_t N = 10'000;
    std::vector<int> data(N);
    for (std::size_t i = 0; i < N; ++i) data[i] = (i * 77 + 123) & 0x7FFF;
 
    // --------- Randomly pick a key from the data set
    std::random_device rd;
    std::mt19937       rng(rd());
    std::uniform_int_distribution<std::size_t> dist(0, N - 1);
    const std::size_t randIdx = dist(rng);
    const int key = data[randIdx];
 
    const bool useMT = (argc > 1 && std::string(argv[1]) == "--mt");
 
    const unsigned hwThreads =
        std::thread::hardware_concurrency() ? std::thread::hardware_concurrency() : 1;
 
    fast_find::Impl implUsed;
    const auto t0 = std::chrono::high_resolution_clock::now();
    int idx = useMT
                ? fast_find::search_mt(data.data(), data.size(), key,
                                       hwThreads, implUsed)
                : fast_find::search   (data.data(), data.size(), key,
                                       implUsed);
    const auto t1 = std::chrono::high_resolution_clock::now();
    const double micro =
        std::chrono::duration_cast<std::chrono::duration<double, std::micro>>(t1 - t0).count();
 
    std::cout << (useMT ? "[MT] " : "[ST] ")
              << "Impl: " << to_string(implUsed)
              << " | Key: " << key
              << " | Index: " << idx
              << " | Time: " << micro << " µs"
              << " | Logical cores: " << hwThreads
              << '\n';
}

LyoqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKgogKiBGYXN0IGxpbmVhciBzZWFyY2ggIChBVlgtNTEyIOKenCBBVlgyIOKenCBzY2FsYXIpICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgKgogKiDigJE+IHJlcG9ydHMgd2hpY2ggaW1wbGVtZW50YXRpb24gcmFuIGFuZCBob3cgbG9uZyBpdCB0b29rLiAgICAgICAgICAgICAgICAgKgogKiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAqCiAqICBnKysgLU8zIC1zdGQ9YysrMTcgLW1hdng1MTJmIC1tYXZ4MiBmYXN0X2ZpbmQuY3BwIC1wdGhyZWFkIC1vIGZhc3RfZmluZCAgICoKICogIC4vZmFzdF9maW5kICAgICAgICAgICAjIHNpbmdsZS10aHJlYWQgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgKgogKiAgLi9mYXN0X2ZpbmQgLS1tdCAgICAgICMgbXVsdGktdGhyZWFkICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAqCiAqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKioqKiovCgojaW5jbHVkZSA8YWxnb3JpdGhtPgojaW5jbHVkZSA8YXRvbWljPgojaW5jbHVkZSA8Y2hyb25vPgojaW5jbHVkZSA8Y3N0ZGRlZj4KI2luY2x1ZGUgPGNzdGRpbnQ+CiNpbmNsdWRlIDxpbW1pbnRyaW4uaD4KI2luY2x1ZGUgPGlvc3RyZWFtPgojaW5jbHVkZSA8cmFuZG9tPgojaW5jbHVkZSA8c3RyaW5nPgojaW5jbHVkZSA8dGhyZWFkPgojaW5jbHVkZSA8dmVjdG9yPgoKbmFtZXNwYWNlIGZhc3RfZmluZCB7CgovLyAtLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KLy8gIFdoaWNoIGltcGxlbWVudGF0aW9uIHdhcyBhY3R1YWxseSB1c2VkPwovLyAtLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0KZW51bSBjbGFzcyBJbXBsIHsgU2NhbGFyLCBBVlgyLCBBVlg1MTIgfTsKCi8vIC0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQovLyAgMS4gU2NhbGFyIGZhbGxiYWNrCi8vIC0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQp0ZW1wbGF0ZSA8dHlwZW5hbWUgVD4KaW5saW5lIGludCBzY2FsYXIoY29uc3QgVCogYSwgc3RkOjpzaXplX3QgbiwgVCBrZXkpIG5vZXhjZXB0IHsKICAgIGZvciAoc3RkOjpzaXplX3QgaSA9IDA7IGkgPCBuOyArK2kpCiAgICAgICAgaWYgKGFbaV0gPT0ga2V5KSByZXR1cm4gc3RhdGljX2Nhc3Q8aW50PihpKTsKICAgIHJldHVybiAtMTsKfQoKLy8gLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tCi8vICAyLiBBVlgyIGltcGxlbWVudGF0aW9uCi8vIC0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQojaWZkZWYgX19BVlgyX18KaW5saW5lIGludCBhdngyKGNvbnN0IGludCogYSwgc3RkOjpzaXplX3QgbiwgaW50IGtleSkgbm9leGNlcHQgewogICAgY29uc3RleHByIGludCBXID0gODsKICAgIGNvbnN0IF9fbTI1NmkgTkVFRExFID0gX21tMjU2X3NldDFfZXBpMzIoa2V5KTsKCiAgICBzdGQ6OnNpemVfdCBpID0gMDsKICAgIGNvbnN0IHN0ZDo6c2l6ZV90IGxpbWl0ID0gbiAmIH4oVyAqIDQgLSAxKTsKCiAgICBmb3IgKDsgaSA8IGxpbWl0OyBpICs9IFcgKiA0KSB7CiAgICAgICAgX19tMjU2aSB2MCA9IF9tbTI1Nl9sb2FkdV9zaTI1NihyZWludGVycHJldF9jYXN0PGNvbnN0IF9fbTI1NmkqPihhICsgaSkpOwogICAgICAgIF9fbTI1NmkgdjEgPSBfbW0yNTZfbG9hZHVfc2kyNTYocmVpbnRlcnByZXRfY2FzdDxjb25zdCBfX20yNTZpKj4oYSArIGkgKyBXKSk7CiAgICAgICAgX19tMjU2aSB2MiA9IF9tbTI1Nl9sb2FkdV9zaTI1NihyZWludGVycHJldF9jYXN0PGNvbnN0IF9fbTI1NmkqPihhICsgaSArIFcgKiAyKSk7CiAgICAgICAgX19tMjU2aSB2MyA9IF9tbTI1Nl9sb2FkdV9zaTI1NihyZWludGVycHJldF9jYXN0PGNvbnN0IF9fbTI1NmkqPihhICsgaSArIFcgKiAzKSk7CgogICAgICAgIGludCBtMCA9IF9tbTI1Nl9tb3ZlbWFza19lcGk4KF9tbTI1Nl9jbXBlcV9lcGkzMih2MCwgTkVFRExFKSk7CiAgICAgICAgaWYgKG0wKSByZXR1cm4gaSArICgobTAgJiAtbTApICUgMjU1KSA+PiAyOwoKICAgICAgICBpbnQgbTEgPSBfbW0yNTZfbW92ZW1hc2tfZXBpOChfbW0yNTZfY21wZXFfZXBpMzIodjEsIE5FRURMRSkpOwogICAgICAgIGlmIChtMSkgcmV0dXJuIGkgKyBXICsgKChtMSAmIC1tMSkgJSAyNTUpID4+IDI7CgogICAgICAgIGludCBtMiA9IF9tbTI1Nl9tb3ZlbWFza19lcGk4KF9tbTI1Nl9jbXBlcV9lcGkzMih2MiwgTkVFRExFKSk7CiAgICAgICAgaWYgKG0yKSByZXR1cm4gaSArIFcgKiAyICsgKChtMiAmIC1tMikgJSAyNTUpID4+IDI7CgogICAgICAgIGludCBtMyA9IF9tbTI1Nl9tb3ZlbWFza19lcGk4KF9tbTI1Nl9jbXBlcV9lcGkzMih2MywgTkVFRExFKSk7CiAgICAgICAgaWYgKG0zKSByZXR1cm4gaSArIFcgKiAzICsgKChtMyAmIC1tMykgJSAyNTUpID4+IDI7CiAgICB9CiAgICBmb3IgKDsgaSA8IG47ICsraSkKICAgICAgICBpZiAoYVtpXSA9PSBrZXkpIHJldHVybiBzdGF0aWNfY2FzdDxpbnQ+KGkpOwogICAgcmV0dXJuIC0xOwp9CiNlbmRpZgoKLy8gLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tCi8vICAzLiBBVlgtNTEyIGltcGxlbWVudGF0aW9uCi8vIC0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQojaWZkZWYgX19BVlg1MTJGX18KaW5saW5lIGludCBhdng1MTIoY29uc3QgaW50KiBhLCBzdGQ6OnNpemVfdCBuLCBpbnQga2V5KSBub2V4Y2VwdCB7CiAgICBjb25zdGV4cHIgaW50IFcgPSAxNjsKICAgIGNvbnN0IF9fbTUxMmkgTkVFRExFID0gX21tNTEyX3NldDFfZXBpMzIoa2V5KTsKCiAgICBzdGQ6OnNpemVfdCBpID0gMDsKICAgIGNvbnN0IHN0ZDo6c2l6ZV90IGxpbWl0ID0gbiAmIH4oVyAqIDQgLSAxKTsKCiAgICBmb3IgKDsgaSA8IGxpbWl0OyBpICs9IFcgKiA0KSB7CiAgICAgICAgX21tX3ByZWZldGNoKHJlaW50ZXJwcmV0X2Nhc3Q8Y29uc3QgY2hhcio+KGEgKyBpICsgNjQpLCAgICAgIF9NTV9ISU5UX1QwKTsKICAgICAgICBfbW1fcHJlZmV0Y2gocmVpbnRlcnByZXRfY2FzdDxjb25zdCBjaGFyKj4oYSArIGkgKyAxMjgpLCAgICAgX01NX0hJTlRfVDApOwoKICAgICAgICBfX21tYXNrMTYgbTAgPSBfbW01MTJfY21wZXFfZXBpMzJfbWFzayhfbW01MTJfbG9hZHVfc2k1MTIoYSArIGkpLCBORUVETEUpOwogICAgICAgIGlmIChtMCkgcmV0dXJuIGkgKyBfdHpjbnRfdTMyKG0wKTsKCiAgICAgICAgX19tbWFzazE2IG0xID0gX21tNTEyX2NtcGVxX2VwaTMyX21hc2soX21tNTEyX2xvYWR1X3NpNTEyKGEgKyBpICsgVyksIE5FRURMRSk7CiAgICAgICAgaWYgKG0xKSByZXR1cm4gaSArIFcgKyBfdHpjbnRfdTMyKG0xKTsKCiAgICAgICAgX19tbWFzazE2IG0yID0gX21tNTEyX2NtcGVxX2VwaTMyX21hc2soX21tNTEyX2xvYWR1X3NpNTEyKGEgKyBpICsgVyAqIDIpLCBORUVETEUpOwogICAgICAgIGlmIChtMikgcmV0dXJuIGkgKyBXICogMiArIF90emNudF91MzIobTIpOwoKICAgICAgICBfX21tYXNrMTYgbTMgPSBfbW01MTJfY21wZXFfZXBpMzJfbWFzayhfbW01MTJfbG9hZHVfc2k1MTIoYSArIGkgKyBXICogMyksIE5FRURMRSk7CiAgICAgICAgaWYgKG0zKSByZXR1cm4gaSArIFcgKiAzICsgX3R6Y250X3UzMihtMyk7CiAgICB9CiAgICBmb3IgKDsgaSA8IG47ICsraSkKICAgICAgICBpZiAoYVtpXSA9PSBrZXkpIHJldHVybiBzdGF0aWNfY2FzdDxpbnQ+KGkpOwogICAgcmV0dXJuIC0xOwp9CiNlbmRpZgoKLy8gLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tCi8vICA0LiBTaW5nbGUtdGhyZWFkIGZhw6dhZGUgKHJldHVybnMgaW5kZXggKyBpbXBsIHVzZWQpCi8vIC0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQppbmxpbmUgaW50IHNlYXJjaChjb25zdCBpbnQqIGRhdGEsIHN0ZDo6c2l6ZV90IG4sIGludCB2YWx1ZSwgSW1wbCYgdXNlZCkgbm9leGNlcHQgewojaWZkZWYgX19BVlg1MTJGX18KICAgIGlmIChfX2J1aWx0aW5fY3B1X3N1cHBvcnRzKCJhdng1MTJmIikpIHsgdXNlZCA9IEltcGw6OkFWWDUxMjsgcmV0dXJuIGF2eDUxMihkYXRhLCBuLCB2YWx1ZSk7IH0KI2VuZGlmCiNpZmRlZiBfX0FWWDJfXwogICAgaWYgKF9fYnVpbHRpbl9jcHVfc3VwcG9ydHMoImF2eDIiKSkgICAgeyB1c2VkID0gSW1wbDo6QVZYMjsgICByZXR1cm4gYXZ4MiAgKGRhdGEsIG4sIHZhbHVlKTsgfQojZW5kaWYKICAgIHVzZWQgPSBJbXBsOjpTY2FsYXI7CiAgICByZXR1cm4gc2NhbGFyKGRhdGEsIG4sIHZhbHVlKTsKfQoKLy8gY29udmVuaWVuY2Ugd3JhcHBlciB3aGVuIGNhbGxlciBkb2Vzbid0IGNhcmUgYWJvdXQgaW1wbAppbmxpbmUgaW50IHNlYXJjaChjb25zdCBpbnQqIGRhdGEsIHN0ZDo6c2l6ZV90IG4sIGludCB2YWx1ZSkgbm9leGNlcHQgewogICAgSW1wbCBkdW1teTsKICAgIHJldHVybiBzZWFyY2goZGF0YSwgbiwgdmFsdWUsIGR1bW15KTsKfQoKLy8gLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tCi8vICA1LiBNdWx0aS10aHJlYWQgd3JhcHBlciAocmV0dXJucyBpbmRleCArIGltcGwgdXNlZCBieSAqYW55KiB0aHJlYWQpCi8vIC0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLQppbmxpbmUgaW50IHNlYXJjaF9tdChjb25zdCBpbnQqIGRhdGEsIHN0ZDo6c2l6ZV90IG4sIGludCB2YWx1ZSwKICAgICAgICAgICAgICAgICAgICAgdW5zaWduZWQgblRocmVhZHMsCiAgICAgICAgICAgICAgICAgICAgIEltcGwmIHVzZWRJbXBsKQp7CiAgICBpZiAoblRocmVhZHMgPT0gMCkgblRocmVhZHMgPSAxOwogICAgaWYgKG5UaHJlYWRzID09IDEgfHwgbiA8IDE2JzM4NCkgICAgICAgICAgLy8gU1QgZmFzdGVyIGZvciBzbWFsbCBpbnB1dHMKICAgICAgICByZXR1cm4gc2VhcmNoKGRhdGEsIG4sIHZhbHVlLCB1c2VkSW1wbCk7CgogICAgY29uc3Qgc3RkOjpzaXplX3QgY2h1bmsgPSAobiArIG5UaHJlYWRzIC0gMSkgLyBuVGhyZWFkczsKICAgIHN0ZDo6YXRvbWljPGludD4gcmVzdWx0ey0xfTsKICAgIHN0ZDo6YXRvbWljPEltcGw+IGltcGxTZWVue0ltcGw6OlNjYWxhcn07CiAgICBzdGQ6OnZlY3RvcjxzdGQ6OnRocmVhZD4gcG9vbDsKCiAgICBmb3IgKHVuc2lnbmVkIHQgPSAwOyB0IDwgblRocmVhZHM7ICsrdCkgewogICAgICAgIGNvbnN0IHN0ZDo6c2l6ZV90IHN0YXJ0ID0gdCAqIGNodW5rOwogICAgICAgIGlmIChzdGFydCA+PSBuKSBicmVhazsKICAgICAgICBjb25zdCBzdGQ6OnNpemVfdCBlbmQgPSBzdGQ6Om1pbihzdGFydCArIGNodW5rLCBuKTsKCiAgICAgICAgcG9vbC5lbXBsYWNlX2JhY2soWyYsIHN0YXJ0LCBlbmRdKCkgewogICAgICAgICAgICBJbXBsIGxvY2FsSW1wbDsKICAgICAgICAgICAgaW50IGxvY2FsSWR4ID0gc2VhcmNoKGRhdGEgKyBzdGFydCwgZW5kIC0gc3RhcnQsIHZhbHVlLCBsb2NhbEltcGwpOwogICAgICAgICAgICBpbXBsU2Vlbi5zdG9yZShsb2NhbEltcGwsIHN0ZDo6bWVtb3J5X29yZGVyX3JlbGF4ZWQpOwoKICAgICAgICAgICAgaWYgKGxvY2FsSWR4ICE9IC0xKSB7CiAgICAgICAgICAgICAgICBpbnQgZ2xvYmFsID0gc3RhdGljX2Nhc3Q8aW50PihzdGFydCArIGxvY2FsSWR4KTsKICAgICAgICAgICAgICAgIGludCBleHBlY3RlZCA9IC0xOwogICAgICAgICAgICAgICAgcmVzdWx0LmNvbXBhcmVfZXhjaGFuZ2Vfc3Ryb25nKGV4cGVjdGVkLCBnbG9iYWwsCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgc3RkOjptZW1vcnlfb3JkZXJfcmVsYXhlZCk7CiAgICAgICAgICAgIH0KICAgICAgICB9KTsKICAgIH0KICAgIGZvciAoYXV0byYgdGggOiBwb29sKSB0aC5qb2luKCk7CgogICAgdXNlZEltcGwgPSBpbXBsU2Vlbi5sb2FkKHN0ZDo6bWVtb3J5X29yZGVyX3JlbGF4ZWQpOwogICAgcmV0dXJuIHJlc3VsdC5sb2FkKCk7Cn0KCn0gIC8vIG5hbWVzcGFjZSBmYXN0X2ZpbmQKCi8vIOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkOKVkCBEZW1vIG1haW4g4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQ4pWQCnN0YXRpYyBzdGQ6OnN0cmluZyB0b19zdHJpbmcoZmFzdF9maW5kOjpJbXBsIGltcGwpIHsKICAgIHN3aXRjaCAoaW1wbCkgewogICAgICAgIGNhc2UgZmFzdF9maW5kOjpJbXBsOjpTY2FsYXI6IHJldHVybiAiU2NhbGFyIjsKICAgICAgICBjYXNlIGZhc3RfZmluZDo6SW1wbDo6QVZYMjogICByZXR1cm4gIkFWWDIiOwogICAgICAgIGNhc2UgZmFzdF9maW5kOjpJbXBsOjpBVlg1MTI6IHJldHVybiAiQVZYLTUxMiI7CiAgICB9CiAgICByZXR1cm4gIlVua25vd24iOwp9CgppbnQgbWFpbihpbnQgYXJnYywgY2hhcioqIGFyZ3YpIHsKICAgIGNvbnN0ZXhwciBzdGQ6OnNpemVfdCBOID0gMTAnMDAwOwogICAgc3RkOjp2ZWN0b3I8aW50PiBkYXRhKE4pOwogICAgZm9yIChzdGQ6OnNpemVfdCBpID0gMDsgaSA8IE47ICsraSkgZGF0YVtpXSA9IChpICogNzcgKyAxMjMpICYgMHg3RkZGOwoKICAgIC8vIC0tLS0tLS0tLSBSYW5kb21seSBwaWNrIGEga2V5IGZyb20gdGhlIGRhdGEgc2V0CiAgICBzdGQ6OnJhbmRvbV9kZXZpY2UgcmQ7CiAgICBzdGQ6Om10MTk5MzcgICAgICAgcm5nKHJkKCkpOwogICAgc3RkOjp1bmlmb3JtX2ludF9kaXN0cmlidXRpb248c3RkOjpzaXplX3Q+IGRpc3QoMCwgTiAtIDEpOwogICAgY29uc3Qgc3RkOjpzaXplX3QgcmFuZElkeCA9IGRpc3Qocm5nKTsKICAgIGNvbnN0IGludCBrZXkgPSBkYXRhW3JhbmRJZHhdOwoKICAgIGNvbnN0IGJvb2wgdXNlTVQgPSAoYXJnYyA+IDEgJiYgc3RkOjpzdHJpbmcoYXJndlsxXSkgPT0gIi0tbXQiKTsKCiAgICBjb25zdCB1bnNpZ25lZCBod1RocmVhZHMgPQogICAgICAgIHN0ZDo6dGhyZWFkOjpoYXJkd2FyZV9jb25jdXJyZW5jeSgpID8gc3RkOjp0aHJlYWQ6OmhhcmR3YXJlX2NvbmN1cnJlbmN5KCkgOiAxOwoKICAgIGZhc3RfZmluZDo6SW1wbCBpbXBsVXNlZDsKICAgIGNvbnN0IGF1dG8gdDAgPSBzdGQ6OmNocm9ubzo6aGlnaF9yZXNvbHV0aW9uX2Nsb2NrOjpub3coKTsKICAgIGludCBpZHggPSB1c2VNVAogICAgICAgICAgICAgICAgPyBmYXN0X2ZpbmQ6OnNlYXJjaF9tdChkYXRhLmRhdGEoKSwgZGF0YS5zaXplKCksIGtleSwKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgaHdUaHJlYWRzLCBpbXBsVXNlZCkKICAgICAgICAgICAgICAgIDogZmFzdF9maW5kOjpzZWFyY2ggICAoZGF0YS5kYXRhKCksIGRhdGEuc2l6ZSgpLCBrZXksCiAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgIGltcGxVc2VkKTsKICAgIGNvbnN0IGF1dG8gdDEgPSBzdGQ6OmNocm9ubzo6aGlnaF9yZXNvbHV0aW9uX2Nsb2NrOjpub3coKTsKICAgIGNvbnN0IGRvdWJsZSBtaWNybyA9CiAgICAgICAgc3RkOjpjaHJvbm86OmR1cmF0aW9uX2Nhc3Q8c3RkOjpjaHJvbm86OmR1cmF0aW9uPGRvdWJsZSwgc3RkOjptaWNybz4+KHQxIC0gdDApLmNvdW50KCk7CgogICAgc3RkOjpjb3V0IDw8ICh1c2VNVCA/ICJbTVRdICIgOiAiW1NUXSAiKQogICAgICAgICAgICAgIDw8ICJJbXBsOiAiIDw8IHRvX3N0cmluZyhpbXBsVXNlZCkKICAgICAgICAgICAgICA8PCAiIHwgS2V5OiAiIDw8IGtleQogICAgICAgICAgICAgIDw8ICIgfCBJbmRleDogIiA8PCBpZHgKICAgICAgICAgICAgICA8PCAiIHwgVGltZTogIiA8PCBtaWNybyA8PCAiIMK1cyIKICAgICAgICAgICAgICA8PCAiIHwgTG9naWNhbCBjb3JlczogIiA8PCBod1RocmVhZHMKICAgICAgICAgICAgICA8PCAnXG4nOwp9

Success #stdin #stdout 0.01s 5284KB

stdin

Standard input is empty

stdout

[ST] Impl: Scalar | Key: 3638 | Index: 2599 | Time: 1.98 µs | Logical cores: 8

https://ideone.com/QIzQBS

language:

C++14 (clang 8.0)

created:

visibility:

public

Share or Embed source code

Discover > Sphere Engine API

The brand new service which powers Ideone!

Discover > IDE Widget

Widget for compiling and running the source code in a web browser!

Discover > Sphere Engine API

Discover > IDE Widget

Choose your language