Подтвердить что ты не робот

Поиск элемента в массиве, который не повторяется кратным три раза?

После прочтения этого интересного вопроса мне напомнили сложный вопрос интервью, который у меня когда-то был, что я никогда не удовлетворительно ответил:

Вам предоставляется массив из n 32-разрядных целых без знака, где каждый элемент (кроме одного) повторяется кратным три раза. В O (n) время и используя как можно меньше вспомогательного пространства, найдите элемент массива, который не будет кратным три раза.

В качестве примера, учитывая этот массив:

1 1 2 2 2 3 3 3 3 3 3

Мы будем выводить 1, задавая массив

3 2 1 3 2 1 2 3 1 4 4 4 4

Мы будем выводить 4.

Это можно легко решить в O (n) времени и O (n) пространстве, используя хеш-таблицу для подсчета частот каждого элемента, хотя я сильно подозреваю, что, поскольку в заявлении о проблеме конкретно упоминалось, что массив содержит 32- разрядных целых без знака, что есть гораздо лучшее решение (я предполагаю, что O (1) пробел).

Есть ли у кого-нибудь идеи о том, как это решить?

4b9b3361

Ответ 1

Это можно сделать в O (n) времени и O (1) пространстве.

Вот как вы можете это сделать с постоянным пространством в С#. Я использую идею "xor, за исключением бит из трех состояний". Для каждого установленного бита операция "xor" увеличивает соответствующее значение 3-состояния.

Конечным результатом будет номер, двоичное представление которого имеет 1s в местах, которые имеют 1 или 2 в конечном значении.

void Main() {
    Console.WriteLine (FindNonTriple(new uint[] 
                        {1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 3} ));
    // 1

    Console.WriteLine (FindNonTriple(new uint[] 
                        {3, 2, 1, 3, 2, 1, 3, 2, 1, 4, 4, 4, 4} ));
    // 4
}

uint FindNonTriple(uint[] args) {
    byte[] occurred = new byte[32];

    foreach (uint val in args) {
        for (int i = 0; i < 32; i++) {
            occurred[i] = (byte)((occurred[i] + (val >> i & 1)) % 3);
        }
    }

    uint result = 0;
    for (int i = 0; i < 32; i++) {
        if (occurred[i] != 0) result |= 1u << i;
    }
    return result;
}

Ответ 2

Очевидное решение сделать это в постоянном пространстве - это сортировать его с помощью алгоритма на месте, а затем сканировать один раз над массивом.

К сожалению, для этого обычно требуется время O (n log n) и O (1).

Но поскольку записи имеют ограниченную длину ключа (32 бит), вы можете использовать в качестве сортировки сортировки алгоритмов сортировки (существуют на месте сортировка по методу radix, они нестабильны, но это не имеет значения здесь). Там у вас время O (n) и O (1).

РЕДАКТИРОВАТЬ. Кстати, вы могли бы использовать этот подход, чтобы найти также ВСЕ числа, которые отображаются не кратно 3 раза, в случае, если вы позволите, чтобы более одного номера могли иметь это свойство.

Ответ 3

Вы ищете элемент с номером rep, который отличен от нуля (mod 3). Я думаю, что я бы сделал это рекурсивно:

  • разделить массив пополам
  • найдите элементы с числом rep, которое не равно нулю (mod 3) в каждой половине
  • объединить половинки, сохранить подсчеты для неравных ключей и добавить подсчеты для равных ключей
  • вычеркивать любой с count = 0 (mod 3)
  • возвращает это как набор значений для текущей части ввода.

Даже не пытаясь оптимизировать вещи за основным алгоритмом (например, не беспокоясь о сохранении только двух бит на счетчик), это, похоже, очень хорошо. Я включил код для создания достаточно большого тестового примера (например, 1500+ элементов) и распечатал размеры создаваемых карт. В любой момент времени на картах создается максимум около 50 элементов (т.е. Он использует только две карты за раз, а наибольшая из них - около 25 элементов). Технически, поскольку это означает, я считаю, что в настоящее время это что-то вроде O (N log N), но если вы переключились на контейнер, основанный на хеше, я считаю, что вы ожидаете O (N).

#include <map>
#include <iterator>
#include <iostream>
#include <algorithm>
#include <utility>
#include <vector>
#include <time.h>

class zero_mod { 
    unsigned base;
public:
    zero_mod(unsigned b) : base(b) {}

    bool operator()(std::pair<int, int> const &v) { 
        return v.second % base == 0; 
    }
};

// merge two maps together -- all keys from both maps, and the sums 
// of equal values.
// Then remove any items with a value congruent to 0 (mod 3)
//
std::map<int, int> 
merge(std::map<int, int> const &left, std::map<int, int> const &right) { 
    std::map<int, int>::const_iterator p, pos;
    std::map<int, int> temp, ret;

    std::copy(left.begin(), left.end(), std::inserter(temp, temp.end()));
    for (p=right.begin(); p!=right.end(); ++p) 
        temp[p->first] += p->second;
    std::remove_copy_if(temp.begin(), temp.end(), 
                        std::inserter(ret, ret.end()), 
                        zero_mod(3));
    return ret;
}   

// Recursively find items with counts != 0 (mod 3):    
std::map<int, int> 
do_count(std::vector<int> const &input, size_t left, size_t right) { 
    std::map<int, int> left_counts, right_counts, temp, ret;

    if (right - left <= 2) {
        for (size_t i=left; i!=right; ++i) 
            ++ret[input[i]];
        return ret;
    }
    size_t middle = left + (right-left)/2;
    left_counts = do_count(input, left, middle);
    right_counts = do_count(input, middle, right);
    ret = merge(left_counts, right_counts);

    // show the size of the map to get an idea of how much storage we're using.
    std::cerr << "Size: " << ret.size() << "\t";
    return ret;
}

std::map<int, int> count(std::vector<int> const &input) { 
    return do_count(input, 0, input.size());
}

namespace std { 
    ostream &operator<<(ostream &os, pair<int, int> const &p) { 
        return os << p.first;
    }
}

int main() {
    srand(time(NULL));
    std::vector<int> test;

    // generate a bunch of data by inserting packets of 3 items    
    for (int i=0; i<100; i++) {
        int packets = std::rand() % 10;
        int value = rand() % 50;
        for (int i=0; i<packets * 3; i++) 
            test.push_back(value);
    }

    // then remove one item, so that value will not occur a multiple of 3 times
    size_t pos = rand() % test.size();
    std::cerr << "Removing: " << test[pos] << " at position: " << pos << "\n";

    test.erase(test.begin()+pos);

    std::cerr << "Overall size: " << test.size() << "\n";

    std::random_shuffle(test.begin(), test.end());

    // Note that we use a map of results, so this will work if multiple values
    // occur the wrong number of times.    
    std::map<int, int> results = count(test);

    // show the results. Should match the value shown as removed above:
    std::copy(results.begin(), results.end(), 
        std::ostream_iterator<std::pair<int, int> >(std::cout, "\n"));
    return 0;
}