У меня довольно большая таблица с 19 000 000 записями, и у меня проблема с повторяющимися строками. Там много подобных вопросов даже здесь, в SO, но ни один из них, кажется, не дает мне удовлетворительного ответа. Некоторые моменты, которые следует учитывать:
- Уникальность строк определяется двумя столбцами,
location_id
иdatetime
. - Я хотел бы сохранить время выполнения как можно быстрее (< 1 час).
- Копирование таблиц не очень возможно, так как размер таблицы составляет несколько гигабайт.
- Не нужно беспокоиться об отношениях.
Как сказано, каждый location_id
может иметь только один отдельный datetime
, и я хотел бы удалить все повторяющиеся экземпляры. Неважно, какой из них выживает, поскольку данные идентичны.
Любые идеи?