Подтвердить что ты не робот

В чем разница между сканированием Seq Scan и битмапом в postgres?

В выводе команды объяснения я нашел два термина "Seq Scan" и "Bitmap heap Scan". Может кто-нибудь сказать мне, в чем разница между этими двумя типами сканирования? (Я использую PostgreSql)

4b9b3361

Ответ 1

http://www.postgresql.org/docs/8.2/static/using-explain.html

В принципе, последовательное сканирование переходит к фактическим строкам и начинается чтение из строки 1 и продолжается до тех пор, пока запрос не будет выполнен (это может быть не вся таблица, например, в случае ограничения)

Растровое сканирование кучи означает, что PostgreSQL обнаружил небольшое подмножество строк для извлечения (например, из индекса) и собирает только те строки. Разумеется, это будет намного больше, потому что быстрее, только когда ему нужно небольшое подмножество строк.

Возьмем пример:

create table test (a int primary key, b int unique, c int);
insert into test values (1,1,1), (2,2,2), (3,3,3), (4,4,4), (5,5,5);

Теперь мы можем легко получить сканирование seq:

explain select * from test where a != 4

                       QUERY PLAN                        
---------------------------------------------------------
 Seq Scan on test  (cost=0.00..34.25 rows=1930 width=12)
   Filter: (a <> 4)

Он выполнил последовательное сканирование, потому что он оценивает его захват подавляющего большинства таблицы; стремясь сделать это (вместо большого, беспроблемного чтения) было бы глупо.

Теперь мы можем использовать индекс:

explain select * from test where a = 4 ;
                              QUERY PLAN                              
----------------------------------------------------------------------
 Index Scan using test_pkey on test  (cost=0.00..8.27 rows=1 width=4)
   Index Cond: (a = 4)

И, наконец, мы можем получить некоторые растровые операции:

explain select * from test where a = 4 or a = 3;
                                  QUERY PLAN                                  
------------------------------------------------------------------------------
 Bitmap Heap Scan on test  (cost=8.52..13.86 rows=2 width=12)
   Recheck Cond: ((a = 4) OR (a = 3))
   ->  BitmapOr  (cost=8.52..8.52 rows=2 width=0)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 4)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 3)

Мы можем прочитать это как:

  • Создайте растровое изображение строк, которые мы хотим для a = 4. (Сканирование растрового изображения)
  • Создайте растровое изображение строк, которые мы хотим для a = 3. (Сканирование растрового изображения)
  • Или два растровых изображения вместе (BitmapOr)
  • Посмотрите на эти строки в таблице (Сканирование растровой карты) и убедитесь, что a = 4 или = 3 (перепроверьте cond)

[Да, эти планы запросов глупы, но это потому, что мы не смогли проанализировать test Если бы мы его проанализировали, все они были бы последовательными сканированиями, так как есть 5 крошечных строк]