В выводе команды объяснения я нашел два термина "Seq Scan" и "Bitmap heap Scan". Может кто-нибудь сказать мне, в чем разница между этими двумя типами сканирования? (Я использую PostgreSql)
В чем разница между сканированием Seq Scan и битмапом в postgres?
Ответ 1
http://www.postgresql.org/docs/8.2/static/using-explain.html
В принципе, последовательное сканирование переходит к фактическим строкам и начинается чтение из строки 1 и продолжается до тех пор, пока запрос не будет выполнен (это может быть не вся таблица, например, в случае ограничения)
Растровое сканирование кучи означает, что PostgreSQL обнаружил небольшое подмножество строк для извлечения (например, из индекса) и собирает только те строки. Разумеется, это будет намного больше, потому что быстрее, только когда ему нужно небольшое подмножество строк.
Возьмем пример:
create table test (a int primary key, b int unique, c int);
insert into test values (1,1,1), (2,2,2), (3,3,3), (4,4,4), (5,5,5);
Теперь мы можем легко получить сканирование seq:
explain select * from test where a != 4
QUERY PLAN
---------------------------------------------------------
Seq Scan on test (cost=0.00..34.25 rows=1930 width=12)
Filter: (a <> 4)
Он выполнил последовательное сканирование, потому что он оценивает его захват подавляющего большинства таблицы; стремясь сделать это (вместо большого, беспроблемного чтения) было бы глупо.
Теперь мы можем использовать индекс:
explain select * from test where a = 4 ;
QUERY PLAN
----------------------------------------------------------------------
Index Scan using test_pkey on test (cost=0.00..8.27 rows=1 width=4)
Index Cond: (a = 4)
И, наконец, мы можем получить некоторые растровые операции:
explain select * from test where a = 4 or a = 3;
QUERY PLAN
------------------------------------------------------------------------------
Bitmap Heap Scan on test (cost=8.52..13.86 rows=2 width=12)
Recheck Cond: ((a = 4) OR (a = 3))
-> BitmapOr (cost=8.52..8.52 rows=2 width=0)
-> Bitmap Index Scan on test_pkey (cost=0.00..4.26 rows=1 width=0)
Index Cond: (a = 4)
-> Bitmap Index Scan on test_pkey (cost=0.00..4.26 rows=1 width=0)
Index Cond: (a = 3)
Мы можем прочитать это как:
- Создайте растровое изображение строк, которые мы хотим для a = 4. (Сканирование растрового изображения)
- Создайте растровое изображение строк, которые мы хотим для a = 3. (Сканирование растрового изображения)
- Или два растровых изображения вместе (BitmapOr)
- Посмотрите на эти строки в таблице (Сканирование растровой карты) и убедитесь, что a = 4 или = 3 (перепроверьте cond)
[Да, эти планы запросов глупы, но это потому, что мы не смогли проанализировать test
Если бы мы его проанализировали, все они были бы последовательными сканированиями, так как есть 5 крошечных строк]