Подтвердить что ты не робот

Наилучшая производительность для получения результатов EAV MySQL как реляционная таблица

Я хочу извлечь результаты из таблиц EAV (сущность-атрибут-значение) или, более конкретно, таблиц сущностей-метаданных (думаю, как wordpress wp_posts и wp_postmeta) как "красиво отформатированная реляционная таблица", чтобы выполнить некоторую сортировку и/или фильтрацию.

Я нашел несколько примеров того, как отформатировать результаты в запросе (в отличие от написания 2 запросов и объединения результатов в коде), но я хотел бы знать "самый эффективный" метод для этого, особенно для больших наборов результатов.

И когда я говорю "наиболее эффективный", я имею в виду что-то вроде следующих сценариев:

Получить все сущности с именем, например XYZ

Возвращает список объектов, отсортированных по дню рождения


например. поверните это:

** ENTITY **
-----------------------
ID  | NAME | whatever
-----------------------
 1  | bob  | etc
 2  | jane | etc
 3  | tom  | etc

** META **
------------------------------------
ID | EntityID | KEY         | VALUE
------------------------------------
 1 |   1      | first name  | Bob
 2 |   1      | last name   | Bobson
 3 |   1      | birthday    | 1983-10-10
 . |   2      | first name  | Jane
 . |   2      | last name   | Janesdotter
 . |   2      | birthday    | 1983-08-10
 . |   3      | first name  | Tom
 . |   3      | last name   | Tomson
 . |   3      | birthday    | 1980-08-10

в это:

** RESULTS **
-----------------------------------------------
EID | NAME | first name | last name    | birthday
-----------------------------------------------
 1  | bob  | Bob        | Bobson       | 1983-10-10
 2  | jane | Jane       | Janesdotter  | 1983-08-10
 3  | tom  | Tom        | Tomson       | 1980-08-10

поэтому я могу сортировать или фильтровать любое из мета-полей.


Я нашел несколько предложений здесь, но я не могу найти никакого обсуждения того, что работает лучше.

Опции

  • GROUP_CONCAT:
    SELECT e.*, GROUP_CONCAT( CONCAT_WS('||', m.KEY, m.VALUE) ORDER BY m.KEY SEPARATOR ';;' )
    FROM `ENTITY` e JOIN `META` m ON e.ID = m.EntityID
    
  • Multi-Join:
    SELECT e.*, m1.VALUE as 'first name', m2.VALUE as 'last name', m3.VALUE as 'birthday'
    FROM `ENTITY` e
    LEFT JOIN `META` m1
        ON e.ID = m1.EntityID AND m1.meta_key = 'first name'
    LEFT JOIN `META` m2
        ON e.ID = m2.EntityID AND m2.meta_key = 'last name'
    LEFT JOIN `META` m3
        ON e.ID = m3.EntityID AND m3.meta_key = 'birthday'
    
  • Коалесцентный:
    SELECT e.*
       , MAX( IF(m.KEY= 'first name', m.VALUE, NULL) ) as 'first name'
       , MAX( IF(m.KEY= 'last name', m.VALUE, NULL) ) as 'last name'
       , MAX( IF(m.KEY= 'birthday', m.VALUE, NULL) ) as 'birthday'
    FROM `ENTITY` e
    JOIN `META` m
        ON e.ID = m.EntityID
    
  • код:
    SELECT e.* FROM `ENTITY` e WHERE e.ID = {whatever};
    
    в PHP, создать объект-заполнитель из результата
    SELECT m.* FROM `META` m WHERE m.EntityID = {whatever};
    
    в PHP, просмотреть результаты и прикрепить к объекту объекта, например:   $e->{$result->key} = $result->VALUE

Что лучше вообще, а для фильтрации/сортировки?

Похожие вопросы:

4b9b3361

Ответ 1

Все, что используется с помощью поворота или агрегатов, вероятно, будет быстрее, поскольку они не требуют, чтобы таблица была объединена. Подходы, основанные на объединении, потребуют от оптимизатора выполнить несколько операций подзапроса, а затем объединить результаты. Для небольшого набора данных это может не иметь особого значения, но это может значительно снизить производительность, если вы выполняете аналитический запрос в более крупном наборе данных,

Ответ 2

Лучший способ узнать - это проверить, конечно. Ответ может отличаться в зависимости от размера набора данных, количества различных мета-ключей, их распределения (все ли сущности имеют значения для всех мета-ключей? Или только для некоторых из них?), Настройки вашей базы данных сервером и, возможно, многими другими факторами.

Если бы я предполагал, я бы сказал, что стоимость операций JOIN в варианте 2 будет меньше стоимости GROUP BY и агрегатных функций, необходимых в вариантах 1 и 3.

Итак, я ожидал бы найти вариант 2 быстрее, чем 1 и 3.

Чтобы измерить вариант 4, вам придется учитывать больше факторов, поскольку приложение может находиться на другом сервере, поэтому нагрузки двух серверов (db и application) и количества клиентов, которые будут запрашивать эти результаты, должны быть учитывается.


Sidenote: вам нужно GROUP BY e.ID в вариантах 1 и 3.