У меня есть таблица городов, которая выглядит так.
|id| Name |
|1 | Paris |
|2 | London |
|3 | New York|
У меня есть таблица тегов, которая выглядит так.
|id| tag |
|1 | Europe |
|2 | North America |
|3 | River |
и таблицу city_tags:
|id| city_id | tag_id |
|1 | 1 | 1 |
|2 | 1 | 3 |
|3 | 2 | 1 |
|4 | 2 | 3 |
|5 | 3 | 2 |
|6 | 3 | 3 |
Как я могу рассчитать, какие наиболее тесно связанные города? Например. Если бы я смотрел на город 1 (Париж), результаты должны быть следующими: Лондон (2), Нью-Йорк (3)
Я нашел Jaccard index, но я не уверен, как лучше всего это реализовать.