Я новичок в этой области, а также терминологию, поэтому, пожалуйста, не стесняйтесь предлагать, если я где-то ошибаюсь. У меня есть два набора данных:
Набор данных 1:
A B C 0 E
A 0 C 0 0
A 0 C D E
A 0 C 0 E
То, как я это интерпретирую, в какой-то момент времени (A, B, C, E) происходило вместе, а также (A, C), (A, C, D, E) и т.д.
Набор данных 2:
5A 1B 5C 0 2E
4A 0 5C 0 0
2A 0 1C 4D 4E
3A 0 4C 0 3E
То, как я это интерпретирую, находится в какой-то момент времени, произошло 5 случаев появления A, 1 B, 5 случаев C и 2 появления E и т.д.
Я пытаюсь найти, какие элементы встречаются вместе и, если возможно, также выяснить причину и следствие для этого. Для этого я не понимаю, как использовать оба набора данных (или если их достаточно). Было бы неплохо иметь хороший учебник по этому вопросу, но мой основной вопрос: какой набор данных использовать и как действовать в (i) создании частых наборов элементов и (ii) создания правил ассоциации между ними.
Может ли кто-нибудь указать мне на практические уроки/примеры (желательно на Python) или хотя бы объяснить краткие слова о том, как подойти к этой проблеме?