Я пытаюсь реализовать изложение отношений между парами глаголов. Я хочу использовать путь зависимости от одного глагола к другому как функцию для моего классификатора (предсказывает, существует ли отношение X или нет). Но я не уверен, как кодировать путь зависимости как функцию. Ниже приведены некоторые примеры путей зависимостей, поскольку аннотации отношений, разделенных пространством, от Collandered Dependencies от StanfordCoreNLP:
nsubj acl nmod:from acl nmod:by conj:and
nsubj nmod:into
nsubj acl:relcl advmod nmod:of
Важно иметь в виду, что этот путь имеет переменную длину, а отношение может повторно отображаться без каких-либо ограничений.
Два компрометирующих способа кодирования этой функции, которые приходят мне на ум:
1) Игнорируйте последовательность и просто используйте одну функцию для каждого отношения, ее значение будет числом раз, которое оно появляется на пути
2) Имеют скользящее окно длины n и имеют одну особенность для каждой возможной пары отношений со значением, являющимся числом раз, когда эти два отношения появлялись последовательно. Я предполагаю, что это так, как один кодирует n-граммы. Тем не менее, число возможных отношений составляет 50, а это значит, что я не могу пойти с этим подходом.
Любые предложения приветствуются.