Я изучаю fuzzywuzzy
в Python.
Я понимаю понятия fuzz.ratio
, fuzz.partial_ratio
, fuzz.token_sort_ratio
и fuzz.token_set_ratio
. У меня вопрос, когда использовать какую функцию?
- Должен ли я сначала проверить длину 2 строк, скажем, если они не похожи, то исключить
fuzz.partial_ratio
? - Если длина двух строк одинакова, я буду использовать
fuzz.token_sort_ratio
? - Должен ли я всегда использовать
fuzz.token_set_ratio
?
Кто-нибудь знает, какие критерии использует SeatGeek?
Я пытаюсь создать сайт по недвижимости, думая использовать fuzzywuzzy
для сравнения адресов.