Я ищу легкую библиотеку Java, которая поддерживает Nearest Neighbor Searches по локализации Чувствительная хеширование для почти одинаково распределенных данных в массиве с высоким размером (в моем случае 32) с несколькими сотнями тысяч точек данных.
Это достаточно хорошо, чтобы получить все записи в ведре для запроса. Какие из них мне действительно нужны, тогда можно было бы обработать по-другому с учетом некоторых параметров фильтра, в которые моя проблема включает.
Я уже нашел likelike, но надеюсь, что что-то немного меньше и без каких-либо других инструментов (например, Apache Hadoop в случай сходства).