Я ищу реализацию фильтра цветного качества производства в Python для обработки довольно большого количества элементов (скажем, от 100 до 1B элементов с 0,01% ложноположительной скоростью).
Pybloom - это один из вариантов, но, похоже, он показывает свой возраст, поскольку он регулярно выдает ошибки DeprecationWarning на Python 2.5. Joe Gregorio также имеет реализацию.
Требования - это быстрый поиск и стабильность. Я также открыт для создания интерфейсов Python для особенно хороших реализаций c/С++ или даже для Jython, если есть хорошая реализация Java.
Отсутствие каких-либо рекомендаций по представлению битового массива/битового вектора, которое может обрабатывать бит ~ 16E9?