Я пытаюсь определить суставы скелета (или, по крайней мере, для отслеживания одной ладони) с помощью обычной веб-камеры. Я смотрел по всему Интернету и не могу найти способ сделать это.
Каждый пример, который я нашел, использует Kinect. Я хочу использовать одну веб-камеру.
Мне не нужно вычислять глубину суставов - мне просто нужно уметь распознавать их положение X, Y в кадре. Вот почему я использую веб-камеру, а не Kinect.
До сих пор я смотрел:
- OpenCV (функциональность "скелета" в нем - это процесс упрощения графических моделей, но это не обнаружение и/или скелетонирование человеческого тела).
- OpenNI (с NiTE) - единственный способ получить соединения - использовать устройство Kinect, поэтому это не работает с веб-камерой.
Я ищу библиотеку C/С++ (но на данный момент смотрю на любой другой язык), желательно с открытым исходным кодом (но, опять же, рассмотрим любую лицензию), которая может сделать следующее:
- Учитывая изображение (кадр из веб-камеры), вычислите положения X, Y видимых суставов
- [Необязательно] Учитывая, что поток видеозахвата обращается к моему коду с событиями для позиций суставов
- Не обязательно быть суперточным, но предпочтет, чтобы он был очень быстрым (время обработки менее 0,1 сек на каждый кадр)
Было бы очень признательно, если кто-то может помочь мне в этом. Я застрял в этом несколько дней, не имея четкого пути для продолжения.
UPDATE
Спустя 2 года было найдено решение: http://dlib.net/imaging.html#shape_predictor