Я ищу код C/С++ для VAD (обнаружение активности голоса).
В основном, мое приложение считывает кадры PCM с устройства. Я хотел бы знать, когда пользователь говорит. Я не ищу алгоритм распознавания речи, но только для обнаружения голоса.
Я хотел бы знать, когда пользователь говорит, и когда он заканчивает:
bool isVAD (короткий * pcm, size_t count);