Мне нужно автоматически разделить видео речи словами, поэтому каждое слово является отдельным видеофайлом. Знаете ли вы какие-либо способы сделать это?
Мой план состоял в том, чтобы обнаружить тихие части и использовать их в качестве разделителей слов. Но я не нашел никакого инструмента для этого и выглядел так, как будто ffmpeg не подходит для этого.