У меня есть этот текстовый файл, который я прочитал в приложении Java, а затем подсчитал слова в нем по строкам. Прямо сейчас я разбиваю строки на слова
String.split([\\p{Punct}\\s+])"
Но я знаю, что я пропускаю некоторые слова из текстового файла. Например, слово "не может" следует разделить на два слова "может" и "т".
Запятые и другие знаки препинания должны быть полностью проигнорированы и рассматриваться как пробелы. Я пытался понять, как сформировать более точное регулярное выражение, чтобы сделать это, но я начинаю, когда дело доходит до этого, поэтому мне нужна помощь.
Что может быть лучшим регулярным выражением для той цели, которую я описал?