В моем коде на С++ я хочу прочитать из текстового файла (*.txt) и tokenize каждую запись. В частности, я хочу иметь возможность читать отдельные слова из файла, такие как "формат", "стоп", "Джейсон", "Европа" и т.д.
Я решил использовать fstream
для выполнения этой задачи, и я не знаю, как установить его разделителем на те, которые я хочу использовать (пробел, \n
, а также дефисы и даже апострофы, как в "Mcdonal's" ). Я понял, что пробел и \n
являются разделителями по умолчанию, но дефисы не являются, но я хочу рассматривать их как разделители, чтобы при анализе файла я получил слова в "бла-бла-ххх-звере-кошке" как просто "бла", "бла", "ххх", "животное", "кошка".
То есть, я хочу получить две строки из "переполнения стека", "вы" и т.д. и по-прежнему иметь возможность поддерживать \n
и пространство как разделители одновременно.