Я новичок в машинном обучении, и для своего первого проекта я бы хотел написать наивный фильтр спама Bayes. Мне было интересно, есть ли общедоступные учебные комплекты помеченных спам-сообщений, а не спам-писем, предпочтительно в виде простого текста, а не в дампе реляционной базы данных (если они не печатают их?).
Я знаю, что такая общедоступная база данных существует для других видов классификации текста, в частности текста новостей. Я просто не мог найти то же самое для электронных писем.