Скажем, у вас есть доступ к учетной записи электронной почты с историей полученных писем с прошлых лет (~ 10 тыс. электронных писем), разделенных на 2 группы.
- подлинный адрес электронной почты
- спам
Как бы вы приблизились к задаче создания решения нейронной сети, которое можно было бы использовать для обнаружения спама - в основном классифицировать любое электронное письмо как спам или не спам?
Предположим, что выборка электронной почты уже существует, и нам нужно сосредоточиться только на части классификации.
Основные моменты, на которые я надеюсь получить ответ, будут:
- Какие параметры выбрать как вход для NN и почему?
- Какая структура NN, скорее всего, будет работать лучше всего для такой задачи?
Также рекомендуются любые рекомендации по ресурсам или существующие реализации (желательно на С#)
Спасибо
ИЗМЕНИТЬ
- Я настроен на использование нейронных сетей, поскольку основным аспектом проекта является проверка того, как подход NN будет работать для обнаружения спама.
- Также это "игрушечная проблема" просто для изучения предмета по нейронным сетям и спама.