Каков наилучший способ предотвратить дублирование сообщений в Amazon SQS? У меня есть SQS доменов, ожидающих обхода. прежде чем я добавлю новый домен в SQS, я могу проверить с сохраненными данными, чтобы увидеть, был ли он недавно просканирован, чтобы предотвратить дубликаты.
Проблема с доменами, которые еще не были сканированы. Например, если в очереди, которая не была сканирована, 1000 доменов. Любая из этих ссылок может быть добавлена снова и снова и снова. Который раздувает мой SQS сотням тысяч сообщений, которые в основном дублируются.
Как это предотвратить? Есть ли способ удалить все дубликаты из очереди? Или есть способ поиска очереди для сообщения, прежде чем я его добавлю? Я чувствую, что это проблема, которую должен испытать любой человек с SQS.
Один из вариантов, который я могу увидеть, - это хранить некоторые данные до того, как домен будет добавлен в SQS. Но если мне нужно хранить данные дважды, этот вид разрушает точку использования SQS в первую очередь.