У меня есть веб-приложение, которое должно отправлять отчеты об использовании, я хочу использовать Amazon RedShift в качестве хранилища данных для этой цели, Как мне собрать данные?
Каждый раз, когда пользователь взаимодействует с моим приложением, я хочу сообщить об этом. Поэтому, когда я должен писать файлы на S3? и сколько? Я имею в виду: - Если вы не отправляете информацию немедленно, я могу потерять ее в результате потерянного соединения или из-за ошибки в моей системе, когда она была собрана, и приготовьтесь к отправке на S3... - Если я пишу файлы на S3 при каждом взаимодействии с пользователем, у меня в итоге появятся сотни файлов (у каждого файла будут минимальные данные), которые нужно будет управлять, сортировать, удалять после копирования в RedShift.. эта доза не кажется как хорошее решение.
Что мне не хватает? Должен ли я использовать DynamoDB вместо этого, должен ли я использовать простую вставку в Redshift вместо этого??
Если мне нужно записать данные в DynamoDB, я должен удалить таблицу удержания после копирования. Каковы наилучшие методы?
В любом случае, какие наилучшие методы избегают дублирования данных в RedShift?
Цените помощь!