Я давно пользовался R и недавно начал работать с Python. Используя обычные системы РСУБД для хранилищ данных и R/Python для хрустания числа, я чувствую, что теперь нужно замалчивать руки с помощью анализа больших данных.
Я хотел бы знать, как начать работу с хрустом больших данных. - Как начать с Map/Reduce и использовать Hadoop
- Как я могу использовать свои навыки в R и Python, чтобы начать работу с анализом больших данных. Например, с помощью проекта Python Disco.
- Использование пакета RHIPE и поиск наборов игрушек и проблемных областей.
- Поиск правильной информации, позволяющей мне решить, нужно ли мне переходить в NoSQL из баз данных типа РСУБД.
В целом, я хотел бы знать, как начать небольшие и постепенно наращивать свои навыки и ноу-хау в области анализа больших данных.
Спасибо за ваши предложения и рекомендации. Я прошу прощения за общий характер этого запроса, но я хочу получить больше информации относительно этой темы.
- Суровые