Каковы соответствующие навыки в арсенале Ученого Данных? С появлением новых технологий каждый день, как выбрать и выбрать необходимое?
Несколько идей, связанных с этим обсуждением:
- Зная SQL и использование базы данных, такой как MySQL, PostgreSQL был отличным до появления NoSql и нереляционных баз данных. MongoDB, CouchDB и т.д. Становятся популярными для работы с данными веб-масштаба.
- Знание инструмента статистики, такого как R, достаточно для анализа, но для создания приложений, возможно, потребуется добавить в список Java, Python и т.д.
- Теперь данные поступают в виде текста, URL-адресов, мультимедиа, чтобы назвать несколько, и существуют различные парадигмы, связанные с их манипуляциями.
- Что относительно кластерных вычислений, параллельных вычислений, облака, Amazon EC2, Hadoop?
- Регрессия OLS теперь имеет искусственные нейронные сети, случайные леса и другие относительно экзотические машинные исследования/альдегирование данных. для компании
Мысли?