Насколько я понимаю, Spark является альтернативой Hadoop. Однако при установке Spark на странице установки запрашивается существующая установка Hadoop. Я не могу найти ничего, что разъясняет эти отношения.
Во-вторых, Spark, по-видимому, имеет хорошую связь с Cassandra и Hive. Оба имеют интерфейс стиля sql. Тем не менее, Spark имеет свой собственный sql. Зачем использовать Cassandra/Hive вместо Spark native sql? Предполагая, что это совершенно новый проект без существующей установки?