Подтвердить что ты не робот

Параллельные вычисления с кластерами, отличными от снега SOCK

Недавнее добавление прямой поддержки параллельных вычислений в R2.14 вызвало у меня вопрос. Существует множество вариантов создания кластеров в R. Я регулярно использую кластеры snow SOCK, но я знаю, что есть другие способы, такие как MPI. Я использую кластеры SOCK snow, потому что мне не нужно устанавливать какое-либо дополнительное программное обеспечение (я использую Fedora 13).

Итак, мои конкретные вопросы:

  • Есть ли выигрыш в производительности при использовании кластеров, отличных от SOCK?
  • Легче ли создавать кластеры на нескольких компьютерах с использованием кластеров, отличных от SOCK?
4b9b3361

Ответ 1

1) существует ограниченное количество доступных тестов, которые доказывают, что MPI будет быстрее, чем SOCKets. Но как пользователь R вы, вероятно, не будете заботиться об этих различиях. Они находятся в области миллисекунд, и количество сообщений не так высоко в неловко параллельных проблемах.

2) Да, вам не обязательно указывать список имен компьютеров или IP-адресов. Для компьютерного кластера с 100 узлами это усложняется. Но все зависит от вашего компьютерного кластера. В большинстве случаев MPI или PVM уже предустановлены, и все работает из коробки с помощью Rmpi,...