Подтвердить что ты не робот

Pentaho против Microsoft BI Stack

Моя компания активно инвестирует в MS BI Stack (службы отчетов SQL Server, службы анализа и услуги интеграции), но я хочу взглянуть на то, что похоже на наиболее обсуждаемую альтернативу Pentaho с открытым исходным кодом.

Я установил версию, и я получил ее и работал довольно безболезненно. Так хорошо. Но у меня нет времени, чтобы начать использовать его для реальной работы, чтобы получить полное представление о пакете.

Есть ли у вас какие-либо сведения о том, какие плюсы и минусы Pentaho против MS BI или любые ссылки на такие сравнения?

Очень ценно!

4b9b3361

Ответ 1

Я рассмотрел несколько битов Bi во время пути, чтобы выйти из бизнес-объектов. Многие мои комментарии предпочтительны. Оба набора инструментов превосходны. Некоторые вещи - это то, как я предпочитаю шоколадное мороженое мороженого над обычным шоколадом.

В Pentaho есть несколько действительно умных парней, работающих с ними, но Microsoft находится на хорошо финансированном и хорошо спланированном пути. Имейте в виду, что MS по-прежнему являются аутсайдерами на рынке баз данных. Oracle здесь король. Чтобы быть конкурентоспособным, MS выдает много положительных героев, когда вы покупаете базу данных и вынуждены несколько раз изобретать свою платформу. Я знаю, что речь идет не о базе данных, но в битве БД есть причина, по которой MS может отдать много, чтобы добавить ценность в свой стек.

1.) Платформа
SQL-сервер не запускается в Unix или Linux, поэтому они автоматически исключаются из этого рынка. Windows примерно такая же цена, как и некоторые версии или Unix. Windows довольно дешево и теперь работает неудачно. Это дает мне столько же проблем, как Linux.

2.) OLAP
Услуги анализа были заново изобрещены в 2005 году (текущий - 2008 год) по сравнению с версией 2000 года. Это более мощный способ magnatude более 2000. Пентахо (Mondrian) не так быстро, как только вы получите большой. Он также имеет несколько функций. Это очень хорошо, но инструментов меньше. Оба поддерживают Excel как платформу, которая является существенной. Версия MS более надежна.

3.) ETL
MS - DTS заменена SSIS. Опять же, порядок magnatude увеличивает скорость, мощность и способность. Он контролирует любое перемещение данных или управление программой. Если он не может этого сделать, вы можете написать script в Powershell. Наравне с Informatica в выпуске 2008 года. Пентахо. Гораздо лучше, чем раньше. Не так быстро, как хотелось бы, но я могу сделать почти все, что хочу.

4.) панель инструментов
Пентахо улучшил это. Это своего рода неудобно и недружелюбно развиваться, но для MS действительно нет реального эквивалента.

5.) отчеты
Отчеты MS действительно мощные, но не все, что сложно использовать. Мне сейчас нравится, но сначала он ненавидел, пока я не узнал об этом немного лучше. Я использовал хрустальные отчеты, а сборщик отчетов MS намного более мощный. Легко делать тяжелые вещи в MS, но немного сложнее делать легкие вещи. Пентахо немного неуклюж. Мне это совсем не нравилось, но ты мог. Я обнаружил, что это слишком сложно. Мне жаль, что это не было похоже на построитель отчетов Crystal или создатель отчетов MS, но это похоже на jasper. Я считаю, что это сложно. Это может быть предпочтительнее.

6.) ad hoc
MS - это был настоящий победитель для меня. Я тестировал его с моими пользователями, и они мгновенно влюблены в создатель отчетов пользователя MS. Что имело значение, так это то, как это было не просто в использовании, но и продуктивно. Пентахо - хорошая, но довольно старая школа. Он использует более типичную модель на основе мастера и имеет мощные инструменты, но я ее ненавижу. Это отличный инструмент для того, что он есть, но мы перешли от этого стиля, и никто не хочет возвращаться. Такая же проблема у меня была с logiXML. Интерфейс работал хорошо для того, что он был, но на самом деле не очень отличается от того, что мы использовали 12 лет. http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Есть несколько опытных людей, которые могут заставить Pentaho действительно работать хорошо, я просто нашел, что пакет MS стал более продуктивным.

Ответ 2

Предупреждение. Есть многочисленные сайты, в которых перечислены многочисленные недостатки, ошибки и раздражения с помощью SSIS. Не уверен, почему SSIS вышла на первое место с поста - но прежде чем делать ставку на свой проект, посмотрите, что люди говорят в блогосфере. По моему опыту, около 20: 1, рассказывая о том, как ужасно работать с SSIS - я тоже могу согласиться, в настоящее время ищу любую альтернативу.

Ответ 3

Отличная информация здесь? Я не пробовал Pentaho, но планировал проверить это. Я являюсь опытным консультантом MS BI, использующим его с 1998 года. SSIS очень быстр и очень эффективен, но критика наблюдается. Я обнаружил следующие проблемы с SSIS:

(1) Трудно отлаживать, вы получаете загадочные ошибки, которые могут не дать вам никакого намека на то, что и где проблема на самом деле.

(2) За предыдущий комментарий, это самая сильная среда разработки! Я понятия не имею, о чем они думают.

(a) Создайте таблицу со 100 или более столбцами и поместите на нее объединение слияния. Теперь вернитесь назад и попробуйте сделать обновление для объединения слияния (например, потяните за новый столбец). Это может занять несколько минут, даже на самой быстрой машине после того, как вы нажмете ok на объединении, чтобы сохранить изменения. У меня огромный поток данных с большим количеством записей и много объединений. Добавление одного столбца в поток данных занимает более полудня. Я обновляю объединение слиянием, а затем должен сделать что-то еще и проверить через 5-10 минут, чтобы убедиться, что это сделано. Ответ Microsoft на это состоит в том, чтобы разбить пакет на несколько пакетов, поместить данные в таблицу или двоичный код между ними. Хорошо, если вы собираетесь на диск между всеми шагами, вы, возможно, хорошо сделали все это в SQL! Одна из основных целей инструмента ETL - это все это в памяти и избежать дискового ввода-вывода.

(b) Дизайнер сразу падает, теряя всю вашу работу с момента последнего сохранения (из-за этого я делаю ctrl-S во сне)

(c) Мне пришлось выяснить взлом и создать XML-пакет SSIS в Excel для больших записей. У меня есть клиент Healthcare, где более 600 записей столбцов являются обычным явлением. Если вы попытаетесь определить формат файла с 600 столбцами в SSIS, вы должны набирать каждый столбец по одному за раз!!! Даже доступ к MS позволяет вам вырезать и вставлять макет из электронной таблицы в макет файла, но не SSIS. Поэтому мне пришлось сгенерировать XML из макета и вставить XML-код в нужное место в пакете. Уродливый способ сделать это, но это спасло целые дни работы и множество ошибок.

(d) Как и в (c), если вам нужно обрезать все ваши столбцы, и вы скажете более 600 из них, угадайте, что? В производном компоненте столбца вы должны набирать trim (column1) 600+ раз! Теперь я делаю все простые преобразования, подобные этому в SQL-запросе, чтобы получить данные, поскольку это можно легко создать из листа Excel.

(e) Есть много причудливых вещей, компоненты, которые становятся невидимыми, иногда вы открываете пакет, и все компоненты полностью перегруппированы некогерентно.

(f) Функция FTP, возможно, одна из самых распространенных вещей, которые вам нужны в ETL, слаба и поддерживает только простой FTP-ваниль, который никто не использует. В наши дни все используют SFTP, FTPS, https и т.д. Поэтому почти для каждой реализации требуется использовать стороннее приложение для передачи файлов, управляемое потоками, которое должен вызывать пакет.

(g) Попытка CYA, похожая на нелепую безопасность в Windows Vista, Microsoft сделала чрезвычайно сложным фактически продвигать пакет SSIS из одной среды в другую. По умолчанию эта глупая вещь "шифрование конфиденциальной информации с помощью ключа пользователя" означает, что она должна работать под той же учетной записью в среде, в которую вы перемещаете ее, в качестве среды, в которой вы ее создали, что редко бывает. Есть лучшие способы настройки, но он всегда пытается вернуться к этой совершенно бесполезной защите.

(h) Наконец, большинство из этих проблем теперь находятся на 3-й версии, что явно указывает, что Microsoft не планирует их исправлять.

(i) Отладка не так проста, как другие языки.

SSIS все еще имеет много преимуществ, но не без серьезной боли.

Ответ 4

Я начал использовать MS Reporting Services много лет назад и просто люблю его. Я не пробовал решение для отчетов в формате Penaho, поэтому я не могу комментировать его. Я также не попробовал ни Analysis Services, ни альтернатив Pentaho.

В последнее время мне нужно решение ETL и знакомство с MSSQL и MSRS, казалось очевидным, что я просмотрю и, вероятно, выберу MS Integration Service. Но для меня MSIS была ужасной. В основном потому, что это было неинтуитивно. Проведя несколько дней, пытаясь выучить инструмент, я решил искать альтернативу и столкнулся с интеграцией данных Pentaho, ранее известной как Kettle. Я запустил его и запустил в течение нескольких минут и сразу же создал свое первое преобразование. Это просто работает.

По общему признанию, мои потребности довольно просты, но производительность отличная, и сообщество кажется очень полезным.

Ответ 5

Я использовал SSIS и Pentaho Kettle, и я бы настоятельно рекомендовал использовать Pentaho Kettle для вашего инструмента ETL вместо SSIS.

Мои причины: поток SSIS - задача. Чайник заставляет задуматься о строках данных, проходящих через систему. Подход для чайника кажется мне более интуитивным. -SSIS плохо документирован. Бывает. Но, похоже, есть много щелчков и щелчков и настройка переменных. Очень сложный. Pentaho имеет форум сообщества, который весьма полезен. - Я доверяю Pentaho для интеграции с несколькими типами баз данных, включая SQL Server. Вы также можете использовать JDBC, который хорош. Кроме того, я использовал его для перехода между SQL Server и Oracle с одной стороны, а Vertica - с другой. Для Vertica он доступен для массового загрузчика. Это неплохо. -Я нашел очень, очень сложно говорить, чтобы пакет SSIS работал на сервере. Это просто не стоило моего времени. -Я нашел, что Pentaho может отправить сообщение о предупреждении или ошибке человеку или списку людей. -Pentaho позволяет выполнять задачи в JavaScript для вещей, которые требуют некоторой логики. Простой и легко сделанный с языком, с которым большинство из нас сталкивалось.

Ответ 6

Я не могу предлагать какие-либо данные в стеке MS BI, но в самом последнем Barcamp Orlando, люди из Пентахо были там и говорили о своих продуктах, и это была чрезвычайно впечатляющая демонстрация.

Тот факт, что проект с открытым исходным кодом, который вы можете продлить, а также платный пакет для действительно хорошего обслуживания, дает вам множество опций. Они продемонстрировали какую-то оплаченную работу, которую они сделали для клиента, и они определенно не знали толпу.

У меня также была возможность немного пообщаться с разработчиком, работающим на стороне хранилища данных для Pentaho, и он был очень острый и был очень открыт для предложений и не имел никаких проблем с ответом на любые вопросы.

Итак, насколько компания идет, Pentaho действительно впечатлила меня как своей работой, так и дружелюбностью и доступностью всех их разработчиков.

Ответ 7

пару точек, чтобы добавить

  • Хотя есть оконная версия всех инструментов Pentaho, установка в окнах обременительна. Pentaho (особенно запуск и остановка сервера, который отделен от инструмента GUI) обычно используется в Linux, а не в магазине Windows, и есть крутая кривая обучения, идущая от Windows к Linux.
  • любой инструмент имеет кривую обучения, когда вы переходите к ней. когда вы привыкаете всегда щелкать OK и обновлять метаданные при возникновении проблем, SSIS не так уж плохо. Пентахо тоже может быть шелушащимся.

Вопросы с инструментами нужно решать с точки зрения более крупных культурных вопросов - какие магазины используют инструменты с открытым исходным кодом? по моему опыту, я обнаружил, что, хотя магазины Microsoft выглядят более жесткими, когда у вас возникают проблемы со строкой подключения в магазине Microsoft, вы можете получить помощь. В Pentaho и Linux продается больше DYI.

Кстати, следите за парнями, продающими Pentaho, которые делают демоверсии - все, что они показывают, намного труднее получить, чем кажется!:)

Ответ 8

Если вы ищете надежную, недорогую альтернативу большим мальчикам, LogiXML имеет сводные таблицы и специальные отчеты на платформе .NET. Мы использовали их с конца 2006 года, когда Pentaho только начинал, но я не смотрел на это через некоторое время.

Ответ 9

Недавно я попробовал pentaho с открытым исходным кодом BI. Я нашел его очень неуклюжим. Это было не очень интуитивно, и время разработки заняло гораздо больше времени.

Он сильно отличается от решений Oracle или ms BI. Возможно, корпоративное издание лучше.