web-dev-qa-db-ja.com

PentahoとMicrosoftBIスタック

私の会社はMSBIスタック(SQL Server Reporting Services、-Analysis Services、-Integration Services)に多額の投資を行っていますが、オープンソースの代替ペンタホについて最も話題になっているように見えるものを見てみたいと思います。

バージョンをインストールしましたが、非常に簡単に起動して実行できました。いいですね。しかし、パッケージを完全に理解するために実際の作業に使用する時間はあまりありません。

PentahoとMSBIの長所と短所、またはそのような比較へのリンクについて、何か洞察を得た人はいますか?

大変感謝いたします!

35
Tomas

Business Objectsから降りる途中で、複数のBiスタックを確認しました。私のコメントの多くは好みです。どちらのツールセットも優れています。プレーンチョコレートよりもチョコレートファッジブラウニーアイスクリームを好む方法がいくつかあります。

Pentahoには本当に賢い人が何人か一緒に働いていますが、Microsoftは十分な資金と計画のある道を歩んでいます。 MSは依然としてデータベース市場の弱者であることに留意してください。ここではオラクルが王様です。競争力を高めるために、MSはデータベースを購入するときに多くの特典を提供しており、プラットフォームを数回再発明することを余儀なくされています。これはデータベースに関するものではないことは知っていますが、DBの戦いにより、MSはスタックに価値を付加するために多くのことを諦めています。

1.)プラットフォーム
SQLサーバーはUnixまたはLinuxで実行されないため、この市場から自動的に除外されます。 Windowsは現在、一部のバージョンまたはUnixとほぼ同じ価格です。 Windowsはかなり安価で、今ではうまく動作しません。 Linuxと同じくらい多くの問題を私に与えます。

2.)OLAP
分析サービスは、2000バージョンよりも2005年(現在は2008年)に再発明されました。それは2000年以上に強力な桁違いです。ペンタホ(モンドリアン)は、大きくなるとそれほど速くはありません。また、いくつかの機能があります。それはかなり良いですが、ツールの邪魔になるものは少ないです。どちらも、不可欠なプラットフォームとしてExcelをサポートしています。 MSバージョンはより堅牢です。

3.)ETL
MS-DTSはSSISに置き換えられました。ここでも、速度、電力、および能力が大幅に向上しています。これは、すべてのデータ移動またはプログラム制御を制御します。それはできません。Powershellでスクリプトを書くことができます。2008リリースのInformaticaと同等です。Pentaho-以前よりもはるかに優れています。思ったほど速くはありませんが、やりたいことはほぼすべて実行できます。 。

4.)ダッシュボード
Pentahoはこれを改善しました。開発するのは一種の不快で不親切ですが、MSの本当の同等物は実際にはありません。

5.)レポート
MSレポートは非​​常に強力ですが、それほど使いにくいわけではありません。今は好きですが、少しよく知るまでは最初は嫌いでした。私はCrystalReportsを使用していましたが、MS ReportBuilderははるかに強力です。 MSで難しいことをするのは簡単ですが、簡単なことをするのは少し難しいです。ペンタホは少し不器用です。私はそれがまったく好きではありませんでしたが、あなたはそうかもしれません。非常に複雑であることがわかりました。 CrystalレポートビルダーまたはMSレポートビルダーのどちらかであるといいのですが、ジャスパーのようです。難しいと思います。それは好みかもしれません。

6.)アドホック
MS-これは私にとって本当の勝者でした。私はユーザーと一緒にそれをテストしました。彼らはすぐにMSユーザーレポートビルダーに夢中になりました。違いを生んだのは、使いやすさだけでなく、生産性にもありました。 Pentaho-良いですがかなり古い学校です。より典型的なウィザードベースのモデルを使用し、強力なツールを備えていますが、私はそれを嫌います。それはそれが何であるかについての優れたツールですが、私たちはこのスタイルから移行し、誰も戻りたくありません。 logiXMLで発生したのと同じ問題。インターフェースはそれが何であったかについてはうまく機能しましたが、私たちが12年間使用したものから実際にはそれほど大きな変化はありません。 http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+of+Interactive+Reporting

Pentahoを本当にうまく動かすことができる経験豊富な人々がそこにいます、私はちょうどMSスイートがより生産的であるとわかりました。

53
Stradas

警告-SSISの多くの欠陥、バグ、および煩わしさをリストしているサイトはたくさんあります。 SSISが投稿でトップに立った理由はわかりませんが、プロジェクトに賭ける前に、ブロゴスフィアで人々が何を言わなければならないかを見てください。私の経験から、SSISがどれほど恐ろしいものであるかについて約20:1の怒りがあります。私も同意でき、現在、代替案を探しています。

8
alchemical

ここに素晴らしい情報がありますか? Pentahoは試していませんが、チェックする予定です。私は経験豊富なMSBIコンサルタントであり、1998年から使用しています。SSISは非常に高速で強力ですが、批判は的を射ています。 SSISで次の問題が見つかりました。

(1)デバッグが難しく、問題が実際に何でどこにあるのかについてのヒントを与えない可能性のある不可解なエラーが発生します。

(2)以前のコメントによると、これはこれまでで最も汚い開発環境です!彼らが何を考えているのか私にはわかりません。

(a)100以上の列を持つテーブルを作成し、そのテーブルにマージ結合を配置します。ここで戻って、マージ結合を更新してみてください(新しい列をプルスルーするなど)。マージ結合で[OK]をクリックして変更を保存した後、最速のマシンでも数分かかる場合があります。大量の幅広いレコードと多くのマージ結合を含む巨大なデータフローがあります。データフローに1つの列を追加するには、半日以上かかります。マージ結合を更新してから、別のことを実行し、5〜10分後にもう一度チェックして完了したかどうかを確認する必要があります。これに対するMicrosoftの対応は、パッケージを複数のパッケージに分割し、それらの間のテーブルまたはバイナリにデータを配置することです。すべてのステップの間にディスクを使用する場合は、SQLですべてを実行できたはずです。 ETLツールの主な目的の1つは、メモリ内のこれらすべてのものを使用し、ディスクI/Oを回避することです。

(b)デザイナーが完全にクラッシュし、最後の保存以降のすべての作業が失われることがあります(このため、今は睡眠中にctrl-Sを実行しています)

(c)ハックを見つけ出し、幅広いレコード用にExcelでSSISパッケージXMLを生成する必要がありました。 600以上の列レコードが一般的であるヘルスケアクライアントがあります。 SSISで600列のファイル形式を定義しようとすると、すべての列を一度に1つずつ入力する必要があります!!! MS Accessでさえ、スプレッドシートからファイルレイアウトにレイアウトをカットアンドペーストできますが、SSISはできません。そのため、レイアウトからXMLを生成し、XMLコードをパッケージ内の適切な場所に貼り付ける必要がありました。それを行うための醜い方法ですが、それは仕事の丸一日と多くのエラーを節約しました。

(d)(c)と同様に、すべての列をトリミングする必要があり、600以上の列があるとしたら、何を推測しますか?派生列コンポーネントでは、trim(column1)を600回以上入力する必要があります。これで、SQLクエリでこのような単純な変換をすべて実行してデータを取得します。これは、Excelシートから簡単に生成できるためです。

(e)奇妙なことがたくさんあり、コンポーネントが見えなくなります。パッケージを開くと、すべてのコンポーネントが完全に一貫性のない状態で再配置されることがあります。

(f)FTP機能は、おそらくETLで必要とされる最も一般的なものの1つであり、弱く、誰も使用しないプレーンなVanillaFTPのみをサポートします。最近の誰もがSFTP、FTPS、httpsなどを使用しています...したがって、ほとんどすべての実装では、パッケージが呼び出す必要のあるサードパーティのコマンドライン駆動型ファイル転送アプリを使用する必要があります。

(g)Windows Vistaのばかげたセキュリティと同様に、CYAを試みたところ、MicrosoftはSSISパッケージをある環境から別の環境に実際に昇格させることを非常に困難にしました。デフォルトでは、「機密情報をユーザーキーで暗号化する」セキュリティという愚かなことです。つまり、移動先の環境で、開発した環境と同じアカウントで実行する必要がありますが、これはめったにありません。設定するためのより良い方法がありますが、それは常にこの完全に役に立たないセキュリティ保護に戻ろうとします。

(h)最後に、これらの問題のほとんどは現在3番目のバージョンにあり、Microsoftがそれらを修正する計画がないことを明確に示しています。

(i)デバッグは他の言語ほど簡単ではありません。

SSISにはまだ非常に多くの利点がありますが、深刻な問題がないわけではありません。

7
Lee

私は何年も前にMSReporting Servicesを使い始めましたが、とても気に入っています。 Penahoのレポートソリューションを試したことがないので、コメントできません。また、AnalysisServicesまたはPentahoの代替手段も試していません。

最近、ETLソリューションが必要で、MSSQLとMSRSに精通しているので、MS IntegrationServiceを確認して選択することは明らかでした。しかし、私にとって、MSISはひどいものでした。主に直感的ではなかったためです。ツールを学ぶために数日を費やした後、私は代替手段を探すことに決め、以前はケトルとして知られていたPentaho DataIntegrationに出会いました。私はそれを数分以内に稼働させ、すぐに最初の変換を作成しました。それはうまくいきます。

確かに私のニーズはかなり単純ですが、パフォーマンスは素晴らしく、コミュニティは非常に役立っているようです。

4
Gary Brunton

私はSSISとPentahoKettleを使用しましたが、ETLツールにはSSISの代わりにPentahoKettleを使用することを強くお勧めします。

私の理由:-SSISの流れはタスクごとです。ケトルは、システムを流れるデータの行について考えさせます。ケトルのアプローチは私にははるかに直感的に思えます。 -SSISは十分に文書化されていません。これが起こります。しかし、隅々までクリックしたり、変数を設定したりすることがたくさんあるようです。非常に複雑です。 Pentahoには非常に役立つコミュニティフォーラムがあります。 -私はPentahoがSQLServerを含む複数のタイプのデータベースと統合することを信頼しています。ニースであるJDBCを使用することもできます。また、SQL ServerとOracleの間、およびVerticaの間を移動するために使用しました。 Verticaで利用可能なバルクローダーがあります。それはかなりいいです。 -SSISパッケージをサーバー上で実行することは、比較的非常に難しいと感じました。それは私の時間の価値がなかっただけです。 -Pentahoが警告やエラーメッセージを人や人のリストにメールで送るのはとても簡単だと思いました。 -Pentahoでは、ロジックが必要なタスクをJavaScriptで実行できます。私たちのほとんどが出くわした言語でシンプルかつ簡単に行うことができます。

4
geoffrobinson

追加するいくつかのポイント

  • すべてのPentahoツールのウィンドウバージョンがありますが、ウィンドウでのセットアップは面倒です。 Pentaho(特にGUIツールとは別のサーバーの起動と停止)は通常、WindowsショップではなくLinuxで使用され、WindowsからLinuxへの学習曲線は急です。
  • どのツールにも、シフトすると学習曲線があります。問題が発生したときに常に[OK]をクリックしてメタデータを更新することに慣れている場合、SSISはそれほど悪くはありません。 Pentahoもフレーク状になる可能性があります。

ツールの質問は、より大きな文化的な質問の観点から対処する必要があります-どのようなショップがオープンソースツールを使用していますか?私の経験では、Microsoftショップはより厳格に見えますが、Microsoftショップで接続文字列に問題がある場合は、助けを得ることができます。PentahoおよびLinuxショップではより多くのDYIがあります。

ところで、デモを行っているPentahoの営業担当者に気をつけてください-彼らが示すすべてのものは、見た目よりも動作するのがはるかに難しいです! :)

3
gnackenson

MS BI Stackで入力を提供することはできませんが、最新の Barcamp Orlando では、Pentahoの人々がそこにいて、製品について話しました。これは非常に印象的なデモでした。

それがあなた自身を拡張することができるオープンソースプロジェクトであるという事実と本当に良いサービスのための有料パッケージはあなたに多くのオプションを残します。彼らはクライアントのために行ったいくつかの有料の仕事を示し、彼らは間違いなく群衆を驚かせました。

また、Pentahoのデータウェアハウジング側で作業している開発者と少しチャットする機会がありました。彼は非常に鋭敏で、提案に対して非常にオープンで、質問に問題なく答えることができました。

会社に関する限り、Pentahoは彼らの仕事と、すべての開発者がどれほど友好的で親しみやすいかという両方に本当に感銘を受けました。

3
mwilliams

最近、pentahoオープンソースBIを試しました。非常に不器用であることがわかりました。それはあまり直感的ではなく、開発時間ははるかに長くかかりました。

これは、OracleまたはmsBIソリューションとはまったく異なります。多分エンタープライズ版の方が良いでしょう。

0
q Tran

ビッグボーイに代わる堅牢で低コストの代替手段をお探しの場合、LogiXMLには.NETプラットフォームでのダッシュボードとアドホックレポートがあります。 Pentahoが始まったばかりの2006年後半から使用していますが、しばらくは見ていません。

0
Bill