私はジョブスケジューラが初めてで、ビッグデータクラスターでジョブを実行するために探していました。利用可能な選択肢にかなり混乱しました。 Oozieには、TWS、Autosysなどの既存の制限に比べて多くの制限があることがわかりました。
OozieとAirflowの比較ポイントが必要です。
あなたの助けに感謝。
私の経験では、Airflowは現在最高のデータパイプラインです。複雑で長時間実行されるワークフローの管理に最適です。 UIとモジュール性は最高です。
気流
Oozie
ご覧のとおり、Airflowは使いやすく(特に大規模なheteregenoeusチームで)、Oozieよりも汎用性が高く強力なオプションです。
私が言ったように:エアフローに行きます。