Apache zeppelin
についてよく耳にするので、頭に浮かぶ質問はほとんどありません。
Short Answer:データ駆動型のインタラクティブなデータ分析と共同ドキュメントを可能にするWebベースのノートブックSQL、Scalaなど。
長い答え:
Zeppelinノートブックは、Webノートブックで任意のコードを実行するための簡単で簡単な方法を提供します。 Scala、SQLを実行し、定期的に実行するようにジョブを(cron経由で)スケジュールすることもできます。
まず、同じノートブックで言語を混在させる方が簡単です。 SQL、scala、マークダウンを実行して、すべてをまとめて文書化できます。ノートブックをプレゼンテーションスタイルに簡単に変換することもできます。管理者にプレゼンテーションしたり、ダッシュボードで使用したりするためです。
Pythonコミュニティで非常に人気のあるJupyter(旧称IPython)ノートブック。「replace」という単語は使用できません。同様の種類を使用します...
さらに 。
ZeppelinはSpark、PySpark、Spark R、Spark SQLと依存関係ローダーをサポートしています。
Zeppelinを使用すると、JDBCデータソースをシームレスに接続できます。 Postgresql、Mysql、MariaDB、Redshift、ApacheHiveなど。
Pythonは、Matplotlib、Conda、Pandas SQLとPySparkの統合でサポートされています。
ツェッペリンは素晴らしいツールです。これにより、1つのノートブックでさまざまなバックエンド/言語を使用できます。これが簡単な使用例です。
これらの手順はすべて、1つのノートブックで実行できます。そして、1つのノートブックでできることはもっとたくさんあります。
ZeppelinはDatabricks.comオンラインソリューションに非常に近い