JavaプログラムからHiveに接続する必要があります。googleを検索したところ、次のような多数のガイドと例が見つかりました: HiveServer2クライアント
ただし、JDBCドライバー自体(jarファイル)はどこにも見つかりませんでした。 Clouderaからダウンロードするjarファイルがあるようですが、登録が必要です。
プレーンなApache Hive JDBCドライバー自体の入手先を知っている人はいますか?
プログラムがすべてのHadoopライブラリすでにインストールされているのホストで実行されている場合、Apacheドライバーの使用は問題ありません。それ以外の場合は、依存関係のスモールガスドをドラッグする必要があります。
これらすべての依存関係を独自のJARにパッケージ化すると、恐らく大規模で雑然とした一片のshoftware(神、今日のMavenの誤用方法)が生じるでしょう。さらに、新しいクライアントは古いサーバーと互換性がないため、互換性の問題が発生する可能性があります。 「互換性なし」は、「Thriftサーバーとの接続を初期化できない」ことを意味します。
スタンドアロンインストールの場合、Clouderaドライバは優れたソリューションである可能性があります。登録は、「迷惑メール」の1つを残して、いくつかのマーケティングメッセージを取得することを意味します(その後、購読を解除できます)。私は認めますが、それをCloudera以外のクラスターで使用したことはありません。
この依存関係をMaven pomに追加します。
<dependency>
<groupId>org.Apache.Hive</groupId>
<artifactId>Hive-jdbc</artifactId>
<version>2.0.0</version>
</dependency>
Jarは次の場所からダウンロードできます: http://central.maven.org/maven2/org/Apache/Hive/hive-jdbc/2.0.0/Hive-jdbc-2.0.0.jar
バージョンの完全なリスト: http://www.mvnrepository.com/artifact/org.Apache.Hive/hive-jdbc
ここからドライバをダウンロードできます。 Download Hive-jdbc-0.10.0.jar