web-dev-qa-db-ja.com

apache-hive

HiveStructのすべての列を選択します

Apache Spark 2.3.1 with Hive metastore 3.1.0

Apache Hive MSCK REPAIR TABLE新しいパーティションは追加されません

タイムスタンプをHiveに挿入します

Spark-SubmitYARNクラスターモードを使用するときにHiveサイトがありません

Sparkプロパティ（Spark 1.6）を通じてSpark-ShellでHiveサポートを有効または無効にする方法は？

java.lang.RuntimeException：org.Apache.hadoop.Hive.metastore.HiveMetaStoreClientをインスタンス化できません

HIVEで日付文字列をUTCから特定のタイムゾーンに変換する方法は？

Hiveの「InputFormat、OutputFormatとして保存」と「として保存」の違い

Hive（get_json_object）またはjson serdeで構造体配列をクエリする方法

ハイブですべてのパーティションを一度に削除するにはどうすればよいですか？

列名を取得してハイブに入力する方法

Hiveサービス、HiveServer2＆MetaStoreサービス？

DataFrameをHiveに直接保存する方法は？

Sparkで、複数の小さなファイルをいくつかの大きなファイルにマージします

Spark Hiveの動的パーティションテーブルとしてのデータフレーム

保存SparkデータフレームをHiveに：「寄木細工はSequenceFileではない」ためテーブルを読み取れません

SparkSQLでプログラムでHiveメタストアに接続する方法は？

Apache Spark SQLContext vs HiveContextの違いは何ですか？

データ型doubleの列のspark sqlContextで中央値を計算する方法

Spark SQLでcollect_listおよびcollect_setを使用します

AuthorizationException：ユーザーがユーザーを偽装することは許可されていません

Spark SQLでパーティションサイズを制御する方法

spark）のスキーマを使用してHive外部テーブルを作成します

Spark SQLの既存のHiveパーマネントUDFを使用できません

HiveサポートでSparkSessionを作成する方法（「Hiveクラスが見つかりません」で失敗します）

sparkからリモートHiveサーバーに接続する方法

配列内の要素の範囲を選択するspark sql

PySpark：2つの条件と3つの結果を持つwithColumn（）

SparkSQL-寄せ木張りファイルを直接読み込む

Spark SQLはHiveMetastoreを使用しますか？

Spark SQLでのSQLの記述とDataframe APIの使用

パーティション化されたspark= Datasetの一部のパーティションのみを上書きする

Spark 2：SparkSession enableHiveSupport（）が呼び出されたときの動作

JDBCソースからデータを移行するときに、パーティションを最適化する方法は？

Spark2は、寄木細工のハイブテーブルにデータフレームを書くことができません：HiveFileFormat`。指定された形式 `parquetfileformat`と一致しません

Pysparkを使用してHiveメタストアにテーブルが存在するかどうかを確認する

SparseVector列を持つRDDをVectorとして列を持つDataFrameに変換するにはどうすればよいですか？

PySparkで複数の機能をエンコードして組み立てる

Apache Spark 2.0：Java.lang.UnsupportedOperationException：Java.time.LocalDateのエンコーダーが見つかりません

scalaリストをDataFrameまたはDataSetに変換

データフレーム行を更新された行にマップしようとしたときにエンコーダエラーが発生しました

Spark 2.0データセットとデータフレーム

DataFrameからLibSVM形式にデータを準備する方法は？

行タイプのエンコーダーSpark Datasets

ドットの列名spark

豚とハイブの違いは？なぜ両方がありますか？

ApachePigとApacheHiveの違いは何ですか？

Hadoop、HBase、Hive、Pigを使用する場合

演算子でHiveグループから要素の配列/バッグを取得する方法は？

Hive変数の値を表示する方法は？

豚vsハイブvsネイティブマップリデュース

サメ/スパークにキャッシュをクリアさせる方法は？

曜日を達成するためのハイブ日付機能

ハイブでデータベースのユーザー名とパスワードを取得する方法

Sparkシェルから直接ORCファイルを読み取る

SparkSQL vs Hive on Spark-違いと長所と短所？

ClassNotFoundException：org.Apache.spark.SparkConf with spark on hive

寄木細工のファイルのメタデータを使用してHiveテーブルを作成する

ParquetファイルをHiveに直接読み込むことはできますか？

java.lang.RuntimeException：org.Apache.hadoop.Hive.ql.metadata.SessionHiveMetaStoreClientをインスタンス化できません

Spark SQLはタイムゾーンを正しく変換していません

^ A（つまり\ 001）を区切り文字として使用するcsvをspark-csvで解析する方法は？

Hiveテーブルで最新のパーティションを見つける方法

寄木細工のファイルのメタデータを生成する

parquet.io.ParquetDecodingException：ファイルのブロック-1の0の値を読み取れません

Spark最終タスクは最初の199の100倍の時間がかかります。改善方法

ツェッペリンに瓶を追加する方法は？

Spark SQL saveAsTableは、パーティションが指定されている場合、Hiveと互換性がありません

Spark RDDをローカルファイルシステムに保存する方法

spark yarn、コンテナはゼロ以外の終了コード143で終了しました

Spark DataFrameをHive内部テーブルに挿入するには？

スキーマを使用してSparkデータフレームからHiveテーブルを作成する方法は？

Spark Hadoopなし：起動に失敗しました

PysparkおよびHiveを使用して特定のデータベースのテーブルを表示する

SQLExceptionでのsqlContextHiveDriverエラー：メソッドはサポートされていません

なぜSpark数千のファイルを作成するbucketByでsaveAsTableですか？

sparkを使用してHiveパーティションを上書きする

テーブルの作成時に「CREATEHiveTABLE（AS SELECT）」エラーが発生するのはなぜですか？

外部Hiveテーブルの更新テーブルとMSCKの修復

spark構造化ストリーミングDataFrameをHive外部テーブル/場所に挿入する方法は？

Azure Databricks-管理テーブルを作成できません関連する場所は既に存在します

Spark 2.4をユーザー提供のHadoopで正しく設定する方法

Apache Commons HttpClientはGZIPをサポートしていますか？

Spark SQLで変数/パラメータを動的にバインドしますか？

Spark MLで分類するための正しいデータフレームを作成する方法

SparkのDataFrame、Dataset、およびRDDの違い

spark-mlでカテゴリ機能を処理する方法は？

Spark MLLibのTFVector RDDからWordの詳細を取得する方法は？

モデルをMLパイプラインからS3またはHDFSに保存する方法は？

DataFrame結合の最適化-ブロードキャストハッシュ結合

Spark DataFrame in PythonからlabeledPointsを作成します

ネストされた列をSpark DataFrameから削除する

RandomForestモデルを相互検証する方法は？

DataFrame / Dataset groupBy動作/最適化

将来の使用のためにMLモデルを保存する

DataFrameで複数の特徴ベクトルをマージする方法は？

PysparkとPCA：このPCAの固有ベクトルを抽出するにはどうすればよいですか？彼らが説明している分散の量をどのように計算できますか？

Apache Spark不足している機能に遭遇すると、NullPointerExceptionをスローします

Spark、Scala、DataFrame：特徴ベクトルを作成する