web-dev-qa-db-ja.com

hadoop-partitioning

Apache Sparkで、RDD.unionがパーティショナーを保持しないのはなぜですか？

hadoop map reduceでのグループ化コンパレーターの使用とは

hadoopマップは二次ソートを削減します

MySQLのパーティションから行を選択する方法

Rでデータパーティションを作成する

ハイブ：外部テーブルに動的パーティションを追加

動的パーティション分割+ HIVEでのCREATEAS

HDINSIGHT Hive、MSCK REPAIR TABLEtable_nameスローエラー

Apache Spark：パーティションごとのレコード数を取得する

PysparkのSparkパーティションから特定のパーティションデータを確認する方法

クラスパスを設定した後、パッケージorg.Apache.hadoop.confが存在しません

Hadoop Javaエラー：スレッド "main"の例外Java.lang.NoClassDefFoundError：WordCount（間違った名前：org / myorg / WordCount）

DataNodeがシングルノードhadoop 2.6.0で起動しない

JavaでMRコードを記述しているときに、Map-SideJoinまたはReduce-Sideをいつ使用するかを決定するにはどうすればよいですか？

ハイブが失敗しました：ParseException行2：0は、列指定の '' macaddress '' 'CHAR' '（'の近くの入力を認識できません

OS / XにHadoopネイティブライブラリが見つかりません

Binary Space Partitioning、Quadtree、Octreeを使用する場合

C＃-リストを分割するエレガントな方法？

MYSQLパーティショニングとは何ですか？

CMDからのパーティション情報

選択クエリの結果を2つの等しい半分に分割する方法はありますか？

MAX（）およびMAX（）OVER PARTITION BYはTeradata Queryでエラー3504を生成します

ディレクトリまたはファイルのマウント/パーティションを見つける方法は？（Linuxサーバー）

8000万件のレコードを含むテーブルとインデックスの追加には、18時間（または永久）以上かかります！それで？

LINQパーティションリストを8メンバーのリストに

SQLはどのようにして複数のパーティションを選択しますか？

python filter（）と同等、2つの出力リスト（つまり、リストのパーティション）を取得

2列を使用したテーブルのパーティション分割

リストをnサイズのリストに分割する効率的な方法

日時列でテーブルを分割する方法

クイックソートとホアパーティション

線形計画法の動的計画法ソリューションを理解するにはどうすればよいですか？

自動シャーディングpostgresql？

パンダ：DataFrameのサンプリング

スクリプトでディスクをext4パーティションで埋めます

2fs EBボリュームのサイズを変更しようとすると失敗する

MySQLにデータをドロップせずにパーティションをドロップする方法は？

Cassandra：パーティションキーの選択

データベースのパーティション分割-水平対垂直-正規化と行分割の違い？

セットのすべてのパーティションを見つける方法

データベースのシャーディングとパーティション分割

MySQLでテーブルパーティションサイズを確認する方法（それも可能ですか？）

HFSでパーティションデータを手動でHDFSから削除したときにパーティションメタデータを更新する方法

複数のクエリ条件を使用したWindowsAzureテーブルストレージのクエリ

glm（）モデルの相互検証

ZookeeperはKafkaの必須アイテムですか？

EC2 centosでルートパーティションのサイズを変更できません

Oracleパーティション-エラーORA14400-挿入されたパーティションキーはどのパーティションにもマップされません

Sparkでパーティション分割はどのように機能しますか？

パーティション内の要素数を取得するにはどうすればよいですか？

DataFrameのパーティショニングを定義する方法

Java 8パーティションリスト

HashPartitionerはどのように機能しますか？

Django移行でraw SQLを実行する方法

月ごとにテーブルをパーティション化する方法（ "YEAR＆MONTH"）と月ごとのパーティションを自動的に作成する方法は？

動的パーティション数を含むkafkaトピックを作成することは可能ですか？

Sparkのデフォルトのパーティション分割スキーム

データをSparkにインポートするときにパーティション/ノードの数を設定する方法

pysparkは、partitionbyを使用してデータを分割する

Spark dataframe with CSV as partitions）を書き込みます

Spark SQLでパーティションサイズを制御する方法

Oracle SQLでは、表全体ではなく表のパーティションを問い合せて実行を高速化できますか？

Spark SQL saveAsTableは、パーティションが指定されている場合、Hiveと互換性がありません

Spark=ワーカー、コア、およびDataFrameサイズに基づいたパーティションの最適数の決定

Sparkは、パーティション化されたデータでもすべての葉ノードをリストします

sparkパーティションが大きくなると寄木細工の書き込みが遅くなる

mysqlで非常に大きなデータを処理する

sparkで各エグゼキュータで1つの操作を1回実行する方法

Spark SQL-df.repartitionとDataFrameWriter partitionByの違いは？

キャレットパッケージからのcreateDataPartition関数はどのようにデータを分割しますか？

Sparkウィンドウ関数でシングルパーティションモードのパフォーマンスへの影響を回避する

新しいデータのないパーティションを削除せずにSpark=でDataFrameをパーティション分割して書き込む方法は？

Ansibleで新しいパーティションを作成する方法

JDBCを介してRDBMSから読み取り中のspark

Azure Cosmos DBでは、最初に決定した後でパーティションキーを変更できますか？

Impala / Hiveで複数のパーティションを削除する

ORA_HASH関数で使用されるアルゴリズムは何ですか？

Spark dataframe / datasetの効率的な結合のためのパーティションデータ

Spark：再パーティションとpartitionByの列引数の順序

Spark= DataFrameのパーティションキーを知っていますか？

コレクションを2つの異なるコレクションに分割する最良の方法は何ですか？

jqを使用して、非常に大きなJSONファイルを複数のファイルに分割します。各ファイルは特定の数のオブジェクトです。

Sparkは、読み取り時に寄木細工のパーティション分割を維持しますか？

Azure Cosmos DBパーティションキー-主キーは受け入れられますか？

JDBCソースからデータを移行するときに、パーティションを最適化する方法は？

既存のPostgresテーブルを可能な限り透過的にパーティションテーブルに移行する方法

パーティションテーブルのPostgreSQL 11外部キー

日による自動分割 - PostgreSQL.

BigQueryでテーブルを分割するときに決めるのに最適なバランスは何ですか？

WSL2にネイティブext4パーティションをマウントする

異なる部分を持つ整数のパーティション数を取得するための効率的なアルゴリズム（パーティション関数Q）

Apache Hadoopに相当する.NETはありますか？

MapReduceソートアルゴリズムはどのように機能しますか？

Java vs vs Python on Hadoop

Hadoopへのデータの書き込み

スケーラブルな画像ストレージ

JobConfを使用せずにHadoopジョブを実行する

Hadoop 1つのマップと複数の削減

hadoop.tmp.dirはどうあるべきですか？

HDFSはデフォルトでファイルをローカルに保存しますか？