Scalaを使用してSparkのDataFrameをcsvファイルにエクスポートするにはどうすればよいですか?
Spark verions 2 +では、以下を使用するだけです。
_df.write.csv("/your/location/data.csv")
_
ファイルがパーティション分割されていないことを確認するには、次のように.coalesce(1)
を追加します。
_df.coalesce(1).write.csv("/your/location/data.csv")
_
上記のソリューションでは、csvを複数のパーティションとしてエクスポートします。 coalesce
を使用すると、データフレームを1つの単一のCSVファイルにエクスポートする zero32 によって別の解決策が見つかりました stackoverflowページ 。
df.coalesce(1)
.write.format("com.databricks.spark.csv")
.option("header", "true")
.save("/your/location/mydata")
これにより、mydata
という名前のディレクトリが作成され、そこに結果を含むcsv
ファイルが見つかります。