spark-streaming

Httpメディアストリーミングサーバー

Spark DataFrame：orderByの後のgroupByはその順序を維持しますか？

「spark.yarn.executor.memoryOverhead」設定の値は？

Spark構造化ストリーミング-静的データセットをストリーミングデータセットに結合する

Sparkストリーミング-読み取りおよび書き込みKafkaトピック

あるAndroid電話から別の電話へのWiFi経由のライブストリームビデオ

Androidのライブストリーミングアプリを作成する

DIY：ビデオストリーミングサーバー

Apacheでシャッフル流出を最適化する方法Spark application

ドロップsparkキャッシュからのデータフレーム

Spark構造化ストリーミングでの複数の集約

Sparkドライバメモリとエグゼキュータメモリ

構造化ストリーミングを使用してKafkaからJSON形式でレコードを読み取る方法は？

テーブルを更新して同時に実行する方法は？

スキーマを文字列として（つまり、JSONでエンコードされたスキーマ）from_jsonを使用するにはどうすればよいですか？

手動で信頼できるオフセット管理のための構造化クエリのKafkaオフセットを取得するには？

format（ "kafka"）が "データソースの検出に失敗しました：kafka"で失敗するのはなぜですか。（uber-jarでも）？

Spark構造化ストリーミングはタイムスタンプを現地時間に自動的に変換します

Apacheでグループを含むリストとして行を収集するspark

$= kafka構造化ストリーミングのデータソース]にgroup.idを設定する方法

SparseVector列を持つRDDをVectorとして列を持つDataFrameに変換するにはどうすればよいですか？

PySparkで複数の機能をエンコードして組み立てる

Apache Spark 2.0：Java.lang.UnsupportedOperationException：Java.time.LocalDateのエンコーダーが見つかりません

scalaリストをDataFrameまたはDataSetに変換

データフレーム行を更新された行にマップしようとしたときにエンコーダエラーが発生しました

Scala：Spark SQL to_date（unix_timestamp）がNULLを返す

Spark 2.0データセットとデータフレーム

Spark DataSetフィルターのパフォーマンス

DataFrameからLibSVM形式にデータを準備する方法は？

行タイプのエンコーダーSpark Datasets

sparkヒープメモリ構成とタングステンがオフ

列全体の大文字小文字を小文字に変更する方法は？

データフレームをlibsvm形式に変換します

ドットの列名spark

Sparkのさまざまな結合タイプは何ですか？

Spark dataframe / datasetの効率的な結合のためのパーティションデータ

spark DFまたはDS？

StreamingContextの開始が「IllegalArgumentException：要件の失敗：出力操作が登録されていないため、何も実行しない」で失敗するのはなぜですか？

spark ssc.textFileStreamはディレクトリからファイルをストリーミングしていません

java.lang.NoClassDefFoundError：org / Apache / spark / streaming / Twitter / TwitterUtils $ TwitterPopularTagsの実行中

共同パーティション化されたRDDを結合すると、Apache Sparkでシャッフルが発生しますか？

Spark Pythonを使用：ステージxの解決方法には、非常に大きなサイズ（xxx KB）のタスクが含まれます。最大推奨タスクサイズは100 KBです。

マップ関数の条件

Sparkと一緒にSpringを使用する

AmazonEMRでsparkマスターURLを見つける方法

イテレータからSpark RDDを作成する方法は？

糸でジョブをストリーミングするspark）を開始/停止する正しい方法は何ですか？

Spark ZKまたはKafkaに消費され、再起動後に読み戻すことができる）最新のオフセットを保存する方法

Spark DStreamでの変換とマップの正確な違いは何ですか。

sparkストリーミングジョブを停止するにはどうすればよいですか？

ScalaとPython=同じプロジェクトで使用する方法Sparkプロジェクト？

spark=ストリーミングでブロードキャスト変数を更新するにはどうすればよいですか？

spark-submitの--packagesを使用して複数の依存関係を指定するにはどうすればよいですか？

Amazon s3aは、Spark

Sparkストリーミング+ Kafka：SparkException：セットのリーダーオフセットが見つかりませんでした

Spark：複数のkafkaトピックを並行して処理します

Spark DStreamsのストリーミングチェックポイント

データソースがなくなったときにストリーミングを停止する方法spark

DStream.foreachRDD関数の意味は何ですか？

Spark Scala rdd.foreachPartitionからデータを取り戻す

Kafkaプロデューサー-org.Apache.kafka.common.serialization.StringSerializerが見つかりませんでした

Spark）を使用してAzureBlobからデータを読み取る

KafkaトピックパーティションからSparkストリーミング

build.sbt：spark依存関係を追加する方法

SparkストリーミングKafka-createDirectStream vs createStream

スキーマを使用して、SparkでAVROメッセージをDataFrameに変換します。

Apache-sparkからのピアメッセージによる接続リセットを修正する方法は？

pysparkでjsonファイルを読み取る

YARNクライアントモードでspark-Shellを使用したClosedChannelExceptionの理由を知る方法

制限Kafka使用時のバッチサイズSparkストリーミング

実行を停止する方法Sparkストリーミングアプリケーションを優雅に？

SparkストリーミングKafkaコンシューマの「Java.io.NotSerializableException：org.Apache.kafka.clients.consumer.ConsumerRecord」を修正する方法

ストリーミングソースを使用したクエリは、writeStream.start（）を使用して実行する必要があります。

Kafka with Spark 2.0.2（構造化ストリーミング）からのAvroメッセージの読み取り

なぜSparkアプリケーションはsbtアセンブリのuber-jarとして「ClassNotFoundException：Failed to find data source：kafka」で失敗しますか？

使用済みメモリ、コミット済みメモリ、最大ヒープメモリの違い

from_jsonをKafka connect0.10およびSpark構造化ストリーミングで使用する方法は？

scalaを使用してhdfsディレクトリ内のファイルを読み取った後、どのように削除しますか

Spark Structured Streaming [SparkException：Task not serializable]]のJDBCシンクを記述する方法？

透かし付きの追加出力モードを使用する場合の構造化ストリーミング例外

spark構造化ストリーミングで個別のストリーミングクエリを実行する

Spark構造化ストリーミング：複数のシンク

完全出力モードで集計が必要なのはなぜですか？

Spark構造化ストリーミングを使用してディレクトリを継続的に監視する方法

Spark構造化ストリーミングForeachWriterとデータベースのパフォーマンス

Zeppelinのコンソールストリーミングシンクから出力を取得する方法

Sparkストリーミング-jsonをKafkaから読み取り、jsonを他のKafkaトピックに書き込む

カスタムストリーミングデータソースを作成するにはどうすればよいですか？

Amazon SQSからストリーミングデータをロードする方法は？

Spark構造化ストリーミングチェックポイントのクリーンアップ

Spark構造化ストリーミングkafkaスキーマなしでJSONを変換（スキーマを推測）

Spark Confluent Schema Registryと構造化ストリーミングの統合

AbstractMethodError creating Kafka stream

構造化ストリーミングは/_spark_metadata/9.compactが存在しないことを引用してファイルシンクにDFを書き込みません

SBTテストエラー：Java.lang.NoSuchMethodError：net.jpountz.lz4.LZ4BlockInputStream

Spark 2.3.0データソースが見つかりませんでした：kafka

spark構造化ストリーミングDataFrameをHive外部テーブル/場所に挿入する方法は？

PysparkでForeachまたはForeachBatchを使用してデータベースに書き込む方法は？

ASP.NETでファイルをストリーミングする最良の方法

HTTPライブストリーミング、FFMPEG＆FFSERVER、およびiPhone OS 3