このエラーが発生しました。クラスターインスタンスのメモリを増やし、エグゼキューターとドライバーのパラメーターを増やしましたが、成功しませんでした。
17/05/07 23:17:07 ERROR TransportClient: Failed to send RPC 6465703946954088562 to ip-172-30-12-164.eu-central-1.compute.internal/172.30.12.164:34706: Java.nio.channels.ClosedChannelException
誰かがこのエラーを修正するための手がかりを持っていますか?
ところで、私はYARNをクラスターマネージャーとして使用しています
前もって感謝します
最後に問題を解決しました。ディスク容量不足が原因です。 hadoopログの1つの列は、次のことを示しています。
Hadoop YARN:1/1 local-dirsは不正です:/ var/lib/hadoop-yarn/cache/yarn/nm-local-dir; 1/1 log-dirsは不正です:/ var/log/hadoop-yarn/containers
「このエラーが発生した場合は、ディスク容量を増やしてください!」
このエラーを表示するには、EMRで糸ログをアクティブにする必要があります。見る
http://docs.aws.Amazon.com/emr/latest/ManagementGuide/emr-web-interfaces.html
クラスターec2インスタンスのログポートにアクセスできるように、セキュリティポートを変更しました
例:
マスターインスタンスはここでリスニングしていた:172.30.12.84:8088そしてコアインスタンスはここで:172.30.12.21:8042
最後に、etl.pyでインスタンスのタイプを、より大きなディスクを持つ他のインスタンスによって変更する問題を修正しました。
マスター:m3.2xlarge
コア:c3.4xlarge