取消
顯示的結果
而不是尋找
你的意思是:

命令了嗎?

DejanSunderic
新的貢獻者三世

我創建了一些ETL在python中使用DataFrames。它用於運行180秒。但它不是~ 1200秒。我一直在改變,所以它可能是我介紹的東西,或者環境中。

過程的一部分是S3附加結果到一個文件中。

我一看Apache的工作,我不能看到任何他們是活躍的。

當我在寫這篇文章,我得到了:org.apache.spark。SparkException:工作中止。

命令了1274.63秒,(電子郵件保護)

下午在8/4/2016 12:44:17 def4 (150 GB)

我有附加的輸出:

command-output.txt

我認為我應該能夠看到火花UI中活躍。我很驚訝,活動任務執行人是0。我應該看一些其他的嗎?

我試著重新啟動集群,但是同樣的之前和之後。我使用相同的火花1.6.2版本(Hadoop 2)。

11日回複11

Risingi
新的貢獻者二世

嗯,可能是的

Carneiro
新的貢獻者二世

我有一個問題很相似。

從昨天起,沒有一個已知的原因,一些命令,用於運行日報現在陷入了“命令運行”狀態。命令:

dataframe.show (n = 1)

dataframe.toPandas ()

dataframe.description ()

dataframe.write.format (csv) .save(位置)

現在困也很小dataframes 28行5列,例如。我將感謝任何幫助,因為問題也是重要的日常工作。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map