取消
顯示的結果
而不是尋找
你的意思是:

工作失敗“火花驅動程序意外停止和重新啟動。你的筆記本將會自動重新接好。”

JustinMills
新的貢獻者三世

沒有其他可用的輸出,甚至沒有細胞,並成功運行的輸出。

同時,我無法連接到火花ui或查看日誌。它使試圖加載它們,但一段時間後,則會出現一條錯誤消息說它是無法加載。

這發生在每個星期天的工作運行。我試著交換集群配置有點(斑點,隨需應變,#實例,實例類型,等等),似乎沒有什麼是修複它。工作運行兩個筆記本通過dbutils.notebook.run效用和我能夠運行每個筆記本通過獨立工作,隻有當它們放在一起。

任何建議弄清楚到底發生了什麼?在這一點上,我想打破這分成兩份工作並試圖錯開相隔足夠遠,首先是確定完成第二個開始前。

1接受解決方案

接受的解決方案

JustinMills
新的貢獻者三世

我沒有這方麵的證明,但我懷疑這隻是一個內存問題,引發掛(大概在GC),或被殺的操作係統。我看了日誌隨著工作的進展,發現GC周期發生更加頻繁,因為它靠近工作通常已經死亡或掛的地方。我重複工作使用一個更大的實例的大小和壓縮過去吧,它死了/掛過去。當然,真正的考驗將運行這個筆記本作為更大的作業通常運行的一部分。

在原帖子查看解決方案

6個回答6

JustinMills
新的貢獻者三世

我不確定這是相關的,但是昨天我跑這個工作,它運行時失敗的確切地點每周這個時候從來沒有完成。它通常需要大約2個小時,但我發現它仍然運行在14 h。我取消這份工作之前,我看了看火花ui /日誌和現在的工作是完成在一個失敗的國家,我無法加載火花ui或查看日誌,與上麵的相同的錯誤消息。

JustinMills
新的貢獻者三世

看起來也許和這個工作有一些失敗,繞過了Databrick恢複日誌或UI的能力。我記得在過去這樣的事情發生,這是相關工作輸出UTF8字符。我認為磚固定的問題。這個工作不應該這樣做,因為這是一個計算工作,所有文本是pre-sanitized隻包含ASCII或數字id。

JustinMills
新的貢獻者三世

我沒有這方麵的證明,但我懷疑這隻是一個內存問題,引發掛(大概在GC),或被殺的操作係統。我看了日誌隨著工作的進展,發現GC周期發生更加頻繁,因為它靠近工作通常已經死亡或掛的地方。我重複工作使用一個更大的實例的大小和壓縮過去吧,它死了/掛過去。當然,真正的考驗將運行這個筆記本作為更大的作業通常運行的一部分。

京科
新的貢獻者二世

我遇到了同樣的問題在寫100列的表和2 m行到s3。我試著用所有可能的“最大”的司機,但問題依然存在。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map