取消
顯示的結果
而不是尋找
你的意思是:

在工作流執行PyPI圖書館有時不安裝

xneg
貢獻者

我有一個工作流運行在集群和包含一個工作任務,需要從PyPI先知庫:

{“task_key”:“my_task”、“depends_on”: [{“task_key”:“<…> "}),”notebook_task”: {“notebook_path”:“<…>”、“源”:“工作區”},“job_cluster_key”:“job_cluster”、“庫”:[{“pypi”:{“包”:“先知”= = 1.1.2}}],“timeout_seconds email_notifications“: 0: {}},

有時候工作很好但有時我得到了下麵的錯誤:

運行結果不可用:工作失敗與錯誤消息庫安裝失敗庫由於用戶錯誤pypi{包:“先知= = 1.1.2”}。錯誤消息:圖書館的司機節點集群上安裝嚐試<…>,但都以失敗告終。請參考以下錯誤消息來解決圖書館或接觸磚的支持。錯誤代碼:DRIVER_LIBRARY_INSTALLATION_FAILURE。錯誤信息:org.apache.spark。SparkException:進程列表(/磚/ python / bin /皮普,安裝、先知= = 1.1.2,——disable-pip-version-check)退出代碼1。錯誤:無法安裝包由於OSError: [Errno 2]沒有這樣的文件或目錄:/磚/ python3 / bin / f2py”

我看到建議提前這個庫安裝在一個集群中。但我開始我的工作流程的工作集群(不是一個萬能的集群)所以沒有預先安裝的能力。奇怪的是,有時很好,有時不是。

如果有一種方法來安裝圖書館100%保證集群在一個共享的工作就好了!

11日回複11

xneg
貢獻者

我想我不是很正確的措辭用於我的初始信息。

所以我麵對的問題是,有時候工作集群(不通用)集群執行期間無法安裝圖書館工作流程。

選項1是有效的,但是選項2並不是因為我看不見的工作集中在集群選項卡。我可以看到他們在“計算”選項卡但他們都是不同的。

圖像

匿名
不適用

@Eugene Bikkinin:你可以試試下麵的選項。

解決這個問題,你可以通過檢查集群的工作日誌來查看是否存在任何錯誤消息或異常相關庫安裝。你也可以嚐試手動安裝圖書館工作的集群是否安裝成功。此外,您可以檢查網絡連接,依賴、權限、資源、兼容性,包質量,以確保他們不造成問題。

一些最常見的原因是:

  1. 集群網絡問題:如果工作無法連接到互聯網或圖書館存儲庫,它可能無法下載和安裝所需的庫。
  2. 依賴衝突:如果圖書館安裝依賴關係,衝突與現有依賴於集群的工作,安裝可能會失敗。
  3. 集群缺乏權限:如果工作沒有足夠的權限安裝庫,安裝可能會失敗。
  4. 集群資源有限:如果工作沒有足夠的磁盤空間,內存或CPU資源安裝庫,安裝可能會失敗。
  5. 不相容:如果不兼容庫安裝在集群工作版本的運行時環境,安裝可能會失敗。
  6. 包質量:如果庫包錯誤,錯誤,或問題,安裝可能會失敗。
  7. 超時:如果安裝過程花費的時間太長,工作集群可能超時之前安裝完成。

@Suteja卡努裏人

>你也可以嚐試手動安裝圖書館工作的集群是否安裝成功。

所以我如何手動安裝圖書館集群工作如果是短暫如上麵你寫的嗎?

匿名
不適用

@Eugene Bikkinin:

一個集群上安裝庫工作的方法是使用init腳本。Init腳本腳本運行在集群啟動時,和可以用來安裝庫或執行其他初始化任務。使用一個init腳本安裝一個庫,您可以創建一個腳本,該腳本安裝庫使用脈衝或其他包管理器,然後將這個腳本附加到您的集群作為一個init腳本。下麵的例子是

# !/bin/bash /磚/ python / bin / pip安裝熊貓

您可以將這個腳本附加到您的集群通過“高級選項”選項卡在創建你的工作,然後將腳本添加到“Init腳本”字段。

Vartika
主持人
主持人

嘿@Eugene Bikkinin

謝謝你的問題!幫助你更好的,請花一些時間來檢查答案,讓我知道它是否最適合您的需要。

請幫助我們選擇最好的解決方案通過點擊“選擇最佳”如果它。

您的反饋將幫助我們確保我們提供最好的服務給你。謝謝你!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map