解決:限製並行當外部api調用……-磚- 31517

Edmondo · ‎01-17-2022

我們應用groupby pyspark.sql操作。Dataframe然後mlflow每組火車上一個模型。我們看到間歇性故障,因為MLFlow服務器回複429,因為太多的請求/ s

有哪些最佳實踐在這些情況下,你如何限製即將離任的調用外部服務嗎?我們使用托管MLFlow磚,有沒有一種方法,我們可以配置MLFlow,隊列後續請求將它們發送到服務器之前?

Hubert_Dudek1 · ‎01-17-2022

至少在Azure MLFlow每個工作空間的限製相當嚴格:

每秒每秒——查詢。此外,有限製的並發模型版本在20等待狀態(每個工作區創建)。另外429自動重試。

每組並行模型訓練嗎?也許不是平行隻是一組訓練,監控執行器的使用可以接近100%,可以花同樣的時間。

Hubert_Dudek1 · ‎01-17-2022

至少在Azure MLFlow每個工作空間的限製相當嚴格:

每秒每秒——查詢。此外,有限製的並發模型版本在20等待狀態(每個工作區創建)。另外429自動重試。

每組並行模型訓練嗎?也許不是平行隻是一組訓練,監控執行器的使用可以接近100%,可以花同樣的時間。

Edmondo · ‎01-17-2022

謝謝,文檔AWS的限製是一樣的(我有檢查)。有三個選擇:

謝謝

匿名 · ‎02-16-2022

@Edmondo Porcu -我的名字叫風笛手,我是主持人磚。我很抱歉這麼長時間才給我答複。我們正在尋找最好的人來幫助你。

Kaniz · ‎02-24-2022

嗨Porcu @Edmondo, 429是一個HTTP響應狀態碼表明客戶端應用程序已超過速度限製或者他們可以發送請求的數量在給定的一段時間。

請通過這些類似的線程:-

磚