01-17-2022上午11:05
我們應用groupby pyspark.sql操作。Dataframe然後mlflow每組火車上一個模型。我們看到間歇性故障,因為MLFlow服務器回複429,因為太多的請求/ s
有哪些最佳實踐在這些情況下,你如何限製即將離任的調用外部服務嗎?我們使用托管MLFlow磚,有沒有一種方法,我們可以配置MLFlow,隊列後續請求將它們發送到服務器之前?
01-17-202211:49是
至少在Azure MLFlow每個工作空間的限製相當嚴格:
每秒每秒——查詢。此外,有限製的並發模型版本在20等待狀態(每個工作區創建)。另外429自動重試。
每組並行模型訓練嗎?也許不是平行隻是一組訓練,監控執行器的使用可以接近100%,可以花同樣的時間。
在原帖子查看解決方案
01-17-2022上午11:52
謝謝,文檔AWS的限製是一樣的(我有檢查)。有三個選擇:
謝謝
02-16-202209:02我
@Edmondo Porcu -我的名字叫風笛手,我是主持人磚。我很抱歉這麼長時間才給我答複。我們正在尋找最好的人來幫助你。
02-24-202206:36我
嗨Porcu @Edmondo, 429是一個HTTP響應狀態碼表明客戶端應用程序已超過速度限製或者他們可以發送請求的數量在給定的一段時間。
請通過這些類似的線程:-
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。