取消
顯示的結果
而不是尋找
你的意思是:

使用MLFlow並行訓練機器學習模型

ianchenmu
新的貢獻者二世

我訓練一個毫升模型(例如,XGboost)和我有一個大的組合5 hyperparameters,每個參數有5個候選人說,這將是5 ^ 5 = 3125組合。

現在我想做並行網格搜索在所有hyperparameter組合訓練機器學習模型來獲得最佳性能的模型。

所以我怎麼能實現這一磚,特別是使用MLFlow ?有人告訴我我可以定義一個函數來訓練和評估模型(使用mlflow)和與所有的hyper-parameter組合定義一個數組,數組sc.parallelize然後映射函數。

我想出了sc.parallelize數組的代碼,等等

paras_combo_test = [(x, y) x (50、100、150) y [0.8, 0.9, 0.95]] sc.parallelize (paras_combo_test, 3) .glom () .collect ()

(simplicit,我隻是使用兩個參數x, y,總共有9個組合,我把他們3分區。)

我如何映射在函數模型的訓練和評估(可能使用mlflow),所以會有3作品(每個工作將培訓3模型)並行分區的參數組合?

5回複5

Vidula_Khanna
主持人
主持人

嗨@Chenμ

希望一切都好!

隻是想檢查如果你能解決你的問題,你會很高興分享解決方案或答案標記為最佳嗎?其他的請讓我們知道如果你需要更多的幫助。

我們很想聽到你的聲音。

謝謝!

Baidu
map