MLflow指南

MLflow是一個用於管理端到端機器學習生命周期Beplay体育安卓版本的開源平台。它有以下主要組成部分:

  • 跟蹤:允許您跟蹤實驗,記錄和比較參數和結果。

  • 模型:允許您管理和部署從各種ML庫到各種模型服務和推理平台的模型。Beplay体育安卓版本

  • 項目:允許您將ML代碼打包為可重用、可複製的形式,以便與其他數據科學家共享或轉移到生產環境中。

  • Model Registry:允許您集中一個模型存儲,以管理模型的整個生命周期階段轉換:從登台到生產,具有版本控製和注釋功能。

  • 模型服務:允許您將MLflow模型作為REST端點托管。

Databricks提供了一個完全托管的MLflow托管版本,集成了企業安全特性、高可用性和其他Databricks工作區特性,如實驗和運行管理和筆記本修訂捕獲。Databricks上的MLflow提供了跟蹤和保護機器學習模型訓練運行和運行機器學習項目的綜合體驗。

第一次使用的用戶應該從快速入門,它演示了基本的MLflow跟蹤api。後續文章將通過示例筆記本介紹每個MLflow組件,並描述如何在Databricks中托管這些組件。

MLflow支持JavaPythonR,休息api。

請注意

如果您剛剛開始使用Databricks,可以考慮使用MLflow on磚社區版,它為輕量級實驗提供了一個簡單的托管MLflow體驗。Databricks社區版不支持MLflow項目的遠程執行。我們計劃對實驗和運行的數量施加適度的限製。MLflow在Databricks社區版上的初始啟動沒有任何限製。

存儲在控製平麵中的MLflow數據(實驗運行、指標、標記和參數)使用平台管理的密鑰進行加密。Beplay体育安卓版本加密使用被管理服務的客戶管理鍵對該數據不支持。另一方麵,通過為工作區存儲配置客戶管理的密鑰,可以使用您自己的密鑰對存儲在根(DBFS)存儲中的MLflow模型和構件進行加密。