遷移到模型服務

本文演示了如何使模型在你的工作區和開關的新模型模型服務建立在經驗serverless計算。

需求

  • 模型在MLflow模型注冊中心注冊。

  • 注冊的權限模型中描述的那樣訪問控製指南

重大的改變

  • 在模型服務,請求發送到端點的格式和端點的響應從遺留MLflow模型略有不同。看到評分模型端點新格式協議的細節。

  • 在模型服務,包括端點URLserving-endpoints而不是模型

  • 模型服務包括完全支持工作流管理資源與API

  • 模型由磚生產就緒並支持SLA服務。

使模型服務為您的工作空間

使用模型服務,您的帳戶管理必須閱讀並接受條款和條件的賬戶控製台。

不需要額外的步驟,使模型在工作區中。

遷移遺留MLflow模型服務模型,模型服務

您可以創建一個模型服務端點和靈活過渡模型服務工作流沒有禁用遺留MLflow模型服務

以下步驟展示了如何做到這一點的UI。對於每個模型上遺留MLflow模型服務啟用:

  1. 導航到服務端點側邊欄的機器學習的工作區。

  2. 按照工作流描述UI工作流如何創建一個服務端點和你的模型。

  3. 轉換您的應用程序使用新提供的服務端點URL查詢模型,以及新的得分格式。

  4. 當你的模型轉換,你可以瀏覽模型側邊欄的機器學習的工作區。

  5. 選擇你想要的模型禁用遺留MLflow模型服務。

  6. 服務選項卡上,選擇停止

  7. 消息似乎證實。選擇停止供應

部署模型版本遷移到模型服務

在以前版本的模型服務功能,服務端點創建基於注冊階段模型版本:暫存生產。遷移模型的經驗,你可以複製行為的新模式提供經驗。

本節演示如何創建單獨的模型服務端點暫存模型版本和生產模型版本。以下步驟展示了如何實現這一服務端點的API為每個服務模型。

在這個例子中,注冊型號名稱模型版本1在模型階段嗎生產和版本2在模型階段暫存

  1. 為您的注冊模型創建兩個端點,一個用於暫存模型版本,另一個用於生產模型版本。

    暫存模型版本:

    帖子. . / api / 2.0 / serving-endpoints{“名稱”:“modelA-Staging”“配置”:{“served_models”:({“model_name”:“模型(一個”,“model_version”:“2”/ /暫存模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],},}

    生產模型版本:

    帖子. . / api / 2.0 / serving-endpoints{“名稱”:“modelA-Production”“配置”:{“served_models”:({“model_name”:“模型(一個”,“model_version”:“1”,/ /生產模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],},}
  2. 驗證端點的狀態。

    因為將端點:得到. . / api / 2.0 / serving-endpoints / modelA-Staging

    生產端點:得到. . / api / 2.0 / serving-endpoints / modelA-Production

  3. 一旦端點準備,查詢端點使用:

    因為將端點:帖子/ serving-endpoints / modelA-Staging /調用

    生產端點:帖子/ serving-endpoints / modelA-Production /調用

  4. 版本更新端點基於模型轉換。

    在場景中創建一個新的模型版本3,你可以有模型過渡到版本2生產,而模型版本3可以過渡到暫存和模型版本1存檔。這些變化可以反映在單獨的模型服務端點如下:

    暫存端點,版本更新端點使用新的模型暫存

    把. . / api / 2.0 / serving-endpoints / modelA-Staging /配置{“served_models”:({“model_name”:“模型(一個”,“model_version”:“3”/ /新的分段模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],}

    生產端點,版本更新端點使用新的模型生產

    把. . / api / 2.0 / serving-endpoints / modelA-Production /配置{“served_models”:({“model_name”:“模型(一個”,“model_version”:“2”/ /新產品模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],}

額外的資源