開始使用Databricks作為機器學習工程師
此處列出的Quickstarts和教程旨在使您在Databricks上的機器學習迅速開始。每個都包含一個筆記本,您可以在自己的數據助理工作區中導入並運行。他們說明了如何在整個機器學習生命周期中使用數據括號,包括數據加載和準備;模型培訓,調整和推理;以及模型部署和管理。他們展示了有用的工具,例如hyperopt對於自動超參數調整,MLFLOW跟蹤和自體進行模型開發,以及模型注冊表用於模型管理。
筆記
要運行這些教程中包含的筆記本,請單擊在教程頁麵上的筆記本上方。在你的Databricks Workspace瀏覽器, 選擇進口從任何文件夾菜單中粘貼URL。要運行筆記本,您必須有一個群集才能運行。有關創建簇和運行筆記本的更多信息,請參閱從數據科學家開始使用數據映。
筆記
與Google Cloud上的Databricks的托管MLFLOW集成需要用於機器學習的Databricks運行時9.1 LTS或更高。
對於新手數據映的用戶
作為Databricks機器學習新手的最佳起點的最佳場所是:
跟著從數據科學家開始使用數據映快速開始。
運行Databricks機器學習環境中包含的產品內快速入門筆記本。
這本筆記本說明了使用數據鏈球機進行機器學習的許多好處,包括使用MLFLOW和並行化的超參數調整運行跟蹤模型開發。筆記本電腦將為您介紹如何加載數據,訓練和調整模型,比較和分析模型性能,並使用模型進行推理。
運行產品內快速入門筆記本:
登錄到您的Databricks工作區,然後轉到基於Databricks機器學習角色的環境。
要更改角色,請單擊Databricks徽標下方的圖標,然後選擇機器學習。
在Databricks機器學習上首頁, 點擊開始指南在右上方。
Scikit-Learn教程
筆記本 |
要求 |
特征 |
---|---|---|
Databricks運行時ML |
分類模型,MLFLOW,使用HyperOPT和MLFLOW的自動超參數調諧 |
|
Databricks運行時ML |
分類模型,MLFLOW,使用HyperOPT和MLFlow,模型注冊表的自動化超參數調整 |
|
Databricks運行時ML |
分類模型,MLFLOW,使用HyperOPT和MLFLOW,XGBOOST,模型注冊表的自動超參數調整 |