去年,我們宣布Databricks AutoML用於分類和回歸並展示了具有玻璃盒方法來授權數據團隊的重要性。今天,我們很高興地宣布,我們將這些功能擴展到預測問題用於預測的汽車。
數據團隊可以通過UI輕鬆地創建預測。這些生成的預測可以按原樣或起點進行進一步調整。簡化和減少開始的時間在預測中尤其重要,因為利益相關者通常會查看數百甚至數千種不同產品,領土,商店等的預測,這可能導致積壓的未開發預測。用於預測增強數據團隊的Automl,並幫助他們快速驗證數據集的預測能力,並獲得基線模型來指導預測項目的方向。
讓我們看一下與Automl進行預測有多容易的。
示例:預測糖果生產
隨著情人節即將到來,我們想預測未來幾周的糖果。
這個怎麼運作
設置向導可以指導我們通過我們需要配置的內容才能開始。我們選擇了“預測”問題類型並選擇了數據集。在此示例中,我們正在使用糖果生產數量數據集我們已經在Databricks和Databricks運行時10.3中創建了作為表。在這裏,我們還可以指定是否要執行單變量或多係列預測。
一旦開始,Automl將執行任何必要的數據準備,使用多個模型使用預言家和阿裏瑪算法,每次與Apache Spark™完全相相地運行時,對每個時間序列進行HyperOPT進行超參數調整。隨著Automl完成的運行,我們將能夠看到經過培訓的不同型號及其性能指標(例如Smape和RMSE),以評估最好的型號。
增強數據團隊
接下來,我們可以看到Automl檢測到糖果類型的“混合”類型沒有足夠的數據來產生預測並通過警告通知我們。
關於汽車的最好的部分是一切都是透明的。Automl將對根據我們的數據執行甚至跳過的重要步驟提供警告。這使我們有機會利用數據知識並對模型進行任何必要的更新。
Automl也可以通過允許我們查看經過培訓的每種型號的完整python筆記本和數據探索筆記本,從而使這一簡便起見,從而突出了有關模型使用的數據的見解。在數據探索筆記本中,我們能夠確認去除“混合”糖果類型不會影響我們的預測,因為我們可以看到它隻有兩個數據點。
這些筆記本電腦可以通過允許他們引入域知識以對自動生成的模型進行最新信息,從而成為數據科學家的重要起點。
為了了解預測的糖果生產的外觀,我們可以選擇最佳性能模型的筆記本,並查看實際糖果生產的包含圖與預測,包括2022年1月至2022年3月的圖案。
除了做出預測外,Automl預測還提供了對筆記本中預測的更多分析。在這裏,我們可以看到趨勢和季節性如何體現在預測中。總體而言,看起來糖果的生產趨向於從10月到12月達到頂峰,與萬聖節和假期相吻合,但2月份的生產又略有飆升,正好趕上情人節。
現在,我們已經確定了要使用的模型,我們可以通過單擊模型名稱或從運行列表中開始時間進行注冊,然後單擊“注冊模型”按鈕。從這裏,我們可以設置模型服務和部署我們的模型用於推論和預測。
開始使用Databricks Automl Public Preview
Databricks Automl是Databricks機器學習經驗的一部分,在公共預覽中。開始:
在Databricks UI中,隻需通過左側欄切換到“機器學習”體驗。單擊“(+)創建”,然後單擊“自動實驗”或導航到實驗頁麵,然後單擊“創建Automl實驗”。使用Automl API,單線調用,可以在我們的文檔。
準備好自己嚐試數據鏈球機嗎?閱讀有關Databricks Automl的更多信息以及如何在AWS,,,,天藍色, 和GCP或拿汽車預測課程(可用於Databricks Academy登錄名的beplay体育app下载地址Databricks客戶)。
如果您是Automl的新手,請務必在2月10日上午10點在Fabletics與我們的朋友一起進行現場演示。我們將介紹Automl的基本原理,並引導您了解如何 - 無論您的角色如何 - 您都可以利用Automl來開始並簡化ML項目。抓住座位呢