特性與MLlib工程

Apache火花MLlib包含許多工程規模效用函數來執行功能,包括編碼和轉換特性的方法。這些方法也可以用來為其他機器學習庫過程特性。

磚推薦以下Apache火花MLLib指南:

這個PySpark-based筆記本包含預處理步驟,分類數據轉換為數值變量使用類別索引和一個炎熱的編碼。

二進製分類示例

在新標簽頁打開筆記本