取消
顯示的結果
而不是尋找
你的意思是:

無法推斷出火花毫升管道模型時使用自定義構建的預處理階段

416412年
新的因素

我們正在努力構建一個基於PySpark內部使用情況。我們需要大量的預處理的數據。因此,為了迎合我們使用定製的火花毫升管道階段的轉換,需要做我們的數據並不是可用的pyspark.ml模塊。這些定製的預處理階段擴展估計,HasInput, HasOutput, MLWritable和MLReadable類即

從pyspark.ml。從pyspark.ml.param管道進口變壓器,估計量。共享進口HasInputCol HasOutputCol

我們可以使用它進行調優 hyperOpt 和train-evaluate整個數據。我們還在MLflow記錄模型。然而,當我們試圖加載的管道模型推斷,失敗是由於自定義階段的__init__ ()方法。我們不能理解為什麼在加載模型調用構造函數方法即使對象內的類變量已經安裝在培訓(擬合)階段。

這裏有一些定製變壓器的一部分,這是有問題:
code_snipped.png
這是我們麵臨錯誤的截圖:
截圖2023-07-14 165821. png
如果有任何從事這種發展。 請幫助!這將是偉大的如果有人可以分享一些工作的例子。
0回答0
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map