你好!
我在python中使用火花2.1.1
(python 2.7中執行jupyter筆記本)
線性回歸和試圖讓網格搜索參數。
我的代碼是這樣的:
從pyspark.ml。優化進口CrossValidator ParamGridBuilder pyspark。毫升=進口管道管道管道(階段= [sql_transformer、彙編、lr]) paramGrid = ParamGridBuilder () .addGrid (lr)。解算器,[“l-bfgs”、“正常”]).build()求值程序= RegressionEvaluator () crossval = CrossValidator(估計量=管道,estimatorParamMaps = paramGrid numFolds = 3) cvModel = crossval.fit cvModel.avgMetrics(火車)
出[]> [887.3183210064692,787.3183297841774]
我的問題是:我如何能找到,這組參數查詢裝備指標對應?
我如何可以得到參數的最佳訓練模型?
讓我給你舉個例子。我叫bestModel之後,我將pyspark.ml.recommendation.ALSModel。(這是擬合模型)。我真正想要的是pyspark.ml.recommendation。肌萎縮性側索硬化症,這就是為什麼我不能得到模型中的參數,例如α