LogisticRegressionWithLBFGS

pyspark.mllib.classification。 LogisticRegressionWithLBFGS

多項訓練分類模型/二元邏輯回歸使用內存有限撓撓。

標準功能擴展和L2正規化默認使用。

方法

火車(數據、迭代、initialWeights…))

訓練邏輯回歸模型在給定的數據。

方法的文檔

classmethod 火車 ( 數據:pyspark.rdd.RDD(pyspark.mllib.regression.LabeledPoint],迭代:int=One hundred.,initialWeights:可選(VectorLike]=沒有一個,regParam:浮動=0.0,regType:str=“外語”,攔截:bool=,修正:int=10,寬容:浮動=1 e-06,validateData:bool=真正的,numClasses:int=2 )pyspark.mllib.classification.LogisticRegressionModel

訓練邏輯回歸模型在給定的數據。

參數
數據 pyspark.RDD

訓練數據的抽樣pyspark.mllib.regression.LabeledPoint

迭代 int,可選

迭代的數量。(默認:100)

initialWeights pyspark.mllib.linalg.Vector或可兌換,可選

最初的重量。(默認值:無)

regParam 浮動,可選

調整參數。(默認值:0.01)

regType str,可選

規範用於訓練模型的類型。支持的價值觀:

  • “l1”使用l1正規化

  • “l2”使用l2正規化(默認)

  • 沒有沒有正規化

攔截 bool,可選

布爾參數表示的使用與否為訓練數據(即增強表示。是否偏置功能被激活)。(默認值:False)

修正 int,可選

修正LBFGS中使用更新的數量。如果已知updater用於二進製分類,它調用毫升實現,該參數將沒有影響。(默認值:10)

寬容 浮動,可選

L-BFGS迭代的收斂公差。(默認值:1 e-6)

validateData bool,可選

布爾參數,表明該算法是否應該訓練之前驗證數據。(默認值是真實的)

numClasses int,可選

類的數量(即。,outcomes) a label can take in Multinomial Logistic Regression. (default: 2)

例子

> > >數據=(LabeledPoint(0.0,(0.0,1.0]),LabeledPoint(1.0,(1.0,0.0]),]> > >lrm=LogisticRegressionWithLBFGS火車(sc並行化(數據),迭代=10)> > >lrm預測([1.0,0.0])1> > >lrm預測([0.0,1.0])0