嗨,我很新磚,我試圖運行快速實驗了解最佳實踐對我來說,我和公司的同事。
我把數據從雪花
df =火花。讀\
.format \(“雪花”)
.options \(* *選項)
.option \(“查詢”,查詢)
.load ()
檢查數據類型的特性與prinSchema ()
轉換為大熊貓與
df.to_pandas_on_spark ()
和我有第一個問題所有的列成為對象的類型
我將列在浮動/ int
我運行一個簡單的RandomForest分類器
從sklearn。整體進口RandomForestClassifier srf
模型= srf ()
X = df [[' col_float]]
y = df(“標簽”)
模型。fit (X, y)
這裏我有第二個問題我一直收到這個錯誤
ValueError:不能將字符串轉換成浮點數:“col_float”
我一直在關注不同的教程,嚐試不同的事物。我想這可能是愚蠢的,因為我天真的磚但我浪費這麼多時間。
誰有一些問題或知道發生了什麼?
你好,謝謝你的回複。我做了檢查,但是並沒有什麼改變。
我還有兩個問題,當我把熊貓的一切仍然是一個對象
然後我將列但我仍然valueerror
這是一個pyspark.sqldataframe.dataframe
把熊貓我試過
df.to_pandas_on_spark ()
df.toPandas ()
和
進口pyspark。熊貓作為ps
ps.DataFrame (df)
他們用一切成為一個對象相同的結果。
但同時為什麼也列轉換為浮動後我得到錯誤,不能將字符串轉換成浮點數