pyspark.sql.DataFrame.replace

DataFrame。 取代 ( to_replace:聯盟(LiteralType、列表(LiteralType) Dict [LiteralType, OptionalPrimitiveType]],價值:聯盟[OptionalPrimitiveType、列表(OptionalPrimitiveType) pyspark._globals。_NoValueType,] = > <沒有價值,沒有一個子集:可選列表(str) = None )→DataFrame

返回一個新的DataFrame值替換為另一個值。DataFrame.replace ()DataFrameNaFunctions.replace ()是彼此的別名。值to_replace和價值必須具有相同的類型,隻能是數字,布爾值或字符串。可以沒有價值。取代時,新值將把現有列的類型。為數字替換所有的值取代應該有獨特的浮點表示。在衝突的情況下(例如{42:1、42.0:1}將使用)和任意更換。

參數
to_replace bool,整數、浮點數、字符串、列表或字典

價值被取代。如果該值是一個東西價值被忽略或可以省略,to_replace必須是一個值和一個替代之間的映射。

價值 bool, int、浮點數、字符串或沒有,可選的

替換的值必須是一個bool,整數、浮點數、字符串或沒有。如果價值是一個列表,價值應該一樣的長度和類型to_replace。如果價值是一個標量和to_replace是一個序列,那麼價值作為替代每個條目在嗎to_replace

子集 列表中,選

可選的列名列表需要考慮。列中指定的子集,沒有匹配的數據類型將被忽略。例如,如果價值是一個字符串,包含一個non-string列子集,然後non-string列隻是忽略。

例子

> > >df4na取代(10,20.)顯示()+ - - - + - - - - - - - - - - - - + +| |年齡身高| |名稱+ - - - + - - - - - - - - - - - - + +| | 80 | |愛麗絲零鮑勃| | | 5 |零湯姆零| | | |零零零| | | |+ - - - + - - - - - - - - - - - - + +
> > >df4na取代(“愛麗絲”,沒有一個)顯示()+ - - - + - - - + - - - +| |年齡身高| |名稱+ - - - + - - - + - - - +零| | 80 | |零鮑勃| | | 5 |零湯姆零| | | |零零零| | | |+ - - - + - - - + - - - +
> > >df4na取代({“愛麗絲”:沒有一個})顯示()+ - - - + - - - + - - - +| |年齡身高| |名稱+ - - - + - - - + - - - +零| | 80 | |零鮑勃| | | 5 |零湯姆零| | | |零零零| | | |+ - - - + - - - + - - - +
> > >df4na取代([“愛麗絲”,“鮑勃”),(“一個”,“B”),“名字”)顯示()+ - - - + - - - + - - - +| |年齡身高| |名稱+ - - - + - - - + - - - +| | 80 | |零| | 5 | |零湯姆零| | | |零零零| | | |+ - - - + - - - + - - - +