通用函數

處理選項

reset_option(關鍵)

一個選擇重置為它們的默認值。

get_option(關鍵(違約))

檢索指定的選項的值。

set_option(關鍵字,值)

設置指定選項的值。

option_context(* args)

上下文管理器暫時設置選項聲明上下文。

數據操作和SQL

融化(框架、id_vars value_vars var_name,…))

透視的DataFrame寬格式長格式,選擇離開標識符變量集。

合並(obj,對[,,left_on,…))

合並DataFrame對象數據庫樣式加入。

merge_asof(左,右[,,left_on,…)

執行一個asof合並。

get_dummies(數據(前綴、prefix_sep…))

類別變量轉換成虛擬/指標變量,也被稱為一個炎熱的編碼。

concat(obj[、軸、連接、ignore_index類))

連接pandas-on-Spark物體沿著一個特定的軸與其他組可選邏輯沿軸。

sql(查詢[index_col])

執行一個SQL查詢並返回結果作為pandas-on-Spark DataFrame。

廣播(obj)

標誌著DataFrame作為使用廣播加入足夠小。

頂級缺失的數據

並網發電(obj)

檢測缺失值類似數組的對象。

isnull(obj)

檢測缺失值類似數組的對象。

notna(obj)

檢測現有(non-missing)值。

notnull(obj)

檢測現有(non-missing)值。

頂級處理數字數據

to_numeric(參數、錯誤)

將參數轉換為數字類型。

頂級處理datetimelike數據

to_datetime(參數、錯誤的格式,單位,…))

將參數轉換為日期時間。

date_range([開始、結束時間,頻率,tz,…))

返回一個固定頻率DatetimeIndex。

to_timedelta(參數、單位、錯誤)

將參數轉換為timedelta。

timedelta_range([開始、結束時間,頻率,…)

返回一個固定頻率TimedeltaIndex,天作為默認頻率。