DataFrame -磚- 8304

門將 · ‎03-03-2023

我們如何建立空dataframe磚和我們有多少種方法可以創建dataframe嗎?

匿名 · ‎03-08-2023

@Govardhana Reddy:

方法1:

從pyspark。sql進口SparkSession火花= SparkSession.builder.appName (“MyApp”) .getOrCreate() #與指定的模式創建一個空DataFrame empty_df =火花。createDataFrame([],模式= [“column1”、“column2”, " column3 "]) empty_df.show ()

方法2:從字典

data =[{“名稱”:“愛麗絲”,“年齡”:25},{“名稱”:“鮑勃”,“年齡”:30},{“名稱”:“查理”,“年齡”:35}]df = spark.createDataFrame(數據)df.show ()

方法3:從元組的列表

data =[(“愛麗絲”,25),(“Bob”, 30),(“查理”,35)]df =火花。createDataFrame(數據、模式=[“名稱”,“年齡”])df.show ()

方法4:從熊貓dataframe

熊貓作為pd導入pdf = pd。DataFrame({ "name": ["Alice", "Bob", "Charlie"], "age": [25, 30, 35] }) df = spark.createDataFrame(pdf) df.show()

方法5:從cvs文件

df = spark.read.csv(“路徑/ /文件。csv”,標題= True, inferSchema = True) df.show ()

方法6:從鋪文件

df = spark.read.parquet(路徑/ / file.parquet) df.show ()

Vartika · ‎03-31-2023

嗨@Govardhana Reddy

希望一切進行得很順利。

做@Suteja卡努裏人的回答有幫助嗎?如果是的,你會很高興的答案標記為最好,其他成員可以找到解決方案更快嗎?如果不是,請告訴我們,我們可以幫助你。

幹杯!