所以我比較兩種不同的模式dataframe使用這段代碼:
> > > df1。模式= = df2。模式:假
但問題是,這兩個模式是完全平等的。
當更深入的研究我發現一些StructFields()應該是平等有不同的元數據屬性
{“名稱”:“customer_id”,“數據類型”:StringType(),“可空”:真的,“元數據”:{}}{“名稱”:“customer_id”,“數據類型”:StringType(),“可空”:真的,“元數據”:{“規模”:0}}
這個元數據屬性做什麼工作?
編輯:
> > >所有(str (x) = = str (x, y)在zip (df1 y。模式,df2.schema):真的