pyspark.pandas.sql
`pyspark.pandas。` `sql` ( 查詢:str,index_col:聯盟(str,列表(str),沒有一個)=沒有一個, kwargs:任何 )→pyspark.pandas.frame.DataFrame
pandas-on-Spark DataFrame

pandas-on-Spark係列

熊貓DataFrame

熊貓係列

字符串

參數

例子

調用內置的SQL函數。

           > > >ps。sql(“SELECT * FROM範圍(10)id > 7”)id0 81 9
          

           > > >ps。sql(“SELECT * FROM範圍(10)id >{bound1}和id <{bound2}”,bound1=7,bound2=9)id0 8
          

           > > >mydf=ps。範圍(10)> > >x=元組(範圍(4))> > >ps。sql(“選擇{ser}從{mydf}在id{x}”,爵士=mydf。id,mydf=mydf,x=x)id0 012 - 23個3
          

混合pandas-on-Spark和熊貓DataFrames連接操作。注意,指數下降。

           > > >ps。sql(“‘…選擇m1。,m2.b…從{table1}m1內連接{表}平方米…m1。關鍵= m2.key…ORDER BY m1。,m2.b”,…表1=ps。DataFrame({“一個”:(1,2),“關鍵”:(“一個”,“b”}),…表二=pd。DataFrame({“b”:(3,4,5),“關鍵”:(“一個”,“b”,“b”]}))一個b0 1 31 2 42 2 5
          

同時,可以查詢使用係列。

           > > >psdf=ps。DataFrame({“一個”:(1,2,3),“B”:【4,5,6)},指數=(“一個”,“b”,“c”])> > >ps。sql(“選擇{mydf.A}從{mydf}”,mydf=psdf)一個0 11 22 3
          

pyspark.pandas.sql pyspark.pandas。 sql ( 查詢:str,index_col:聯盟(str,列表(str),沒有一個)=沒有一個,* *kwargs:任何 )→pyspark.pandas.frame.DataFrame pandas-on-Spark DataFrame pandas-on-Spark係列 熊貓DataFrame 熊貓係列 字符串

pyspark.pandas.sql
`pyspark.pandas。` `sql` ( 查詢:str,index_col:聯盟(str,列表(str),沒有一個)=沒有一個, kwargs:任何 )→pyspark.pandas.frame.DataFrame
pandas-on-Spark DataFrame

pandas-on-Spark係列

熊貓DataFrame

熊貓係列

字符串