作為@Werner Stinckens說“火花”將使用多個節點來處理數據。
如果你想使用熊貓的代碼有熊貓的API火花(3.2)。你需要做的就是進口不同的庫:
#這不是:從熊貓從pyspark進口read_csv。熊貓進口read_csv pdf = read_csv (“data.csv”)
這裏有更多的信息//m.eheci.com/blog/2021/10/04/pandas - api -在即將到來的- apache -火星- 3 - 2. - html