我有Jupyter筆記本安裝在我的機器上正常工作。我測試運行火花應用程序通過運行spark-submit命令並返回信息,文件不存在。你需要做什麼來讓它工作嗎?
下麵是一個文件用一個簡單的示例。
從pyspark。sql從pyspark.sql進口SparkSession。功能導入* if __name__ = =“__main__”:火花= SparkSession.builder.appName (Exemplo) .getOrCreate () arqschema =“INT id,省字符串,地位字符串,字符串的派出所,有賣INT,數據字符串“despachantes = spark.read.csv (“C: \ test-spark \ despachantes。csv”,標題= False,模式= arqschema)弗雷= despachantes.select(“日期”).groupBy(年(“日期”)).count () calculo.write.format(“控製台”).save () spark.stop ()