再保險:pandas.read_parquet問題()和路徑2 -磚- 19655頁

johnb1 · ‎11-30-2022

我在做“數據工程與磚V2“學習路徑。

我不能運行”DE 4.2 -提供外部來源”選項,作為第一個代碼單元不成功運行:

% . . /運行包括-設置- 04.2 /教室

截圖1:

在設置筆記本,代碼崩潰在以下命令(見截圖2):

df = pd。= datasource_path read_parquet(路徑。替換(“dbfs: / / dbfs /))

錯誤信息是:

FileNotFoundError (Errno 2):沒有這樣的文件或目錄:/ dbfs / mnt / dbacademy-datasets / data-engineering-with-databricks / v02 /電子商務/生/ users-historical '

截圖2:

似乎有一個問題與路徑,盡管它確實存在:

截圖3:

我在一個小的路徑規範,但沒有任何幫助:

截圖4:

johnb1 · ‎12-16-2022

ss2 @Uma Maheswara Rao Desula我解決問題使用的建議(見下文)。閱讀後火花DataFrame轉換成熊貓DataFrame使用ToPandas()方法。

johnb1 · ‎12-16-2022

這就跟你問聲好！

我隻能使用運行時7.3,9.1。,……,12.0. Minimum is 7.3. I am using DBR commnunity edition.

Br。

SS2 · ‎12-03-2022

你可以嚐試像this.spark.read.parquet (“dbfs: / mnt / .......”)

johnb1 · ‎12-16-2022

你好@年代

閱讀文件中是成功的。然而,我有一個pyspark.sql.dataframe。DataFrame對象。這是一個熊貓DataFrame,不一樣的對嗎?

Br。

Aviral-Bhardwaj · ‎12-16-2022

嘿@年代,

我能理解你的問題

所以進口DBC文件,而不是為了解決這個問題將會有一個文件夾所有解決方案探索解決一個工作。

請upvote如果你從我的回答有一些提示

謝謝

Aviral Bhardwaj

磚