取消
顯示的結果
而不是尋找
你的意思是:

問題pandas.read_parquet()和路徑

johnb1
新的貢獻者三世

我在做“數據工程與磚V2“學習路徑。

我不能運行”DE 4.2 -提供外部來源”選項,作為第一個代碼單元不成功運行:

% . . /運行包括-設置- 04.2 /教室

截圖1:

MicrosoftTeams-image

在設置筆記本,代碼崩潰在以下命令(見截圖2):

df = pd。= datasource_path read_parquet(路徑。替換(“dbfs: / / dbfs /))

錯誤信息是:

FileNotFoundError (Errno 2):沒有這樣的文件或目錄:/ dbfs / mnt / dbacademy-datasets / data-engineering-with-databricks / v02 /電子商務/生/ users-historical '

截圖2:

MicrosoftTeams-image (1)

似乎有一個問題與路徑,盡管它確實存在:

截圖3:

捕獲

我在一個小的路徑規範,但沒有任何幫助:

截圖4:

Capture_2

10個回答10

johnb1
新的貢獻者三世

ss2 @Uma Maheswara Rao Desula我解決問題使用的建議(見下文)。閱讀後火花DataFrame轉換成熊貓DataFrame使用ToPandas()方法。

johnb1
新的貢獻者三世

這就跟你問聲好!

我隻能使用運行時7.3,9.1。,……,12.0. Minimum is 7.3. I am using DBR commnunity edition.

Br。

SS2
價值貢獻

你可以嚐試像this.spark.read.parquet (“dbfs: / mnt / .......”)

johnb1
新的貢獻者三世

你好@年代

閱讀文件中是成功的。然而,我有一個pyspark.sql.dataframe。DataFrame對象。這是一個熊貓DataFrame,不一樣的對嗎?

Br。

Aviral-Bhardwaj
尊敬的貢獻者三世

嘿@年代,

我能理解你的問題

所以進口DBC文件,而不是為了解決這個問題將會有一個文件夾所有解決方案探索解決一個工作。

請upvote如果你從我的回答有一些提示

謝謝

Aviral Bhardwaj

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map