取消
顯示的結果
而不是尋找
你的意思是:

GroupBy三角洲生活表失敗與錯誤“RuntimeError:查詢函數必須返回一個火花或考拉DataFrame”

PrebenOlsen
新的貢獻者三世

我有三角洲住表,我試圖運行GroupBy,但得到一個錯誤:“RuntimeError:查詢函數必須返回一個火花或考拉DataFrame”。

這是我的代碼:

@dlt。表def groups_hierarchy (): df = dlt.read_stream (groups_hierarchy_vw)返回(df .select (“id”,“名字”,(“路徑”,“/”).alias (“groups_in_path”), posexplode(分裂(“路徑”,“/”)).alias (“pos”、“價值”)).drop .select (“val”) (“id”、“名稱”concat(點燃(“集團”)、“pos”) .alias (“group_name”), expr (“groups_in_path (pos)”) .alias (val)) .groupBy ([df。id, df.name])

編輯:

像下麵一樣簡單的事情就可以了(你會注意到我我現在讀一個常規表而不是流,隻是出於測試目的):

@dlt。表def groups_hierarchy():返回dlt.read (streaming_silver) .groupBy (" id ") .count ()

和它工作好當我使用select語句和轉換,但是絕對最後.groupBy()似乎將它轉換成一個非火花/考拉DataFrame

@dlt。表def groups_hierarchy():返回dlt.read (streaming_silver) .select (“id”,“名字”,(“路徑”,“/”).alias (“groups_in_path”), posexplode(分裂(“路徑”,“/”)).alias (“pos”、“價值”)).drop .select (“val”) (“id”、“名稱”concat(點燃(“集團”)、“pos”) .alias (“group_name”), expr (“groups_in_path (pos)”) .alias (val)) .groupBy (" id ")

4回複4

Debayan
尊敬的貢獻者三世
尊敬的貢獻者三世

你想加入兩個表使用python生活嗎?

請參考代碼:https://stackoverflow.com/questions/73112299/is-there-a-way-to-join-two-live-tables-on-delta-live-ta..。

請讓我們知道如果這有助於或者任何需要進一步的澄清。

PrebenOlsen
新的貢獻者三世

不,沒有加入我的代碼。問題發生在最後一行,當試圖使用.groupBy。

這在閱讀非視圖時沒問題,但失敗就一個流。流groupBy沒有支持嗎?

Debayan
尊敬的貢獻者三世
尊敬的貢獻者三世

你能請更新你的火花的版本。的使用情況下,tripwire火花版本同樣的錯誤在測試盒框固定。

請參考:

https://issues.apache.org/jira/browse/spark - 24156

Vidula
尊敬的貢獻者

嗨@Preben奧爾森

@Debayan穆克吉反應回答你的問題嗎?如果是的,你會很高興它標記為最好,其他成員可以找到解決方案更快嗎?

我們很想聽到你的聲音。

謝謝!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map