取消
顯示的結果
而不是尋找
你的意思是:

dbutils擴展自定義引發的衝突

maaaxx
新的貢獻者三世

你好親愛的社區,

我們已經安裝了一個定製的火花擴展過濾器可以讀入的文件筆記本。一切都好,如果我們使用火花功能。

然而,文件不能正常過濾如果用戶將使用如dbutils.fs.cp。

有人知道為什麼dbutils並不考慮火花擴展在這種情況下嗎?

很多謝謝!

歡呼,

馬克斯

4回複4

Tayyab_Vohra
貢獻者

你好@Yuan高,

磚、火花和dbutils自動隻注入的主要入口點——你的筆記本,但他們不會傳播到Python模塊。火花解決方案很簡單,就是使用getActiveSession SparkSession的函數類(如SparkSession.getActiveSession()),但你需要繼續通過dbutils明確直到你不讓dbutils抽象為某個函數

文檔磚連接顯示了一個示例可能是怎麼實現的。這個例子SparkSession作為顯式參數,但它可以改良後用來完全避免,就像這樣:

從pyspark def get_dbutils ():。sql進口SparkSession火花= SparkSession.getActiveSession()如果spark.conf.get (spark.databricks.service.client.enabled) = = " true ": pyspark。dbutils進口dbutils返回dbutils(火花)其他:進口IPython返回IPython.get_ipython () .user_ns (“dbutils”)

然後在你的函數,您可以使用主要功能的火花dbutils功能

Debayan
尊敬的貢獻者三世
尊敬的貢獻者三世

嗨,你能解釋一下自定義火花擴展嗎?

也請標記@Debayan你的下一個反應,將通知我,謝謝!

Vartika
主持人
主持人

嗨@Yuan高,

檢查。如果@tayyab vohra的回答幫助,你會讓我們知道最好的答案和馬克?如果沒有,你會很高興給我們更多的信息嗎?

謝謝!

maaaxx
新的貢獻者三世
這是最好的答案。謝謝你!莫。3。2023年4月嗯12:08表schrieb磚社區<(電子郵件保護)>:
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map