取消
顯示的結果
而不是尋找
你的意思是:

如何從pyspark數據幀中提取JSON對象。我能夠從另一個列中提取數據數組格式的使用“爆炸”功能,但爆炸不是工作的對象類型。其返回類型不匹配的錯誤。

antonyj453
新的貢獻者二世

我試過下麵代碼中提取數據在數組:

df2 = df_deidentifieddocuments_tst.select (F.explode (annotationId) .alias (annotationId)) .select (“annotationId oid美元。”)

這是工作好. .為JSON對象類型,但它不工作。下麵是列:

CreateaAT有什麼想法或建議將是很大的幫助。謝謝你!

1回複1

UmaMahesh1
尊敬的貢獻者三世

你試過使用from_json函數提取這一列數據?

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map