取消
顯示的結果
而不是尋找
你的意思是:

Python讀csv——不要考慮逗號引號內,即使不直接引用分隔符

ASN
新的貢獻者二世

下麵我有數據,當閱讀CSV,我不想考慮逗號引號內即使不直接引用分離器(如記錄# 2)。1和3的記錄很好如果我們使用分隔符,但失敗2記錄

輸入:

col1, col2 col3

a, b, c

”b1, b2, b3“b4 c

“a1, a2, b, c

輸出:

輸入和預期輸出

5回複5

Pholo
貢獻者

你好,我認為你可以使用這個選項csvReadee

spark.read。選項(頭= True, 9 =”、“unescapedQuoteHandling =“BACK_TO_DELIMITER”) . csv (“your_file.csv”)

尤其是unescapedQuoteHandling。你可以在這個鏈接尋找其他的選擇

https://spark.apache.org/docs/latest/sql-data-sources-csv.html

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map