取消
顯示的結果
而不是尋找
你的意思是:

如何刪除超過4字節字符使用pyspark磚嗎?

eimis_pacheco
新的貢獻者三世

嗨,社區,

我們需要刪除超過4字節字符使用pyspark磚由於這些不支持通過亞馬遜紅移。有人知道我能做到這一點嗎?

非常感謝你提前

問候

1回複1

Shalabh007
尊敬的貢獻者

假設你有一個字符串類型列pyspark dataframe,一個可能的方法是

  1. 識別的字符總數(比如每個值的列
  2. 確定沒有采取的每個字符的字節數(b)
  3. 使用substring()函數選擇前n個字符,n =地板(4 / b)
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map