取消
顯示的結果
而不是尋找
你的意思是:

根據以往的行連接字符串值

shaz
新的貢獻者二世

考慮下麵的輸入:

ID PrevID - - - - - - - - - - - - - - - - - - 33歲零272 33 317 272 318 317

我需要以某種方式得到以下結果:

結果- - - - - - - - - - 33/272 / 33 / / 33/272/317 / 33/272/317/318

我在SQL需要這樣做,如果真的不可能,那麼別的,和磚不支持遞歸CTE的所以我的思想,我有一個SQL小提琴,說明了recursivce CTE磚不工作:http://sqlfiddle.com/ ! 18/101df / 3/0

任何幫助都是感激,謝謝

1接受解決方案

接受的解決方案

Pholo
貢獻者

嗨@Shazal戈麥斯,

我發現使用pyspark這個解決方案

從pyspark。sql從pyspark.sql導入函數作為F。從pyspark窗口導入窗口。sql從pyspark.sql進口行。類型導入* id = [“33”、“272”、“317”、“318”] df_ids =火花。createDataFrame([行(ID =我)我在ids中)顯示(df_ids。withColumn (PREVIOUS_ID, F.concat_ws (' / ', F.array_sort (F.collect_set (F.col (ID)) .over (Window.orderBy (F.col (ID) .cast(整數))).cast(數組<整數>)))))

讓我知道它是否滿足你的需要。

在原帖子查看解決方案

6個回答6

Kaniz
社區經理
社區經理

你好@shaz!我的名字叫Kaniz,我這裏的技術主持人。很高興認識你,謝謝你的問題!看看你的同行在社區中有一個回答你的問題。否則我將盡快給你回電。謝謝。

shaz
新的貢獻者二世

嗨@Kaniz開羅,謝謝跟進!很高興見到你

Kari_05152023
新的貢獻者二世

嗨Kaniz:

我伸出援助使用SQL / t - SQL字符串函數使用連接字符串(即。磚連接功能用於創建數據表中的唯一標識名稱)。我隻讀訪問,需要驗證巨大的數據集。提前謝謝你!

親切的問候,凱倫

Pholo
貢獻者

嗨@Shazal戈麥斯,

我發現使用pyspark這個解決方案

從pyspark。sql從pyspark.sql導入函數作為F。從pyspark窗口導入窗口。sql從pyspark.sql進口行。類型導入* id = [“33”、“272”、“317”、“318”] df_ids =火花。createDataFrame([行(ID =我)我在ids中)顯示(df_ids。withColumn (PREVIOUS_ID, F.concat_ws (' / ', F.array_sort (F.collect_set (F.col (ID)) .over (Window.orderBy (F.col (ID) .cast(整數))).cast(數組<整數>)))))

讓我知道它是否滿足你的需要。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map