解決:根據以往的行連接字符串值-磚- 32600

shaz · ‎12-23-2021

考慮下麵的輸入:

ID PrevID - - - - - - - - - - - - - - - - - - 33歲零272 33 317 272 318 317

我需要以某種方式得到以下結果:

結果- - - - - - - - - - 33/272 / 33 / / 33/272/317 / 33/272/317/318

我在SQL需要這樣做,如果真的不可能,那麼別的,和磚不支持遞歸CTE的所以我的思想,我有一個SQL小提琴,說明了recursivce CTE磚不工作:http://sqlfiddle.com/ ! 18/101df / 3/0

任何幫助都是感激,謝謝

Pholo · ‎01-08-2022

嗨@Shazal戈麥斯,

我發現使用pyspark這個解決方案

從pyspark。sql從pyspark.sql導入函數作為F。從pyspark窗口導入窗口。sql從pyspark.sql進口行。類型導入* id = [“33”、“272”、“317”、“318”] df_ids =火花。createDataFrame([行(ID =我)我在ids中)顯示(df_ids。withColumn (PREVIOUS_ID, F.concat_ws (' / ', F.array_sort (F.collect_set (F.col (ID)) .over (Window.orderBy (F.col (ID) .cast(整數))).cast(數組<整數>)))))

讓我知道它是否滿足你的需要。

在原帖子查看解決方案

Kaniz · ‎12-24-2021

你好@shaz!我的名字叫Kaniz,我這裏的技術主持人。很高興認識你,謝謝你的問題!看看你的同行在社區中有一個回答你的問題。否則我將盡快給你回電。謝謝。

shaz · ‎12-24-2021

嗨@Kaniz開羅,謝謝跟進!很高興見到你

Kari_05152023 · ‎06-28-2023

嗨Kaniz:

我伸出援助使用SQL / t - SQL字符串函數使用連接字符串(即。磚連接功能用於創建數據表中的唯一標識名稱)。我隻讀訪問,需要驗證巨大的數據集。提前謝謝你!

親切的問候,凱倫

Pholo · ‎01-08-2022

嗨@Shazal戈麥斯,

我發現使用pyspark這個解決方案

從pyspark。sql從pyspark.sql導入函數作為F。從pyspark窗口導入窗口。sql從pyspark.sql進口行。類型導入* id = [“33”、“272”、“317”、“318”] df_ids =火花。createDataFrame([行(ID =我)我在ids中)顯示(df_ids。withColumn (PREVIOUS_ID, F.concat_ws (' / ', F.array_sort (F.collect_set (F.col (ID)) .over (Window.orderBy (F.col (ID) .cast(整數))).cast(數組<整數>)))))

讓我知道它是否滿足你的需要。