瀏覽
磚
幫助
登錄
開始使用磚
開始討論
開始資源
磚平台Beplay体育安卓版本
技術博客
磚平台的討論Beplay体育安卓版本
工程數據
機器學習
倉庫&分析
數據治理
管理和架構
學習
學習討論
培訓產品
認證
學習路徑
認證
組
地區和利益集團
美洲
亞太地區
利益集團
事件
社區灣
社區討論
社區新聞&成員認可
User16765128951
因素二世
自
02-11-2022
06-26-2023
用戶數據
31日
的帖子
1
解決方案
0
榮譽給
1
榮譽收到
磚
關於User16765128951
用戶活動
的帖子
回複
我的火花SQL加入速度非常緩慢——我能做些什麼來呢?
06-17-2015
花10 - 12分鍾,我可以讓它更快嗎?
再保險:如何處理任務不是序列化異常?
09-29-2021
@Nick Studenski,你能嚐試宣布聯合國和pw變量為每個分區的範圍之外?這樣做之前,你隻是通過一個變量在函數而不是dbutils對象。
Re:創建一個內存表的火花,將數據插入它
04-12-2016
明白了——使用UnionAll怎麼樣?我相信這個代碼片段做什麼你想要:從pyspark。sql進口行數組=[行(值= 1)、行(值= 2)、行(值= 3)]df = sqlContext.createDataFrame (sc.parallelize(數組))array2 = [(value = 4)行,Ro……
再保險:如何導入本地python文件在筆記本嗎?
04-11-2016
@Deepak Chokkadi %運行不需要dbfs路徑——它把筆記本的路徑從工作區。
Re:創建一個內存表的火花,將數據插入它
04-08-2016
1)使用sc.parallelize來創建表。2)注冊隻是一個臨時表。3)你可以繼續添加在這個表中插入語句。注意,SQL支持從其他表插入火花。所以,你可能需要創建臨時表……
Re:模糊文本匹配的火花
04-01-2016
您可以使用python庫的火花。我建議使用毛茸茸、軟綿綿計算相似之處。然後你隻需要加入內部數據集的客戶名單。如果你想確保你嚐試每一個客戶名單對實習生…
查看更多
榮譽從
用戶
數
Kaniz
1
查看所有
map