取消
顯示的結果
而不是尋找
你的意思是:

特性存儲:可以create_training_set()實現執行內連接?

thib
新的貢獻者三世

timeseries特性表、內連接在功能表的創建。對於其他類型的功能表,左連接,所以NaN值可以出現在訓練集。內加入create_training_set能與一個參數()方法實現?

1接受解決方案

接受的解決方案

Hubert_Dudek1
尊敬的貢獻者三世

create_training_set執行加入。這隻是一個簡單的函數,從火花SQL數據庫選擇數據存儲所使用的特性。您可以編寫自己的代碼內連接:

customer_features_df =火花。sql (“SELECT * FROM recommender_system.customer_features”) product_features_df =火花。sql training_df (“SELECT * FROM recommender_system.product_features”)。加入(customer_features_df = [training_df。cid = = customer_features_df。customer_id training_df。transaction_dt = = customer_features_df。dt], = "內部")。加入(product_features_df = " product_id”,如何=“內在”)

在原帖子查看解決方案

3回複3

匿名
不適用

你好,@Thibault Daoulas !我的名字是風笛手,我是一個主持人在社區。很高興見到你,歡迎來到社區。謝謝你的問題!

我們會給社區反應一段時間,然後如果我們需要,我們會回來。:slightly_smiling_face:

Hubert_Dudek1
尊敬的貢獻者三世

create_training_set執行加入。這隻是一個簡單的函數,從火花SQL數據庫選擇數據存儲所使用的特性。您可以編寫自己的代碼內連接:

customer_features_df =火花。sql (“SELECT * FROM recommender_system.customer_features”) product_features_df =火花。sql training_df (“SELECT * FROM recommender_system.product_features”)。加入(customer_features_df = [training_df。cid = = customer_features_df。customer_id training_df。transaction_dt = = customer_features_df。dt], = "內部")。加入(product_features_df = " product_id”,如何=“內在”)

thib
新的貢獻者三世

謝謝你休伯特,這是一個很好的選擇,我想我會堅持api盡可能,但這解決。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map