按需虛擬會話:客戶生命周期價值
之前您可以提供個性化的服務和提供給你的客戶,你需要知道他們是誰。beplay体育app下载地址在這個虛擬車間、零售和媒體專家將演示如何構建先進的客戶生命周期價值(CLV)模型。從那裏公司可以提供正確的投資每個客戶為了創建個性化的提供,保存策略,和經驗。
在這種虛擬會話,史蒂夫·索貝爾和Rob獵隼討論的需要,影響和挑戰的公司追求客戶生命周期價值,以及為什麼磚統一數據分析平台的最佳幫助簡化圖表的數據處理和分析。Beplay体育安卓版本然後布萊恩史密斯磚全球技術領導者的零售,走過不同的方法計算CLV使用零售數據,盡管這將適用所有行業尋求理解每個客戶使用曆史行為模式的價值。有強大的觀眾參與會話。我們提供書麵回答下麵的問題。
筆記本電腦的網絡研討會
相關的博客文章
從聊天不回答現場問答
問:我理解CLV很重要,但不應該是強調VLC——有價值客戶的客戶看到它……beplay体育app下载地址企業創建生產因為一隻胳膊不知道其他部門在做什麼。你的觀點是什麼?
我們完全同意。CLV是理解客戶的一片。它坐落在一個廣泛的生態係統的分析。
問:客戶價值下降隨著時間如何?不是隨時間單調遞增的定義?或情節顯示利潤而不是價值?有一個潛在的成本,最終使曲線彎曲向下?還是向下因為情節是關於價值和預測,可以改變事件的函數?
累計,增加客戶的價值,他們停止接觸你。圖表曲線圖表顯示更多關於客戶的價值在lifestage。作為一個例子,如果我們有一個客戶下降但我的花是穩定的,他們的相對價值將下降。
問:什麼是磚與微軟積極做關閉差距因此三角洲湖生態係統完全可用在整個數據?
答:三角洲湖已經開源了大約一年了。我們看到奇妙的三角洲湖模式和技術的采用客戶、供應商和開源社區內。beplay体育app下载地址雖然我們不能說具體的microsoft路線圖,他們是我們最親密的夥伴之一,我們在很多平台集成與他們密切合作。Beplay体育安卓版本三角洲湖和現代數據架構正迅速成為現代數據的實際方法和人工智能的組織。
問:為什麼我們選擇t-SNE其他聚類方法?這個問題為什麼t-SNE適合空間?
t-SNE喜歡PCA降維技術。我們隻是用它來幫助我們可視化數據的聚類。對於實際的聚類,我們將使用k - means稍後。當然還有其他的技術,我們可以使用但是想想t-SNE (PCA)作為功能工程一步,使我們能夠得到可視化。
問:為什麼我們不會與4集群產生類似的y值相比8集群?
答:集群的選擇項(k)有點主觀。當我們使用肘部的技術與輪廓得分,總有平衡與實用/有用的指標。我選擇了8但你可以選擇另一個號碼如果更好為你服務。
問:什麼是差距數據集群的選擇# ?
答:我們使用輪廓分數inter-cluster和intra-cluster距離但是您可以使用其他指標,專注於一個方麵或另一個。
問:你如何productionalize這個模型嗎?
博客中,我們展示了如何將CLV模型轉換為一個函數中,您可以使用批處理ETL、流媒體工作或交互式查詢。也有其他方法來部署模型但是希望這會給你一個想法的如何處理這個任務。
問:你有沒有找到RFM段和銷售之間的關係(帕累托法則)?
答:我們使用分割技術,如圖表的原因是為了避免廣義規則。即使在聚合,經驗法則,如“你的客戶80%的銷售額的20%,“非常廣泛。beplay体育app下载地址不是每個客戶都有相同的潛力,關鍵是你平衡你的接觸了解,潛在價值為了保持盈利能力。圖表等方法使我們能夠與我們如何吸引客戶和精確的ROI最大化我們的營銷美元。beplay体育app下载地址
問:在一個非合同和連續設置這個用例,我們可以用帕累托/ NBD模型計算保留/存活率。這是你正在考慮的事情嗎?
答:當然。在博客中,我們考慮帕累托/ NBD和BG / NBD對於這個場景。我們隻關注了一個便利的網絡研討會。
問:在BTYD模型,你能把季節性嗎?一些零售企業季節性分布計算
答:沒有。相反,您可能希望使用回歸方法預測未來花像我們展示在最後的筆記本。
問:你使用考拉獲得聚集的機會嗎?
答:我們還沒有但它肯定會是一個選項來幫助一些更多的分布在的地方。
問:是什麼原因過濾分布
答:這是一個任意值,切斷了異常值的直方圖更難呈現。我們把模型中的異常值隻是阻止了他們這一可視化。
問:我們能拯救這些模型結果使用mlflow嗎?
答:當然。這是演示的博客。
問:我們如何驗證CLV的結果嗎?
答:您可以使用一個截止日期,或伸出,結束之前我們的數據集來訓練我們的模型,然後預測剩餘的數據點。在博客中,我們解決這個練習。
問:有沒有一種方法來評估這個模型的準確性?
答:最簡單的方法是驗證所有的模型假設,然後計算一組對抵抗MSE展示在博客。
問:我也遇到這樣的情況,擬合模型失敗因為數據集的分布?任何建議如何克服呢?
我遇到一些問題最新建造的一生聽起來與你描述的相似。注意我們顯式使用的筆記本的最後建立圖書館。
問:我們注意到明顯變化的顧客(店內和在線)購買行為。那麼如何建議在運行這些模型給定每2020年3月(covid)和2020年3月後期嗎?
這是一個很好的問題不僅僅和相關圖表。我們看到一個大轉折點,可能會改變基本與客戶的關係。beplay体育app下载地址購買模式已經從根本上轉變的方式我們還不完全了解,可能不理解,直到檢疫和衰退模式穩定。關鍵的拐點,從根本上改變消費者的行為每7 - 10年發生一次。
一種方法來回答這個是隔離檢疫期間客戶互動數據。這個模型的可靠性不會像長運行模型,但它反映了更多的電流波動。比較之前的數據分析CLV可能產生獨特的見解在關鍵消費者行為的變化。
如果你有一個足夠長的曆史,你也可以尋找其他的極端事件類似。在2008年的經濟衰退發生了什麼?你有其他消費如自然災害、大規模中斷,行為很混亂,以不同的方式返回。
問:是否可以說明客戶的特點融入BTYD模型?
答:BTYD模型來看,答案是否定的。生存模型中經常使用在合同情況下,Cox比例風險模型是一個受歡迎的選擇解釋為什麼客戶離開。beplay体育app下载地址
問:你在此用例中計算CLV的現有客戶,新客戶加入最近怎麼樣?beplay体育app下载地址
答:我們也包含它們。記住,這些模型的上下文中考慮個人的“信號”人口模式。考慮到這一點,他們可以讓新客戶一些相當相當大的飛躍(這樣他們看起來更像普通人群),直到更多的信息可以用來調整曲線的個人。beplay体育app下载地址
問:我們可以考慮添加分割特性從以前的筆記本功能工程CLV嗎?
答:當然。如果你知道你有不同的片段,您可以構建為每個單獨的模型。
問:對於圖表,我看到了你正在使用熊貓。你有建議當數據在內存中不適合嗎?
答:用於構建熊貓DF的數據集通常是非常大的。為此,我們使用火花。但是由此產生的數據集是一個記錄/客戶。對於許多組織來說,我們可以壓縮數據集到一個熊貓DF,這樣我們可以使用這些標準庫。記住,我們隻有幾個數字特征每項彙總的數據集是很光。如果是太大,我們可能會做更大的數據集的隨機樣本保持可控的。
問:RMSE分數這個模型的最佳方式嗎?
答:這是一個的方式。:-)你可以使用任何錯誤指標適用於你。美或日軍可能工作得很好。
問:在DL方法我們沒有估計保留部分?我們假設所有客戶將保持活躍。beplay体育app下载地址對吧?
答:在回歸技術,我們不是;真正解決保留這就是為什麼他們不是真正的CLV預測。這是通常被稱為另類的方法計算CLV但是我們需要認識到他們實際上做些不同的(並且仍然潛在有用)。
問:當使用keras你使用gpu集群啟用嗎?
答:我們沒有使用gpu在這裏,但是我們可以。
問:你有探索自回歸模型預測CLV的經驗嗎?
答:我們沒有,但它可能是值得探索。我們懷疑他們可能落入“花預測”陣營像我們的回歸模型,而不是CLV估計。
問:你有模型解釋能力構建到平台(世鵬科技電子,Dalex)Beplay体育安卓版本
這不是模型。它肯定將會是很有趣的探索,但我們根本沒有得到這個演示。
問:布萊恩剛剛提到的模式,分區並行數據和運行模型在這些分區,說這是常用於預測。你能請分享你寫的後續問題嗎?
答:當然。看看我們的博客”磚細粒的預測”。提供最直接的解釋模式。
問:你如何在這個建模過程包括購物頻道?
答:你可以段頻道。說,你可能想要探索如何處理客戶橫跨海峽的運作。beplay体育app下载地址
問:你有什麼好引用/來源學習更多關於加強一個組織集群實踐?
答:施普林格打開書”市場細分分析“是一個很好的閱讀。
問:有生之年包在python中使用最大似然估計估算最合適。你有試過使用貝葉斯方法使用pymc3 ?
答:我們還沒有可能有趣的探索如果它使更快或更準確的結果。
問:可以有把握地說,您充分展示了試圖獲取生成模型更新過程的實現往往解釋客戶行為嗎?例如一個伽馬過程?
有定製的模型歸納和在這方麵平衡個人和人口。請記住,我們不是在尋找一個完美的預測在個人的層麵,而是為未來投資,尋求可能的指導是正確的。
問:keras dataframe火花嗎?
答:我們並不了解。我們認為你必須通過熊貓/ numpy。