DPG如何提供高質量和有價段廣告商

這是一個客人由巴特·德爾·皮耶羅撰寫文章,數據科學家,DPG媒體。

在活動的開始,營銷人員和出版商通常會有一個假設目標細分市場將是一個怎樣的人,但是一旦開始運動,它可以是非常困難的,看誰反應,抽象的一段基於不同的品質不同的受訪者,然後調整針對基於這些段及時。然而,機器學習,可以讓它可以篩選大量的被調查者和non-respondent觀眾數據實時自動創建非常相像的觀眾特定商品或服務的廣告,增加廣告投資回報率(和價格出版商可以收取他們的廣告庫存仍為客戶增加價值)。

在有針對性的廣告空間DPG媒體,我們試圖找到新的方法來最好的廣告客戶交付高質量和有價段。優化營銷活動的一個方法是通過使用“低上市時間”瘋高價值點擊器,展示他們的廣告作為改進的協議。

這將需要建立一個係統,允許我們訓練一個分類模型,在競選中“學習”一生中基於數據的連續紙(主要通過日常批次),導致在日常更新和改進目標受眾為多個營銷和廣告活動。這種邏輯可以顯示如下:

係統創建的圖片模型優化的營銷和廣告活動。

這將導致兩個主要問題:

  1. 我們可以創建一個圖片模型隨著時間的推移,學習活動click-behaviour嗎?
  2. 整個設置可以順利運行和低運行時最大化收入嗎?

為了回答這些問題,這篇文章著重於磚內的兩種技術環境:Hyperopt PandasUDF。

Hyperopt

簡而言之,Hyperopt允許我們快速培訓和適應多個跨多個執行者sklearn-models hyperparameter調優和可以搜索最優配置基於先前的評估。當我們試著適應多個模型/運動,多運動,這使我們能夠迅速獲得最佳hyperparameter配置,導致最好的損失,在很短的時間內(如:約14分鍾預處理和優化一個隨機森林和24個評價和parallelism-parameter 16)。重要的是,我們的標簽是傾向於點擊(即。概率),而不是一個遙控器(類)。之後,最低的模型損失(定義為- Precision-Recall的AUC),寫入MLflow。這個過程是完成一周一次或者運動剛剛開始,我們得到更多的數據,具體活動與前一天相比。

Hyperparameter調優與HyperOpt MLflow。

PandasUDF

我們有我們的模型後,我們想對所有遊客得出結論的網站在過去的30天。要做到這一點,我們查詢最新的、最好的模型從MLflow和廣播這執行人。因為我們想要的數據集分數是相當大的,我們分發n-partitions,讓每個執行者分數不同的分區;這是通過利用PandasUDF-logic。收集到的概率得到回到司機,和用戶從最低點擊傾向獲得排名,最高點擊傾向:

利用與MLflow PandasUDF-logic評分用戶根據他們傾向於點擊。
利用與MLflow PandasUDF-logic評分用戶根據他們傾向於點擊。

這後,我們選擇一個閾值基於體積與質量(這是一個業務驅動的選擇取決於我們有多少廣告空間對於一個給定的運動)和為它創建一個段(DMP)的數據管理平台。Beplay体育安卓版本

結論

簡而言之,我們可以總結整個過程如下

過程用於構建和得分的圖片模型MLflow基於他們的傾向與市場營銷或廣告宣傳活動。

整個過程運行每運動一個小時左右,如果我們重新培訓模型。如果不是這樣,每天大約需要30分鍾加載並取得新的觀眾。我們的目標是保持盡可能低運行時我們可以占更多的活動。這些觀眾的質量而言,他們可以差別很大,畢竟,沒有免費的午餐在機器學習。

沒有許多轉換的新活動,我們看到了模型改進時,更多的數據被聚集在日常批次和我們的估計是越來越好。例如,對於一個隨機活動地點:

  • 意思是:平均每日hyperopt-run Precision-Recall AUC的評估
  • 馬克斯:最高Precision-Recall AUC日常hyperopt-run內的一個評估
  • 分鍾:最低在日常hyperopt-run Precision-Recall AUC的評價
  • 聖Dev:標準差內每日hyperopt-run Precision-Recall AUC的評估

新活動沒有多少轉換,我們看到的圖片模型改善當更多的數據聚集在日常批次。

的AUC precision-recall之外,對於廣告商來說,最重要的指標是點擊率。我們測試這個模型有兩個廣告,相比正常流失網絡活動。這產生了以下結果:

廣告點擊結果活動圖片建模使用MLflow和HyperOpt進行優化。

當然,正如天下沒有免費的午餐,重要的是要意識到,沒有單一的質量指標在運動和評估必須基於campaign-per-campaign完成。

了解更多關於如何領先品牌和廣告機構,康泰納仕和陽獅集團等,使用磚營銷驅動性能

免費試著磚 開始

報名

Baidu
map