際際滷

際際滷Share a Scribd company logo
Machine Learning
w reklamie RTB
Bartomiej Twardowski
DSS2017 - Machine Learning w reklamie RTB
店r坦do: http://chiefmartec.com/2016/03/marketing-technology-landscape-supergraphic-2016/
2016
Wersja uproszczona
http://www.slideshare.net/PerfectMarket/simplifying-the-display-ad-lumascape-11142384
@btwardow
Real-Time Bidding
Yuan, Y., Wang, F., Li, J., & Qin, R. (2014). A survey on real time bidding advertising. Proceedings of 2014 IEEE
International Conference on Service Operations and Logistics, and Informatics, SOLI 2014, 418423. http://doi.org/
10.1109/SOLI.2014.6960761
@btwardow
Cel
 Reklama bardziej relewantna i przynoszca wicej
zysk坦w - bierzemy udzia w aukcji tylko wtedy kiedy
wiemy, 甜e u甜ytkownik jest zainteresowany ofert
 Lepsze wykorzystanie rodk坦w reklamodawc坦w -
ten sam bud甜et mo甜e przynie wicej konwersji
Aby uzyska powy甜sze cele musimy wykorzysta
algorytmy z predykcj oraz optymalizacj celu
reklamodawcy
@btwardow
CPM, CPC, CPL, - co to
takiego?
 CPM - Cost Per Mile (1000) wywietle
 CPC - Cost Per Click
 CPL - Cost Per Lead (Acquisition, Conversion)
 
Wszystkie aukcje wysane do AdX s w
cenach CPM!
Modelowanie pod
wybrane cele w RTB
@btwardow
Jakie dane s
wykorzystywane
 Dane Historyczne
 Bid Requests - informacje wysane przez SSP/AdX do DSP
 Wywietlenia reklamy
 Kliki
 Wywietlenia stron przez u甜ytkownika (Tracking Points)
 inne (zdarzenia js, crawling of鍖ine,)
 Utrzymywane online
 Cookie Pro鍖les - pro鍖le u甜ytkownika
@btwardow
Informacje w Bid Request
 CookieId
 URL
 IP (a wic te甜. Country, City z bazy geolokalizacyjnej)
 IAB Category
 UA, Mobile App Id
 Slot Size (np. 180x150)
 Slot Position (np. above the fold)
 .
@btwardow
Co jest Big Data?
 bid request
 wywietlenia
 kliki
 odwiedziny stron
 inne zdarzenia u甜ytkownika (widzialno, video,
)
@btwardow
Pro鍖le U甜ytkownika
Otrzymane na podstawie dziaa u甜ytkownik坦w
Przykadowe dane:
odwiedzone domeny/TP
kraj, urzdzenie, rozmiar ekranu
w jakie reklamy ostatnio klika
kategorie IAB
dane z DMP + segmentacje
oraz wiele innych
G坦wne 添r坦do personalizacji przy aukcji online
Z wzgld坦w prawnych mog nastpowa pewne ograniczenia w wykorzystywaniu danych
Przykad: CPC
@btwardow
Model predykcji kliku
 p(Click|Imp)
 Wykorzystanie regresji logistycznej do predykcji
 atwa w zrozumieniu i ew. szukaniu bd坦w
 szybka metoda (mamy tylko par ms na obliczenia)
@btwardow
 >1M cech dla ka甜dej obserwacji
 wikszo to cechy typu one-hot encoded
 modelowanie interakcji, np: client x domena
 bardzo szybka predykcja online: cechy binarne + od鍖ltrowane do
najistotniejszych (~50K) + mao aktywnych dla konkretnej aukcji
 regularyzacja L1 do 鍖ltrowania cech:
 pozwala na utrzymanie odpowiedniego poziomu ewaluacji czasu
modelu
Dlaczego regularyzacja L1?
@btwardow
Sampling & The hashing
trick
 Sampling
 podejcie brute-force nie przejdzie
 odpowiednie pr坦bkowanie jest rozwizaniem ( + korekta wyrazu wolnego)
 zbiory przykad坦w neg/pos silnie niezbalansowane
 The hashing trick
 wszystkie cechy kodujemy do 2^N bitowej przestrzeni (w wikszoci N
<32 i tyle maksymalnie bdziemy mie wag)
 szybkie obliczanie on-line (liczba cech x hash() x mno甜enie wag)
 Inne warte uwagi: decision tree encoding [5], embedding [1, 2]
@btwardow
Follow the regularized
leader (FTRL) [6]
 online machine learning
 przykadowy kod dla wersji FTRL-Proximal:
 python: https://www.kaggle.com/jiweiliu/ftrl-
starter-code
 go (concurrent, l1&l2): https://gist.github.com/
ceshine/f7f93046c58fe6ee840b
@btwardow
Przykad obliczenia
prawdopodobiestwa kliku
Otrzymujemy zapytanie:
Cookie 3000657545365 is at www.gazeta.pl
Jakie jest prawdopodobiestwo kliku reklamy iPhone 7?
Wpyw cechy (+ - pozytywny, - - negatywny)
URL: www.gazeta.pl (+)
Position 1  visible without scrolling (+)
Banner size 930x180 (+)
Screen size 1920x1080 (+)
Cookie has visited these domains:
apple.com(+)
macrumors.com(+)
plotek.pl (+)
t-mobile.com(+)
samsung.com(-)
Bierzemy pod uwag wszystkie cechy dla kt坦rych mamy
niezerowe wagi w modeli i obliczamy prawdopodobiestwo.
@btwardow
Cena aukcji - CPM
 Reklamodawca podaj cen docelow (lub maksymaln) CPC dla
kampanii
 Model predykcji kliku umo甜liwia przejcie z ceny CPC do CPM dla
pojedynczej aukcji
 Sprawdzenie czy model jest poprawnie skalibrowany:
 samo patrzenie na AUC/RIG nie wystarczy
bidpriceCP M = p(click)  targetCP C
CPCeffective =
P
win price
total clicks

P
bid price
P
p(click)
= targetCP C
@btwardow
Inne przykady optymalizacji
 Inne cele: CPL, NBC, CPE,
 Np. dla CPL w wersji gdzie konwersja nastpuje po
kliku budujemy 2 modele: dla p(click|impr) oraz
p(lead|click)
@btwardow
ML w innych aspektach
 DSP: Forecasting, Bid Landscape, Bidding
Strategy Optimizations, traf鍖c 鍖ltering, fraud &
anomaly detection
 DMP: look-a-like algorithms
 SSP side <> DSP
@btwardow
ML w RTB
trendy i co warto obserwowa
 wiele wsp坦lnego z systemami rekomendacji => modele
bazujce na faktoryzacji - FM/FFM [4] (to ju甜 ma par lat)
 deep learning: embedding ( [1] Enno @Adform, [2] Meta-
Prod2Vec), maria甜 - wide& deep [3], users sessions
modeling [7]
 Watch: https://github.com/wnzhang/rtb-papers
 Inspiracje z konkurs坦w typu Kaggle (niestety w
wikszoci nie do zaaplikowania, np. bazujce na
odnalezionym przecieku)
Bartomiej Twardowski
@btwardow
Dzikuj za uwag.
http://site.adform.com/company/about/
@btwardow
Reference
[1] Shioji, E. and Arai, M., 2017. Neural Feature Embedding for User Response Prediction in Real-Time Bidding
(RTB). arXiv preprint arXiv:1702.00855.
[2] Conneau, A., Smirnova, E., & Vasile, F. (2016). Meta-Prod2Vec - Product Embeddings Using Side-Information
for Recommendation. RecSys.
[3] Cheng, H.T., Koc, L., Harmsen, J., Shaked, T., Chandra, T., Aradhye, H., Anderson, G., Corrado, G., Chai,
W., Ispir, M. and Anil, R., 2016, September. Wide & deep learning for recommender systems. In Proceedings of
the 1st Workshop on Deep Learning for Recommender Systems (pp. 7-10). ACM.
[4] Juan, Y., & Lin, C. (2016). Field-aware Factorization Machines for CTR Prediction. RecSys. http://doi.org/
10.1145/2959100.2959134
[5] He, X., Bowers, S., Candela, J. Q., Pan, J., Jin, O., Xu, T.,  Herbrich, R. (2014). Practical Lessons from
Predicting Clicks on Ads at Facebook. Proceedings of 20th ACM SIGKDD Conference on Knowledge Discovery
and Data Mining - ADKDD14, 19. http://doi.org/10.1145/2648584.2648589
[6] McMahan, H. B., Holt, G., Sculley, D., Young, M., Ebner, D., Grady, J.,  Kubica, J. (2013). Ad click
prediction: a view from the trenches. Proceedings of the 19th ACM SIGKDD International Conference on
Knowledge Discovery and Data Mining, 12221230. http://doi.org/10.1145/2487575.2488200
[7] Bartomiej Twardowski. 2016. Modelling Contextual Information in Session-Aware Recommender Systems
with Neural Networks.10th ACM Conference on Recommender Systems (RecSys '16). ACM, DOI: https://doi.org/
10.1145/2959100.2959162

More Related Content

DSS2017 - Machine Learning w reklamie RTB

  • 1. Machine Learning w reklamie RTB Bartomiej Twardowski
  • 5. @btwardow Real-Time Bidding Yuan, Y., Wang, F., Li, J., & Qin, R. (2014). A survey on real time bidding advertising. Proceedings of 2014 IEEE International Conference on Service Operations and Logistics, and Informatics, SOLI 2014, 418423. http://doi.org/ 10.1109/SOLI.2014.6960761
  • 6. @btwardow Cel Reklama bardziej relewantna i przynoszca wicej zysk坦w - bierzemy udzia w aukcji tylko wtedy kiedy wiemy, 甜e u甜ytkownik jest zainteresowany ofert Lepsze wykorzystanie rodk坦w reklamodawc坦w - ten sam bud甜et mo甜e przynie wicej konwersji Aby uzyska powy甜sze cele musimy wykorzysta algorytmy z predykcj oraz optymalizacj celu reklamodawcy
  • 7. @btwardow CPM, CPC, CPL, - co to takiego? CPM - Cost Per Mile (1000) wywietle CPC - Cost Per Click CPL - Cost Per Lead (Acquisition, Conversion) Wszystkie aukcje wysane do AdX s w cenach CPM!
  • 9. @btwardow Jakie dane s wykorzystywane Dane Historyczne Bid Requests - informacje wysane przez SSP/AdX do DSP Wywietlenia reklamy Kliki Wywietlenia stron przez u甜ytkownika (Tracking Points) inne (zdarzenia js, crawling of鍖ine,) Utrzymywane online Cookie Pro鍖les - pro鍖le u甜ytkownika
  • 10. @btwardow Informacje w Bid Request CookieId URL IP (a wic te甜. Country, City z bazy geolokalizacyjnej) IAB Category UA, Mobile App Id Slot Size (np. 180x150) Slot Position (np. above the fold) .
  • 11. @btwardow Co jest Big Data? bid request wywietlenia kliki odwiedziny stron inne zdarzenia u甜ytkownika (widzialno, video, )
  • 12. @btwardow Pro鍖le U甜ytkownika Otrzymane na podstawie dziaa u甜ytkownik坦w Przykadowe dane: odwiedzone domeny/TP kraj, urzdzenie, rozmiar ekranu w jakie reklamy ostatnio klika kategorie IAB dane z DMP + segmentacje oraz wiele innych G坦wne 添r坦do personalizacji przy aukcji online Z wzgld坦w prawnych mog nastpowa pewne ograniczenia w wykorzystywaniu danych
  • 14. @btwardow Model predykcji kliku p(Click|Imp) Wykorzystanie regresji logistycznej do predykcji atwa w zrozumieniu i ew. szukaniu bd坦w szybka metoda (mamy tylko par ms na obliczenia)
  • 15. @btwardow >1M cech dla ka甜dej obserwacji wikszo to cechy typu one-hot encoded modelowanie interakcji, np: client x domena bardzo szybka predykcja online: cechy binarne + od鍖ltrowane do najistotniejszych (~50K) + mao aktywnych dla konkretnej aukcji regularyzacja L1 do 鍖ltrowania cech: pozwala na utrzymanie odpowiedniego poziomu ewaluacji czasu modelu Dlaczego regularyzacja L1?
  • 16. @btwardow Sampling & The hashing trick Sampling podejcie brute-force nie przejdzie odpowiednie pr坦bkowanie jest rozwizaniem ( + korekta wyrazu wolnego) zbiory przykad坦w neg/pos silnie niezbalansowane The hashing trick wszystkie cechy kodujemy do 2^N bitowej przestrzeni (w wikszoci N <32 i tyle maksymalnie bdziemy mie wag) szybkie obliczanie on-line (liczba cech x hash() x mno甜enie wag) Inne warte uwagi: decision tree encoding [5], embedding [1, 2]
  • 17. @btwardow Follow the regularized leader (FTRL) [6] online machine learning przykadowy kod dla wersji FTRL-Proximal: python: https://www.kaggle.com/jiweiliu/ftrl- starter-code go (concurrent, l1&l2): https://gist.github.com/ ceshine/f7f93046c58fe6ee840b
  • 18. @btwardow Przykad obliczenia prawdopodobiestwa kliku Otrzymujemy zapytanie: Cookie 3000657545365 is at www.gazeta.pl Jakie jest prawdopodobiestwo kliku reklamy iPhone 7? Wpyw cechy (+ - pozytywny, - - negatywny) URL: www.gazeta.pl (+) Position 1 visible without scrolling (+) Banner size 930x180 (+) Screen size 1920x1080 (+) Cookie has visited these domains: apple.com(+) macrumors.com(+) plotek.pl (+) t-mobile.com(+) samsung.com(-) Bierzemy pod uwag wszystkie cechy dla kt坦rych mamy niezerowe wagi w modeli i obliczamy prawdopodobiestwo.
  • 19. @btwardow Cena aukcji - CPM Reklamodawca podaj cen docelow (lub maksymaln) CPC dla kampanii Model predykcji kliku umo甜liwia przejcie z ceny CPC do CPM dla pojedynczej aukcji Sprawdzenie czy model jest poprawnie skalibrowany: samo patrzenie na AUC/RIG nie wystarczy bidpriceCP M = p(click) targetCP C CPCeffective = P win price total clicks P bid price P p(click) = targetCP C
  • 20. @btwardow Inne przykady optymalizacji Inne cele: CPL, NBC, CPE, Np. dla CPL w wersji gdzie konwersja nastpuje po kliku budujemy 2 modele: dla p(click|impr) oraz p(lead|click)
  • 21. @btwardow ML w innych aspektach DSP: Forecasting, Bid Landscape, Bidding Strategy Optimizations, traf鍖c 鍖ltering, fraud & anomaly detection DMP: look-a-like algorithms SSP side <> DSP
  • 22. @btwardow ML w RTB trendy i co warto obserwowa wiele wsp坦lnego z systemami rekomendacji => modele bazujce na faktoryzacji - FM/FFM [4] (to ju甜 ma par lat) deep learning: embedding ( [1] Enno @Adform, [2] Meta- Prod2Vec), maria甜 - wide& deep [3], users sessions modeling [7] Watch: https://github.com/wnzhang/rtb-papers Inspiracje z konkurs坦w typu Kaggle (niestety w wikszoci nie do zaaplikowania, np. bazujce na odnalezionym przecieku)
  • 23. Bartomiej Twardowski @btwardow Dzikuj za uwag. http://site.adform.com/company/about/
  • 24. @btwardow Reference [1] Shioji, E. and Arai, M., 2017. Neural Feature Embedding for User Response Prediction in Real-Time Bidding (RTB). arXiv preprint arXiv:1702.00855. [2] Conneau, A., Smirnova, E., & Vasile, F. (2016). Meta-Prod2Vec - Product Embeddings Using Side-Information for Recommendation. RecSys. [3] Cheng, H.T., Koc, L., Harmsen, J., Shaked, T., Chandra, T., Aradhye, H., Anderson, G., Corrado, G., Chai, W., Ispir, M. and Anil, R., 2016, September. Wide & deep learning for recommender systems. In Proceedings of the 1st Workshop on Deep Learning for Recommender Systems (pp. 7-10). ACM. [4] Juan, Y., & Lin, C. (2016). Field-aware Factorization Machines for CTR Prediction. RecSys. http://doi.org/ 10.1145/2959100.2959134 [5] He, X., Bowers, S., Candela, J. Q., Pan, J., Jin, O., Xu, T., Herbrich, R. (2014). Practical Lessons from Predicting Clicks on Ads at Facebook. Proceedings of 20th ACM SIGKDD Conference on Knowledge Discovery and Data Mining - ADKDD14, 19. http://doi.org/10.1145/2648584.2648589 [6] McMahan, H. B., Holt, G., Sculley, D., Young, M., Ebner, D., Grady, J., Kubica, J. (2013). Ad click prediction: a view from the trenches. Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 12221230. http://doi.org/10.1145/2487575.2488200 [7] Bartomiej Twardowski. 2016. Modelling Contextual Information in Session-Aware Recommender Systems with Neural Networks.10th ACM Conference on Recommender Systems (RecSys '16). ACM, DOI: https://doi.org/ 10.1145/2959100.2959162