ݺߣ

ݺߣShare a Scribd company logo
Sklik
Zdeněk Philipp
Reklama
Display teď ne
PPC Sklik
      podíl na trhu 1/3 a roste
      přímá konkurence
            Google AdWords
            Facebook Advertising
Historie
•   7.9.2006 (Jyxo)
•   podzim 2008 – analýza
•   13.3.2009 první ticket a první commit

•   5 programátorů
•   1 webmaster
•   1 produkťák
•   4 měsíce analýza
•   10 měsíců vývoje
•   2 měsíce testy
ʱá
Realita
dzčԴDz
•   28.2.2009 nasazeno

•   velmi živý vývoj do dnes
dzčԴDz
Kontext
Kontext
Kontext
Kontext
Hledání 
Hledání 
Jak funguje hledání?
Jak funguje hledání?
Provoz + HW
hledání 400 req/s
        4 master search (2 + 2 fyzicky)
        32 slave search (8 + 8 fyzicky)

kontext 400 req/s
        4 + 4 stroje fyzicky

databáze
       statistiky 8 + 8

generátory
       4 servery (fyzicky)

Web a další
       3 + 3 servery (fyzicky)

Hadoop clustery
      Skotch - statistiky 10x
      Skunk - kontext 10x
Technologie
Interní serverové technologie
C++, JAVA, Python
MySQL
Hadoop, HDFS, MapReduce, Cassandra, HIVE
Couchbase
Proprietální databáze
Google protobuffers
Lidé
3 vývojové týmy - 13 lidí (5 Brno, 8 Praha)
     - web (4)
     - hledání, statistiky (3)
     - kontext (4)

výzkum (2 Praha)
produkt (3 Praha)
provoz (4 Brno)
admins (5 Praha)
obchod (celá ČR)
Za poslední rok
Přepis hledání
Hadoop a NoSQL
Výzkum

Nová webovka
Kontext a partnerská síť
ʱáy
Nová webovka AJAX (FastRPC)
Zacílení na umístění
Zvyšování relevance
Zvyšování výkonosti
      výzkum, výzkum, výzkum
      studie jiných zdrojů
             Google
             Yahoo
             Microsoft
             Yandex
Statistiky a nové metriky měření
SLOC Count
Total Physical Source Lines of Code          = 446 406
Development Effort Estimate, Person-Months= 121,13
Estimated Average Number of Developers       = 36,54
Total Estimated Cost to Develop       = $ 16 362 820
SLOC Count
Total Physical Source Lines of Code                  = 446 406
Development Effort Estimate, Person-Months           = 121,13
Estimated Average Number of Developers               = 36,54
Total Estimated Cost to Develop              = $ 16 362 820
Dotazy?
Sklik - Reklama nejen ve vyhledávání

More Related Content

Sklik - Reklama nejen ve vyhledávání

Editor's Notes

  1. Mel bych se predstavit! Skoncil jsem u nejzajimavejsiho, takze reklama
  2. Prezentace bude o PPC, nikoliv o Display reklame Je tady nekdo, kdo nevi, co to je PPC? Kdo vi co to je PPC? Takze uplne obecne o Skliku Jsme jeden z nejvetsich reklamnich systemu, ktery je je mozne v cr pouzivat verejne Ona reklama neni jen to nutne zlo, ktere si vetsinou vypnete pres adblock, ale Nekdy I poskytuje obsah a mnohdy lepsi nez cekate
  3. Slajd z Yandexu, vubec jsme nevedeli, co nas ceka
  4. Po 10-ti mesicich vyvoje se nam povedlo, s durazem na termin o den drive system nasadit.
  5. Nazazeno z 27 na 28 unora 2009, jeden den k dobru. Koncila nam smlouva s Jyxem.
  6. Za 3 roky se system uplne zmenil 2x jsme predelali kontext Vymenili jsme nektere technologie. Spoustu veci jsme museli zrychlit Je videt, ze je sklik rozdelen do 4 ucelynych casti Vydej Statistiky Generatory Web Kontext
  7. Neco o kontextu. Cilime inzeraty podle url ….
  8. V rychlosti co se vlastne deje v kontextu Reklama kontextove spojena se strankou, na ktere se vydava. Cely proces je podstatne slozitejsi, hlavne do nej vstupuje daleko vice externich informaci Vysledek je sada inzeratu, ktere maji potencial se na strance zobrazit
  9. Takle nejak se to pak dostane ven Pokud stranku nezname, stahneme ji, zpracujeme a po indexaci se znova dostane do vydejove databaze To je ke kontextu vsechno a ted hledani
  10. Hledani Cilime inzeraty podle hledane fraze uzivatele. Nekdy se nam to moc nedari fulltext je lepsi 
  11. Nekdy fulltext vubec nepotrebujete. Ale v podstate spolu porad soutezime Klienti v sestavach mezi sebou soutezi v aukci, a jak je videt komercni fraze umime pekne. Ty vetsinou byvaji dobre obsazene. Jen pro zajimavost nejdrazsi slovo v systemu je
  12. Vydej vysledku v hledani je velice podobna fulltextu V podstate se jedna o fulltextove vyhledavani s nekterymi specialitami Skliku. Protoze jde o hledani, je narocnost vetsi nez u kontextu, kde jsou inzeraty uz pripravene a pouze se vydaji. V hledani se pocet frazi blizi skoro nekonecnu, takze se vysledky nedaji predpocitavat A musi se zpracovat fraze neco najit to neco se musi projit protridit pripadne vyhazet vypocitat pro to relevance seradit a vydat Kroku je podstatne vice nez v kontextu. Cele to resi asyngronne
  13. Vydej vysledku v hledani je velice podobna fulltextu V podstate se jedna o fulltextove vyhledavani s nekterymi specialitami Skliku. Protoze jde o hledani, je narocnost vetsi nez u kontextu, kde jsou inzeraty uz pripravene a pouze se vydaji. V hledani se pocet frazi blizi skoro nekonecnu, takze se vysledky nedaji predpocitavat A musi se zpracovat fraze neco najit to neco se musi projit protridit pripadne vyhazet vypocitat pro to relevance seradit a vydat Kroku je podstatne vice nez v kontextu. Cele to resi asyngronne, mame na to master a slave searche
  14. Sluzby si vetsinou resi svuj vlastni provoz, my musime resit provoz vsech zluzeb dohromady 80% z hledfanio je fulltext Kontext a partnerska sit je stejne velky jako hledani, v poctech requestu / s
  15. Hlavně říct neco o tom, jak se pereme s Javou a ze ji moc nedoporucujeme na vysoce vytizene sluzby s garantovanou dostupnosti. Jsme domluveni s administratory, ze tam kde jde hlavne o dostupnost, java nebude, budeme hledat jina reseni. Chova se to nevyspitatelne.
  16. Vsechno je to jen o lidech
  17. Prepis hledani, hlavne zrychleni a priprava na nove reseni relevance pomoci regresnich stromu. Hlavne technologicka vymena
  18. Hlavne vyzkum se zamerenim na lepsi cileni a zlepsovani relevance Malo lidi, hodne prace Statistiky a redesign Hodne ficur pro inzerenty pocinaje novou webovkou
  19. Mame GIT
  20. Vlastne dnes uz mame hotove to, co by melo byt hotove az zitra