際際滷

際際滷Share a Scribd company logo
SeznamBot a Kanonizace
Martin Kirschner
Product manager senior
 Jak funguje vyhled叩v叩n鱈 a SeznamBot
 Co je to kanonizace teoreticky i prakticky
 Jak辿 funknosti brzy nasad鱈me
 Triko?
Ptejte se kdykoliv v pr哲bhu, j叩 to budu dlat taky tak
Co si dnes odnesete
 Pr哲b転n辿 ot叩zky
 Ka転d箪 si po鱈t叩 s叩m
 Pls. no black hat ;)
Kv鱈z o drobnou cenu
Intro do vyhled叩v叩n鱈
 Dokument
 Content
 Refresh
 Normalizace URL
 Crawl budget
Terminologie
 Dokument ~ z叩znam k URL v datab叩zi
 Content ~ sta転en箪 obsah URL
 Refresh ~ aktualizace obsahu a stavu URL
 Normalizace URL
 Crawl budget
Terminologie
Co je to normalizace URL?
 Dokument ~ webov叩 str叩nka
 Content ~ sta転en箪 obsah URL
 Refresh ~ aktualizace obsahu a stavu URL
 Normalizace URL ~ transformace URL do norm叩ln鱈ho tvaru
bez ztr叩ty informace
 Crawl budget
Terminologie
Co je to crawl budget?
 Dokument ~ webov叩 str叩nka
 Content ~ sta転en箪 obsah URL
 Refresh ~ aktualizace obsahu a stavu URL
 Normalizace URL ~ transformace URL do norm叩ln鱈ho tvaru
bez ztr叩ty informace
 Crawl budget ~ pr哲nik URL, kter辿 robot chce a
m哲転e st叩hnout z webu
Terminologie
Crawl budget
Crawl
rate
Crawl
demand
Crawl budget
Slu転by hled叩n鱈 na internetu
Sch辿ma vyhled叩v叩n鱈 pirozen箪ch v箪sledk哲
Zdroj: https://blog.seznam.cz/technologie-fulltextu/
Na kolika r哲zn箪ch URL na internetu
lze dostat content?
Kolika URL robot pravideln
aktualizuje obsah?
Na kolika fyzick箪ch serverech b転鱈
datab叩ze a v箪poty robota?
Kolik dokument哲 v esk辿m jazyce je
v indexu vyhled叩vae Seznam.cz?
Kanonizace
Zdroj: https://www.youtube.com/user/DusanJanovsky (24. 6. 2011 !!!)
Kanonizace obecn
Co je 炭kolem kanonizace?
Kanonizace je transformace
technick辿 struktury webu
do podoby, jak ji vid鱈 lovk.
SeznamBot
Co je to kanonizace podle SeznamBota
Z叩mr
Realizace
na webu
V DB
robota
Kanonick叩
podoba
Kanonick叩 mno転ina je
webov叩 str叩nka
z pohledu lovka.
SeznamBot
Normalizace URL
Kanonizace stejn辿ho obsahu
Kanonizace rozd鱈ln辿ho obsahu
Jak辿 kanonizace SeznamBot rozli邸uje
Normalizace URL
 Transformace URL bez ztr叩ty informace
 Slouen鱈 technicky stejn箪ch URL
Normalizace URL je
Normalizace URL
Kanonizace stejn辿ho obsahu
Kanonizace rozd鱈ln辿ho obsahu
Jak辿 kanonizace SeznamBot rozli邸uje
Kanonizace
stejn辿ho obsahu
Stejn箪 obsah maj鱈 v邸echny URL,
pes kter辿 se dostanu
na stejnou str叩nku.
B転n箪 lovk
Jak箪 je rozd鱈l mezi kanonizac鱈 a
normalizac鱈?
Kontroln鱈 ot叩zka
 Kanonizace i normalizace shlukuj鱈 URL
 Normalizace: Technicky stejn叩 URL
 Kanonizace: Lidsky stejn叩 str叩nka
Rozd鱈l mezi kanonizac鱈 a normalizac鱈
 Kanonizace i normalizace shlukuj鱈 URL
 Normalizace: Technicky stejn叩 str叩nka
 Kanonizace: Lidsky stejn叩 str叩nka
 nap. pesmrov叩n鱈 a jeho c鱈l
Rozd鱈l mezi kanonizac鱈 a normalizac鱈
Ve kter箪ch bublink叩ch se odehr叩v叩
kanonizace stejn辿ho obsahu?
Sch辿ma vyhled叩v叩n鱈 pirozen箪ch v箪sledk哲
Zdroj: https://blog.seznam.cz/technologie-fulltextu/
Kanonizaci stejn辿ho obsahu prov叩d鱈 robot
Zdroj: https://blog.seznam.cz/technologie-fulltextu/
M哲転e m鱈t kanonizace vliv
na crawl budget?
 Pesmrov叩n鱈 1:1, Hashbang, ignorovan箪 parametr
 Sta鱈 ovit mal箪 sample URL
 Sn鱈転en鱈 crawl demand slo転ky crawl budgetu
Pravidlov叩 kanonizace stejn辿ho obsahu
 V邸echny n叩sleduj鱈c鱈 URL spadnou do stejn辿 kanonick辿 mno転iny
1. http://zbozi.cz/.../?razeni=nejlevnejsi&_escaped_fragment_=
2. https://www.zbozi.cz/.../
3. http://www.zbozi.cz/.../?razeni=nejlevnejsi
4. https://www.zbozi.cz/.../?_escaped_fragment_=
 Robot bude aktualizovat jen . 4
 Ve v箪sledc鱈ch se zobraz鱈 jen . 2
P鱈klad kanonizace URL na Zbo転鱈.cz
 Na Zbo転鱈.cz v testu u邸eteno 80 % crawl demand
 astj邸鱈 refresh a vt邸鱈 zastoupen鱈 dokument哲
 Na vt邸in velk箪ch web哲 lze pomoc鱈 pravidel sn鱈転it CD.
Pravidlov叩 kanonizace m叩 v箪znamn箪 efekt
 Indexace podle kanonick箪ch mno転in
 Pravidlov叩 kanonizace do Seznam Webmastera
 Automatick叩 detekce kanonizan鱈ch pravidel
 Ad-hoc kanonizace stejn辿ho obsahu
Dal邸鱈 pl叩ny s kanonizac鱈 stejn辿ho obsahu
 Pesmrov叩n鱈 kv哲li zmn URL  nap. titulek v URL
 Kanonick箪 link  nap. z m.novinky.cz na novinky.cz
 Kanonizuj鱈c鱈 vs. nekanonizuj鱈c鱈 pesmrov叩n鱈
Ad-hoc kanonizace stejn辿ho obsahu
Normalizace URL
Kanonizace stejn辿ho obsahu
Kanonizace rozd鱈ln辿ho obsahu
Jak辿 kanonizace SeznamBot rozli邸uje
Kanonizace
rozd鱈ln辿ho obsahu
SeznamBot a Kanonizace pro SEOloger 18.4.2018
SeznamBot a Kanonizace pro SEOloger 18.4.2018
Pozn叩mky na z叩vr
 Manu叩ln鱈 pravidlov叩 kanonizace stejn辿ho obsahu
 Interpretace str叩nky pro hled叩n鱈 zpravodajstv鱈
 Zlep邸en鱈 funkce v箪bru str叩nek do datab叩ze
Teaser: co v bl鱈zk辿 dob pl叩nujeme nasadit
 Jak funguje hled叩n鱈 pirozen箪ch v箪sledk哲
 Co je to kanonizace obecn
 Jak dl叩 kanonizaci vyhled叩v叩n鱈 Seznam.cz
 Co v bl鱈zk辿 dob nasad鱈me
Co jsem se sna転il sdlit
Kdo vyhr叩l v 一厩鱈噛顎?
 Hled叩me produk泥叩ka
 Hled叩me Java v箪voj叩e
 Pokud o nkom v鱈te, napi邸te mi!
 Slibovan辿 vci budou rycheji dodan辿!
Poj s n叩mi rozv鱈jet SeznamBota!
Martin Kirschner
Product manager senior
E-mail: martin.kirschner@firma.seznam.cz
Twitter: @svXaverius, @SeznamBot, @hledani_seznam
Kontakt

More Related Content

SeznamBot a Kanonizace pro SEOloger 18.4.2018