Seznam.cz crawler SeznamBot pro vybrané stránky nově interpretuje javascript. Přednáška popíše technické aspekty řešení a představí další plánovaná vylepšení v získávání stránek z internetu.
1 of 21
Download to read offline
More Related Content
SeznamBot a renderování stránek - 30.3.2019 COE2019
15. Dopady na crawl budget
• Aktuální objem renderu: asi 100 tis. URL denně
• Jeden render vyžaduje průměrně desítky requestů
• Všechny requesty shapujeme
Bezpečnost a správný render je těžký.
Crawl budget bude těžší.