Daan Odijk, PhD candidate information retrieval legt voor het elfde DzԳٱԳٰ䲹é in drie minuten uit hoe search in elkaar zit, en gaat daarna uitgebreid in op semantisch zoeken.
2. DzԳٱԳٰ䲹é proudly presents: Zoekt
en gij zult vinden… toch?
door CHARLOTTE VAN OOSTRUM geplaatst op 13 MAART 2015
Toen Google in 2013 5 minuten offline was. daalde het aantal page views
op het internet met 40%. We navigeren het web via zoekmachines: elke
maand stellen we met z’n allen elke 60 seconden zo’n 2.66 miljoen vragen
aan Google’s ondoorgrondelijke algoritmes. Het is dus niet zo gek om te
denken dat navigatie- of interactieproblemen ook met search ‘opgelost’
kunnen worden. Als je argumenten nodig hebt om aan te tonen dat dit niet
werkt. lees dan dit artikel.
Maar wanneer werkt search dan wel en hoe weet je of een zoekmachine
goed functioneert? Hoe kun je input leveren voor implementatie? Wat is
semantisch zoeken. wat zijn de praktische mogelijkheden en hoe kun je dat
zo inzetten dat jouw bezoekers niet eens meer hóeven te zoeken?
De elfde editie van het DzԳٱԳٰ䲹é vindt plaats op woensdag 8 april om
19 uur Performance Solutions in Hoofddorp. We laten je graag verdwalen
en je weg terugvinden in de wereld van search. semantiek en algoritmes.
10. DzԳٱԳٰ䲹é proudly presents: Zoekt
en gij zult vinden… toch?
door CHARLOTTE VAN OOSTRUM geplaatst op 13 MAART 2015
Toen Google in 2013 5 minuten offline was. daalde het aantal page views
op het internet met 40%. We navigeren het web via zoekmachines: elke
maand stellen we met z’n allen elke 60 seconden zo’n 2.66 miljoen vragen
aan Google’s ondoorgrondelijke algoritmes. Het is dus niet zo gek om te
denken dat navigatie- of interactieproblemen ook met search ‘opgelost’
kunnen worden. Als je argumenten nodig hebt om aan te tonen dat dit niet
werkt. lees dan dit artikel.
Maar wanneer werkt search dan wel en hoe weet je of een zoekmachine
goed functioneert? Hoe kun je input leveren voor implementatie? Wat is
semantisch zoeken. wat zijn de praktische mogelijkheden en hoe kun je dat
zo inzetten dat jouw bezoekers niet eens meer hóeven te zoeken?
De elfde editie van het DzԳٱԳٰ䲹é vindt plaats op woensdag 8 april om
19 uur Performance Solutions in Hoofddorp. We laten je graag verdwalen
en je weg terugvinden in de wereld van search. semantiek en algoritmes.
48pt
18pt
24pt
! Zoek
13. Semantic search
• Improve search accuracy by understanding
searcher intent and the contextual meaning
of terms and documents.
• Move beyond “ten blue links” (towards
actually answering information needs) using
rich context.
14. Semantic search
• What is “semantic” search?
• understanding intent, contextual meaning
• finding actual answers for information needs
• combining text and structure
• “Entity-centric search”
• Entity: uniquely identifiable thing or object
• “A thing with a distinct and independent
existence”
17. Interplay: (un)structured data
Unstructured Structured
xxxx x xxx xx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxxx xx x xxx xx xxxx xx xxx
xx x xxxxx xxx xx x xxxx x xxx xx xxxxxx
xx x xxx xx x xxxx xx xxx x xxxxxx xx x
xxx xx xxxx xx xxx xx x xxxxx xxx xx x
xxxx x xxx xx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxxx xx x xxx xx xxxx xx xxx
xx x xxxxx xxx xx x xxxx x xxx xx
xxxx x xxx xx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxxx xxxxxx xx x xxx xx x xxxx
xx xxx x xxxxx xx x xxx xx xxxx xx xxx xx
x xxxxx xxx
xxxx x xxx xx xxxxxx
adding structure to text
adding text to structure
18. Entity Profiling
- Entity profiling
- generate a profile of an entity
- summary (keywords/full-text)
- timelines
- …
- Slot filling
- automatically fill attribute fields
27. Distribution of web search
queries [Pound et al. 2010]
6%
36%
1%5% 12%
41%
Entity (“1978 cj5 jeep”)
Type (“doctors in barcelona”)
Attribute (“zip code waterville Maine”)
Relation (“tom cruise katie holmes”)
Other (“nightlife in Barcelona”)
Uninterpretable
28. Query Understanding
• First step: recognize, label, and
disambiguate entities in queries
• add: attributes/aspects
• add: types
• add: relationships
• add: actions/verbs
• etc.
• Then: query understanding
• what is the intent?
30. Template-based query
understanding
• Rule-based approaches (editorial)
• high precision
• difficult to generalize
• costly to create/maintain
• Research into more generic approaches is ongoing
47. Want to learn more?
d.odijk@uva.nl / daan.odijk.me
Edgar Meij – @edgarmeij
Yahoo Labs
Krisztian Balog – @krisztianbalog
University of Stavanger
Daan Odijk – @dodijk
University of Amsterdam
Entity Linking and Retrieval
Edgar Meij – @edgarmeij
Yahoo! Research
Krisztian Balog – @krisztianbalog
University of Stavanger
Daan Odijk – @dodijk
University of Amsterdam
Monday, May 13, 13
Tutorial on Entity Linking and Retrieval
for Semantic Search
bit.ly/ELR-slides