際際滷

際際滷Share a Scribd company logo
Tha	
 ?Anatomy	
 ?of	
 ?a	
 ?Large-?\Scale	
 ?
Social	
 ?Search	
 ?Engine,	
 ?www2010	
                               	
 ?
?? Damon	
 ?Horowitz,	
 ?Sepandar	
 ?D.	
 ?Kamvar	
 ?
?? The	
 ?Anatomy	
 ?of	
 ?a	
 ?Large-?\Scale	
 ?Social	
 ?Search	
 ?
   Engine	
 ?
?? WWW	
 ?2010	
 ?

?? Aardvark	
 ?           QA                              	
 ?
?? web                                            	
 ?
?? QA              	
 ?
??                        	
 ?
??
                                 	
 ?
??
            	
 ?

?? Google
??       	
 ?Aardvark	
 ?                               ??          :	
 ?Google	
 ?
??                                 	
 ?                 ??                                 	
 ?
??                          	
 ?                        ??
??                                        	
 ?               	
 ?
??                                               	
 ?   ??                                        	
 ?
                                                        ??                                               	

                                                          	
 ?
^Do	
 ?you	
 ?have	
 ?any	
 ?good	
 ?babysiLer	
 ?recommendaMons	
 ?in	
 ?Palo	
 ?
Alto	
 ?for	
 ?my	
 ?6-?\year-?\old	
 ?twins?	
 ?I¨m	
 ?looking	
 ?for	
 ?somebody	
 ?that	
 ?
won¨t	
 ?let	
 ?them	
 ?watch	
 ?TV. ̄
?? Crawler	
 ?and	
 ?Indexer	
 ?
     C?                                               	
 ?
?? Query	
 ?Analyzer	
 ?
     C?              	
 ?
?? Ranking	
 ?FuncMon	
 ?
     C?                            	
 ?
?? UI	
 ?
     C?                                        UI
Lab seminar20100604
s(ui ,u j ,q) = p(ui | u j ) ? p(ui | q)
                = p(ui | u j )‘ p(ui | t) p(t | q)
                                  t(T


??p(ui|uj):	
 ?quality	
 ?score	
 ?
??p(ui|q):	
 ?relevance	
 ?score	
 ?
??                                   	
 ?

u:             q:            t:             	
 ?
P(ui|t)                                        	
??                 	
 ?                                        p(t | ui ) p(ui )
                                                   p(ui | t) =
??                                          	
 ?                     p(t)
??                                   	
 ?          s(t | ui ) = p(t | ui ) + γ ‘u(U p(t | u)
     ??facebook    	
 ?
??blog      	
 ?                                   ‘ p(t | u ) = 1
                                                              i
??                 /twiLer	
 ?                     t(T


                                     


                                 
??                        	
 ?
     ??                                                                       	
 ?
     ??
P(ui|uj)                    	
??
                    	
 ?
     C?          	
 ?
     C?                                         	
 ?
     C?                                  	
 ?
     C?   	
 ?
     C?                        	
 ?
     C?                           	
 ?
     C?   	
 ?
     C?
P(t|q)                       :	
 ?   	
?? Non	
 ?QuesMon	
 ?Classi?er	
 ?
   C?                      	
 ?
?? Inappropriate	
 ?QuesMon	
 ?Classi?er	
 ?
   C?               	
 ?
?? Trivial	
 ?QuesMon	
 ?Classi?er	
 ?
   C?                                                 	
 ?
?? LocaMon	
 ?SensiMve	
 ?Classi?er	
 ?
   C?
P(t|q)                        :	
 ?                  	
??                         	
 ?
     C? Keyword	
 ?Match	
 ?Topic	
 ?Mapper	
 ?
         ??                                      	
 ?
     C? Taxonomy	
 ?Topic	
 ?Mapper	
 ?
         ?? SVM 3000                             	
 ?
     C? Salient	
 ?Term	
 ?Topic	
 ?Mapper	
 ?
         ?? d-?\idf                                     	
 ?
     C? User	
 ?Tag	
 ?Topic	
 ?Mapper	
 ?
         ??
??                                                 	
 ?
     C? Topic	
 ?ExperMse:	
 ?p(ui|q)	
 ?
     C? Connectedness:	
 ?p(ui|uj)	
 ?
     C? Availability:	
 ?                                 	
 ?
??                 	
 ?
     C?
                                            	
 ?
Lab seminar20100604
Lab seminar20100604
Lab seminar20100604
??                       	
 ?
     C? Google PC               	
 ?
?? Mobile	
 ?Google   Aardvark
      	
 ?
     C? Google                         Aardvark
??
             	
 ?
??                       	
 ?




                                  	
                                        	
Aardvark	
                             18.6	
 ?words	
                 98.1%	
                    	
          2.2	
 ? 	
 ?2.9	
 ?words	
        57	
 ? 	
 ?63%
??                  	
 ?
     C? fact
?? 57.2% 10                 	
 ?
     C? facebook 15.7% 15          	
 ?
??            6 37
?? 87.7%                	
 ?
??     2.08
?? 97.7%       3               	
 ?
?? 174,605         	
 ?
??     1,199,323
?? Google            	
 ?
     C? 200     Aardvark                 	
 ?
     C? Aardvark                         google
                                     5                                	
 ?
     C? 10                                                     	
 ?

                             	
                 	
                                  	

Aardvark	
                        5 	
               71.5%	
                 3.93	
 ?\	
 ?1.23	

Google	
                          2 	
               70.5%	
                 3.07	
 ?\	
 ?1.46
??                                         	
 ?
     C?                             	
 ?
??
                             	
 ?
??
                      	
 ?
??             	
 ?
??
?? ^        ̄       Aardvark   	
 ?
?? Aardvark          	
 ?
?? Aardvark          	
 ?

?? ^            ̄
                       	
 ?
??

More Related Content

Lab seminar20100604

  • 1. Tha ?Anatomy ?of ?a ?Large-?\Scale ? Social ?Search ?Engine, ?www2010 ?
  • 2. ?? Damon ?Horowitz, ?Sepandar ?D. ?Kamvar ? ?? The ?Anatomy ?of ?a ?Large-?\Scale ?Social ?Search ? Engine ? ?? WWW ?2010 ? ?? Aardvark ? QA ? ?? web ?
  • 3. ?? QA ? ?? ? ?? ? ?? ? ?? Google
  • 4. ?? ?Aardvark ? ?? : ?Google ? ?? ? ?? ? ?? ? ?? ?? ? ? ?? ? ?? ? ?? ? ^Do ?you ?have ?any ?good ?babysiLer ?recommendaMons ?in ?Palo ? Alto ?for ?my ?6-?\year-?\old ?twins? ?I¨m ?looking ?for ?somebody ?that ? won¨t ?let ?them ?watch ?TV. ̄
  • 5. ?? Crawler ?and ?Indexer ? C? ? ?? Query ?Analyzer ? C? ? ?? Ranking ?FuncMon ? C? ? ?? UI ? C? UI
  • 7. s(ui ,u j ,q) = p(ui | u j ) ? p(ui | q) = p(ui | u j )‘ p(ui | t) p(t | q) t(T ??p(ui|uj): ?quality ?score ? ??p(ui|q): ?relevance ?score ? ?? ? u: q: t: ?
  • 8. P(ui|t) ?? ? p(t | ui ) p(ui ) p(ui | t) = ?? ? p(t) ?? ? s(t | ui ) = p(t | ui ) + γ ‘u(U p(t | u) ??facebook ? ??blog ? ‘ p(t | u ) = 1 i ?? /twiLer ? t(T ?? ? ?? ? ??
  • 9. P(ui|uj) ?? ? C? ? C? ? C? ? C? ? C? ? C? ? C? ? C?
  • 10. P(t|q) : ? ?? Non ?QuesMon ?Classi?er ? C? ? ?? Inappropriate ?QuesMon ?Classi?er ? C? ? ?? Trivial ?QuesMon ?Classi?er ? C? ? ?? LocaMon ?SensiMve ?Classi?er ? C?
  • 11. P(t|q) : ? ?? ? C? Keyword ?Match ?Topic ?Mapper ? ?? ? C? Taxonomy ?Topic ?Mapper ? ?? SVM 3000 ? C? Salient ?Term ?Topic ?Mapper ? ?? d-?\idf ? C? User ?Tag ?Topic ?Mapper ? ??
  • 12. ?? ? C? Topic ?ExperMse: ?p(ui|q) ? C? Connectedness: ?p(ui|uj) ? C? Availability: ? ? ?? ? C? ?
  • 16. ?? ? C? Google PC ? ?? Mobile ?Google Aardvark ? C? Google Aardvark
  • 17. ?? ? ?? ? Aardvark 18.6 ?words 98.1% 2.2 ? ?2.9 ?words 57 ? ?63%
  • 18. ?? ? C? fact
  • 19. ?? 57.2% 10 ? C? facebook 15.7% 15 ? ?? 6 37
  • 20. ?? 87.7% ? ?? 2.08
  • 21. ?? 97.7% 3 ? ?? 174,605 ? ?? 1,199,323
  • 22. ?? Google ? C? 200 Aardvark ? C? Aardvark google 5 ? C? 10 ? Aardvark 5 71.5% 3.93 ?\ ?1.23 Google 2 70.5% 3.07 ?\ ?1.46
  • 23. ?? ? C? ? ?? ? ?? ? ?? ? ??
  • 24. ?? ^  ̄ Aardvark ? ?? Aardvark ? ?? Aardvark ? ?? ^  ̄ ? ??