ݺߣ

ݺߣShare a Scribd company logo
‫ﺗﻨﻈ‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺑﺮاي‬ ‫را‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫ﭼﮕﻮﻧﻪ‬‫ﻛﻨﻴﻢ؟‬ ‫ﻴﻢ‬
‫ﻧﺸﺎﻃﻲ‬ ‫ﻣﺤﻤﻮد‬ ‫دﻛﺘﺮ‬
‫داده‬ ‫ﻋﻠﻢ‬ ‫آزﻣﺎﻳﺸﮕﺎه‬
MAHMOOD.NESHATI@GMAIL.COM
‫ﻣﻄﺎﻟﺐ‬ ‫ﻓﻬﺮﺳﺖ‬
‫دارﻳﻢ؟‬ ‫ﻧﻴﺎز‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﺑﻪ‬ ‫ﭼﺮا‬
‫ﻣﻘﺼﺪ‬ ‫و‬ ‫ﻣﺒﺪا‬ ‫در‬ ‫ﺷﻮﻧﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﺎي‬ ‫آﻳﺘﻢ‬ ‫ﻧﻤﺎﻳﺶ‬ ‫ﻧﺤﻮه‬
‫ﺷﻜﻞ‬‫اﺳﺖ؟‬ ‫ﭼﮕﻮﻧﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬
‫ﭘﺎﻳﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬– Recall Oriented Scoring
‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬-Precision Oriented Scoring
‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬
‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻏﻴﺮ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬
‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫ﻏﻴﺮواﺑﺴﺘﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬
‫ﮔﻴﺮي‬ ‫ﻧﺘﻴﺠﻪ‬
‫دارﻳﻢ‬ ‫ﻧﻴﺎز‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬!
‫ﮔﻴﺮد‬ ‫ﻣﻲ‬ ‫ﻗﺮار‬ ‫اﺳﺘﻔﺎده‬ ‫ﻣﻮرد‬ ‫ﻫﺎ‬ ‫ﭘﺮوژه‬ ‫در‬ ‫ﻋﻤﺪه‬ ‫ﻫﺪف‬ ‫دو‬ ‫ﺑﺎ‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬:
‫ﻋﻨﻮان‬ ‫ﺑﻪ‬ ‫اﺳﺘﻔﺎده‬Doc‐Storage)‫از‬ ‫ﺑﺮﺧﻲ‬ ‫ﺑﻪ‬ ‫ﺷﺒﻴﻪ‬No‐SQL‫ﻣﺎﻧﻨﺪ‬ ‫دﻳﮕﺮ‬ ‫ﻫﺎي‬Mongo‐
DB(
‫ﻣﺘﻨﻲ‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﻮﺗﻮر‬ ‫ﻋﻨﻮان‬ ‫ﺑﻪ‬ ‫اﺳﺘﻔﺎده‬
‫ﭘﺲ‬ ‫اﺳﺖ‬ ‫ﻣﺘﻨﻲ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻣﻮﺗﻮر‬ ‫ﻗﺎﺑﻠﻴﺖ‬ ،‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫ﻓﺮد‬ ‫ﺑﻪ‬ ‫ﻣﻨﺤﺼﺮ‬ ‫وﻳﮋﮔﻲ‬‫ﻛﺎرﺑﺮد‬
‫اﺳﺖ‬ ‫ﺗﺮ‬ ‫ﻣﻬﻢ‬ ‫دوم‬.
‫ﻋﻨﻮان‬ ‫ﺑﻪ‬ ،‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫اﻧﺪازي‬ ‫راه‬Doc‐Storage‫اﺳﺖ‬ ‫ﺳﺎده‬ ‫ﻧﺴﺒﺘﺎ‬.
‫اﻻﺳﺘﻴﻚ‬ ‫اﻧﺪازي‬ ‫راه‬،‫ﺳﺮچ‬‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﻮﺗﻮر‬ ‫ﻋﻨﻮان‬ ‫ﺑﻪ‬‫ﺗﺠ‬ ‫ﺑﻪ‬ ‫ﻧﻴﺎز‬ ‫و‬ ‫اﺳﺖ‬ ‫دﺷﻮار‬ ‫ﻣﺘﻨﻲ‬‫ﺮﺑﻪ‬
‫دارد‬.
Elastic Search
Ranking Function
‫دارﻳﻢ‬ ‫ﻧﻴﺎز‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬!
‫اﻛﺜﺮ‬‫وب‬‫ﺳﺎﻳﺖ‬‫ﻫﺎي‬،‫ﻛﺸﻮر‬‫رﺗﺒﻪ‬‫ﺑﻨﺪي‬‫ﻣﻨﺎﺳﺒ‬‫ﻲ‬
‫ﻧﺪارﻧﺪ‬‫و‬‫در‬‫ﻧﺘﻴﺠﻪ‬‫ﻣﻮارد‬‫زﻳﺮ‬‫رخ‬‫ﻣﻲ‬‫دﻫﺪ‬:
‫ﺗﻀﻌﻴﻒ‬‫ﺗﺠﺮﺑﻪ‬‫ﻛﺎرﺑﺮي‬
‫ﻛﺎﻫﺶ‬‫ﻓﺮوش‬
‫ﻛﺎﻫﺶ‬‫ﺑﺎزﮔﺸﺖ‬‫ﻣﺸﺘﺮي‬
‫اراﺋﻪ‬‫ﻳﻚ‬‫رﺗﺒﻪ‬‫ﺑﻨﺪي‬‫ﺑﻬﻴﻨﻪ‬‫ﻫﺪف‬‫ﻣﻬﻢ‬‫ﻫﺮ‬‫ﻣﻮﺗﻮر‬‫ﺟﺴﺘ‬‫ﺠﻮ‬
‫اﺳﺖ‬!
‫ﻛﺎرﺑﺮ‬‫ﻧﻴﺎز‬‫ﺧﻮد‬‫را‬‫ﺑﺎ‬‫ﭼﻨﺪ‬‫ﻛﻠﻤﻪ‬‫ﺑﻴﺎن‬‫ﻣﻲ‬،‫ﻛﻨﺪ‬‫ﻣﻮﺗﻮ‬‫ر‬
‫ﺟﺴﺘﺠﻮ‬‫ﺑﺎﻳﺪ‬‫ﺑﻬﺘﺮﻳﻦ‬‫ﻧﺘﻴﺠﻪ‬‫را‬‫در‬‫ﺑﻬﺘﺮﻳﻦ‬‫رﺗﺒﻪ‬‫ﻧ‬‫ﻤﺎﻳﺶ‬
‫دﻫﺪ‬!
‫اراﺋﻪ‬‫رﺗﺒﻪ‬‫ﺑﻨﺪي‬،‫ﺧﻮب‬‫ﺳﺎده‬‫ﻧﻴﺴﺖ‬!
‫و‬ ‫ﻣﺒﺪا‬ ‫در‬ ‫ﺷﻮﻧﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﺎي‬ ‫آﻳﺘﻢ‬ ‫ﻧﻤﺎﻳﺶ‬ ‫ﻧﺤﻮه‬‫ﻣﻘﺼ‬‫ﺪ‬
‫ﻫ‬ ‫آﻳﺘﻢ‬ ‫از‬ ‫ﻫﺎﻳﻲ‬ ‫ﻣﺜﺎل‬ ‫ﻛﻨﻨﺪ‬ ‫ﻣﻲ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫و‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫را‬ ‫ﻣﺸﺨﺺ‬ ‫ﻫﺎي‬ ‫آﻳﺘﻢ‬ ‫از‬ ‫ﻧﻮﻋﻲ‬ ،‫ﺳﺎزﻣﺎﻧﻲ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻣﻮﺗﻮرﻫﺎي‬ ‫از‬ ‫ﻳﻚ‬ ‫ﻫﺮ‬‫ﺎ‬:
‫ﺳﺎزﻣﺎﻧﻲ‬ ‫ﻫﺎي‬ ‫ﻧﺎﻣﻪ‬‫اﺗﻮﻣﺎﺳﻴﻮن‬ ‫ﻫﺎي‬ ‫ﺳﺎﻣﺎﻧﻪ‬ ‫در‬
‫ﻫﺎي‬ ‫ﺳﺎﻳﺖ‬ ‫وب‬ ‫در‬ ‫ﻫﺎ‬ ‫ﻛﺎﻻ‬ ‫و‬ ‫ﻣﺤﺼﻮﻻت‬E‐commerce
‫اﺳﺘﺨﺪاﻣﻲ‬ ‫ﻫﺎي‬ ‫ﺳﺎﻳﺖ‬ ‫وب‬ ‫در‬ ‫اﺳﺘﺨﺪام‬ ‫ﻫﺎي‬ ‫آﮔﻬﻲ‬
‫و‬...
‫ﺷﻮد‬ ‫ﺗﺒﺪﻳﻞ‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﻣﻨﺎﺳﺐ‬ ‫ﻓﺮﻣﺖ‬ ‫ﺑﻪ‬ ‫ﻣﺒﺪا‬ ‫داده‬ ‫ﭘﺎﻳﮕﺎه‬ ‫در‬ ‫ﻫﺎ‬ ‫آﻳﺘﻢ‬ ‫اﻃﻼﻋﺎت‬ ‫ﺑﺎﻳﺪ‬ ،‫ﺑﻬﻴﻨﻪ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻳﻚ‬ ‫ﺑﺮاي‬.
‫ﻣﺒﺪا‬ ‫در‬ ‫داده‬ ‫ﻓﺮﻣﺖ‬ ‫ﻣﻘﺼﺪ‬ ‫در‬ ‫داده‬ ‫ﻓﺮﻣﺖ‬
‫ﻛﺎرا‬ ‫ﺳﺎزي‬ ‫ذﺧﻴﺮه‬ ‫ﺑﺮاي‬ ‫ﻃﺮاﺣﻲ‬ ‫ﻛﺎرا‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫ﺑﺮاي‬ ‫ﻃﺮاﺣﻲ‬
‫ﻛﻨﻨﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﻣﺤﻮرﻳﺖ‬ ‫ﺑﺎ‬ ‫ﻃﺮاﺣﻲ‬‫ﺳﻴﺴﺘﻢ‬ ‫ﻛﺎراﻳﻲ‬ ‫ﻣﺤﻮرﻳﺖ‬ ‫ﺑﺎ‬ ‫ﻃﺮاﺣﻲ‬
‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫داده‬ ‫ﻓﺮﻣﺖ‬
‫از‬ ‫ﻣﺠﻮﻋﻪ‬ ‫ﺻﻮرت‬ ‫ﺑﻪ‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﻫﺎ‬ ‫آﻳﺘﻢ‬ ‫از‬ ‫ﻳﻚ‬ ‫ﻫﺮ‬Field‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ذﺧﻴﺮه‬ ‫ﻫﺎ‬.
‫ﻣﻬﻢ‬ ‫ﺳﻮال‬:‫از‬ ‫ﻳﻚ‬ ‫ﻫﺮ‬ ‫ﺑﺎ‬ ‫ﻣﻌﺎدل‬ ‫آﻳﺎ‬Attribute‫ﻣﻘﺼﺪ‬ ‫در‬ ‫ﻓﻴﻠﺪ‬ ‫ﻳﻚ‬ ‫ﺑﺎﻳﺪ‬ ،‫داده‬ ‫ﻣﺒﺪا‬ ‫در‬ ‫آﻳﺘﻢ‬ ‫ﻫﺎي‬)‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬(‫ﺑﮕﻴﺮﻳ‬ ‫ﻧﻈﺮ‬ ‫در‬‫ﻢ؟‬
‫ﭘﺎﺳﺦ‬:‫ﻛ‬ ‫ﻓﻜﺮي‬ ‫ﻣﺪل‬ ‫ﺑﺎﻳﺪ‬ ‫و‬ ‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ﻃﺮاﺣﻲ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﺪف‬ ‫ﺑﺎ‬ ‫ﺻﺮﻓﺎ‬ ،‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﺷﺪه‬ ‫ﺗﻌﺮﻳﻒ‬ ‫ﻓﻴﻠﺪﻫﺎي‬ ،‫ﺧﻴﺮ‬‫در‬ ‫ﺎرﺑﺮ‬
‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﻣﺪﻧﻈﺮ‬ ‫را‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﻨﮕﺎم‬.
Item Lucene Document
Field 1
Field 2
Field n
Multi Field & Flat representation of Item
‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬ ‫ﺷﻜﻞ‬
‫ﺳﻨﺪ‬ ‫ﻫﺮ‬ ‫ﺑﻪ‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﻮﺗﻮر‬ ،‫ﺷﺪه‬ ‫داده‬ ‫ﻛﻮﺋﺮي‬ ‫ﻳﻚ‬ ‫ﺑﺮاي‬)‫آﻳﺘﻢ‬(‫دﻫﺪ‬ ‫ﻣﻲ‬ ‫اﻣﺘﻴﺎز‬ ‫ﻳﻚ‬.‫ﺻﻮرت‬ ‫ﺑﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬ ‫ﺷﻜﻞ‬‫اﺳﺖ‬ ‫زﻳﺮ‬:
‫اﻣﺘﻴﺎزﺳﻴﮕﻨﺎل‬‫اﻫﻤﻴﺖ‬‫ﺳﻴﮕﻨﺎل‬‫ﻫﺎ‬ ‫ﺳﻴﮕﻨﺎل‬ ‫وزﻧﻲ‬ ‫ﺟﻤﻊ‬
Elastic QueryBoostingBoolean (SHOULD)
‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﻣﻌﺎدل‬
‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬ ‫ﺷﻜﻞ‬
‫ﺷﻮﻧﺪ‬ ‫ﻣﻲ‬ ‫ﺗﻘﺴﻴﻢ‬ ‫زﻳﺮ‬ ‫دﺳﺘﻪ‬ ‫ﭼﻬﺎر‬ ‫ﺑﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬.
‫ﭘﺎﻳﻪ‬ ‫ﺳﻴﮕﻨﺎل‬
‫اﺳﺖ‬ ‫ﭘﺎﻳﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﻳﻚ‬ ‫اراﺋﻪ‬ ‫ﺳﻴﮕﻨﺎل‬ ‫اﻳﻦ‬ ‫از‬ ‫ﻫﺪف‬.
‫ﺳﻴﮕﻨﺎل‬ ‫اﻳﻦ‬ ‫از‬ ‫اﺳﺘﻔﺎده‬Recall‫دﻫﺪ‬ ‫ﻣﻲ‬ ‫اﻓﺰاﻳﺶ‬ ‫را‬ ‫ﺑﺎزﻳﺎﺑﻲ‬.
‫اﺳﺖ‬ ‫ﺳﺎده‬ ‫اﻳﺪه‬:
◦‫اﺳﺖ‬ ‫داده‬ ‫رخ‬ ‫ان‬ ‫در‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻛﻠﻤﺎت‬ ‫ﺑﻴﺸﺘﺮﻳﻦ‬ ‫ﻛﻪ‬ ‫اﺳﺖ‬ ‫ﺑﻬﺘﺮ‬ ‫اﻳﺘﻤﻲ‬.
‫ﻧﻮع‬ ‫از‬ ‫ﻛﻮﺋﺮي‬ ‫ﻳﻚ‬ ‫از‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬query_string‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫اﻧﺠﺎم‬.
Base signal
‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬
‫ﺑﮕﻴﺮﻳﺪ‬ ‫ﻧﻈﺮ‬ ‫در‬ ‫را‬ ‫زﻳﺮ‬ ‫ﻣﻮارد‬:
‫در‬ ،‫ﻋﻴﻨﺎ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﺗﻮﺳﻂ‬ ‫ﺷﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻋﺒﺎرت‬ ‫اﮔﺮ‬Subject‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫را‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫در‬ ‫اول‬ ‫رﺗﺒﻪ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻧﺎﻣﻪ‬ ‫آن‬ ،‫دارد‬ ‫وﺟﻮد‬ ‫ﻧﺎﻣﻪ‬ ‫ﻳﻚ‬.
‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫در‬ ‫را‬ ‫رﺗﺒﻪ‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻣﺤﺼﻮل‬ ‫آن‬ ،‫ﺷﻮد‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﻳﻚ‬ ‫ﺗﻮﺳﻂ‬ ‫ﻋﻴﻨﺎ‬ ‫ﻣﺤﺼﻮل‬ ‫ﻳﻚ‬ ‫ﻧﺎم‬ ‫اﮔﺮ‬.
◦...
‫از‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬ ‫ﺑﺎﻻ‬ ‫ﻣﻮارد‬match_phrase‫ﺷﻮد‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬ ‫ﺑﺎﻳﺪ‬.
‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻏﻴﺮ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬
‫از‬ ‫ﺑﻴﺶ‬50‫ﻣﻮﺟﻮدﻳﺖ‬ ‫ﻳﻚ‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫ﺑﻪ‬ ‫ﻣﺮﺑﻮط‬ ‫ﻫﺎ‬ ‫ﻛﻮﺋﺮي‬ ‫از‬ ‫درﺻﺪ‬)‫و‬ ‫ﻣﻜﺎن‬ ،‫ﺳﺎزﻣﺎن‬ ،‫ﻓﺮد‬(...‫اﺳﺖ‬.
‫ﻣﻬﻢ‬ ‫ﻧﻜﺘﻪ‬:‫ﺑﺮ‬ ‫ﻣﺒﺘﻨﻲ‬ ‫دﻫﻲ‬ ‫اﻣﺘﻴﺎز‬ ‫از‬ ‫ﻧﺒﺎﻳﺪ‬ ‫ﻣﻮارد‬ ‫اﻳﻦ‬ ‫در‬TF‐IDF‫ﻛﺮد‬ ‫اﺳﺘﻔﺎده‬.
‫ﻛﻨﺪ‬ ‫ﻣﻲ‬ ‫درﻳﺎﻓﺖ‬ ‫ﻣﺸﺨﺺ‬ ‫اﻣﺘﻴﺎز‬ ‫ﻳﻚ‬ ‫دارد‬ ‫را‬ ‫ﻣﻮردﻧﻈﺮ‬ ‫ﻣﻮﺟﻮدﻳﺖ‬ ‫ﻛﻪ‬ ‫آﻳﺘﻤﻲ‬ ‫ﻫﺮ‬.
‫از‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬ ‫ﺑﺎﻻ‬ ‫ﻣﻮارد‬multi_match‫ﺷﻮد‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬ ‫ﺑﺎﻳﺪ‬.
‫داد‬ ‫اﻓﺰاﻳﺶ‬ ‫زﻳﺎدي‬ ‫ﺣﺪ‬ ‫ﺗﺎ‬ ‫را‬ ‫ﺟﺴﺘﺠﻮ‬ ‫دﻗﺖ‬ ‫ﺗﻮان‬ ‫ﻣﻲ‬ ‫ﻫﺎ‬ ‫ﺳﻴﮕﻨﺎل‬ ‫اﻳﻦ‬ ‫از‬ ‫ﻣﻨﺎﺳﺐ‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬.
Field Based Search
‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫ﻏﻴﺮواﺑﺴﺘﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬
‫ﺑﮕﻴﺮﻧﺪ‬ ‫ﻗﺮار‬ ‫ﺑﻬﺘﺮي‬ ‫ﻫﺎي‬ ‫رﺗﺒﻪ‬ ‫در‬ ‫ﺑﺎﻳﺪ‬ ‫ﺟﺪﻳﺪﺗﺮ‬ ‫ﺳﻨﺪﻫﺎي‬ ،‫ﺳﻨﺪﻫﺎ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻫﻨﮕﺎم‬ ‫در‬)Recency(
‫ﻳﻚ‬ ‫اﺳﺖ‬ ‫ﻣﻤﻜﻦ‬ ‫ﻛﺎرﺑﺮ‬ ،‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﻨﮕﺎم‬ ‫در‬Preference‫ﻛﺎﻻﻫﺎي‬ ‫ﻛﺎرﺑﺮ‬ ‫ﻳﻚ‬ ‫ﻣﺜﻼ‬ ،‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﻣﺸﺨﺺ‬
‫دﻫﺪ‬ ‫ﻣﻲ‬ ‫ﺗﺮﺟﻴﺢ‬ ‫را‬ ‫ﺗﺮ‬ ‫ارزان‬.
،‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﻨﮕﺎم‬ ‫در‬‫ﻛﺎر‬ ‫و‬ ‫ﻛﺴﺐ‬)Business(‫ﻣﻤﻜﻦ‬‫ﻳﻚ‬ ‫اﺳﺖ‬Preference‫ﻣﺜﻼ‬ ،‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﻣﺸﺨﺺ‬
‫دﻫﺪ‬ ‫ﻧﻤﺎﻳﺶ‬ ‫ﺑﻬﺘﺮي‬ ‫رﺗﺒﻪ‬ ‫در‬ ‫را‬ ‫اﻧﺒﺎر‬ ‫در‬ ‫ﻣﻮﺟﻮد‬ ‫ﻛﺎﻻﻫﺎي‬.
‫ﺑﺎ‬ ‫ﺑﺎﻻ‬ ‫ﻣﻮارد‬function_score‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬.
‫ﺷﺪه‬ ‫ﻃﺮاﺣﻲ‬ ‫ﺗﺎﺑﻊ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻣﻌﻤﻮﻻ‬log‐scale‫ﺑﻴﺎﻳﺪ‬ ‫دﺳﺖ‬ ‫ﺑﻪ‬ ‫ﻧﺘﻴﺠﻪ‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺗﺎ‬ ‫ﺑﺎﺷﺪ‬.
Function Score
‫ﮔﻴﺮي‬ ‫ﻧﺘﻴﺠﻪ‬
‫ﻳﺎﺑﺪ‬ ‫ﺑﻬﺒﻮد‬ ‫زﻳﺮ‬ ‫ﻣﻮارد‬ ‫ﺗﺎ‬ ‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ﺑﺎﻋﺚ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺗﻨﻈﻴﻢ‬:
‫ﻛﺎرﺑﺮي‬ ‫ﺗﺠﺮﺑﻪ‬
‫ﺗﺒﺪﻳﻞ‬ ‫ﻧﺮخ‬
‫ﻣﺤﺼﻮل‬ ‫ﻓﺮوش‬
‫ﺗﻨﻈﻴﻢ‬Ranking Function‫ﺷﻮد‬ ‫اﻧﺠﺎم‬ ‫ﺑﺎﻳﺪ‬ ‫داﻣﻨﻪ‬ ‫ﻫﺮ‬ ‫ﺑﺮاي‬ ‫ﻇﺮاﻓﺖ‬ ‫و‬ ‫دﻗﺖ‬ ‫ﺑﺎ‬.
‫ﺑﮕﻴﺮﻳﺪ‬ ‫ﺗﻤﺎس‬ ‫زﻳﺮ‬ ‫آدرس‬ ‫ﺑﺎ‬ ‫ﻣﺸﺎوره‬ ‫درﻳﺎﻓﺖ‬ ‫ﺟﻬﺖ‬:
Mahmood.Neshati@gmail.com

More Related Content

رتبه بندی الاستیک سرچ

  • 1. ‫ﺗﻨﻈ‬ ‫ﺑﻬﻴﻨﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺑﺮاي‬ ‫را‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫ﭼﮕﻮﻧﻪ‬‫ﻛﻨﻴﻢ؟‬ ‫ﻴﻢ‬ ‫ﻧﺸﺎﻃﻲ‬ ‫ﻣﺤﻤﻮد‬ ‫دﻛﺘﺮ‬ ‫داده‬ ‫ﻋﻠﻢ‬ ‫آزﻣﺎﻳﺸﮕﺎه‬ MAHMOOD.NESHATI@GMAIL.COM
  • 2. ‫ﻣﻄﺎﻟﺐ‬ ‫ﻓﻬﺮﺳﺖ‬ ‫دارﻳﻢ؟‬ ‫ﻧﻴﺎز‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﺑﻪ‬ ‫ﭼﺮا‬ ‫ﻣﻘﺼﺪ‬ ‫و‬ ‫ﻣﺒﺪا‬ ‫در‬ ‫ﺷﻮﻧﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﺎي‬ ‫آﻳﺘﻢ‬ ‫ﻧﻤﺎﻳﺶ‬ ‫ﻧﺤﻮه‬ ‫ﺷﻜﻞ‬‫اﺳﺖ؟‬ ‫ﭼﮕﻮﻧﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬ ‫ﭘﺎﻳﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬– Recall Oriented Scoring ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬-Precision Oriented Scoring ‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬ ‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻏﻴﺮ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬ ‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫ﻏﻴﺮواﺑﺴﺘﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬ ‫ﮔﻴﺮي‬ ‫ﻧﺘﻴﺠﻪ‬
  • 3. ‫دارﻳﻢ‬ ‫ﻧﻴﺎز‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬! ‫ﮔﻴﺮد‬ ‫ﻣﻲ‬ ‫ﻗﺮار‬ ‫اﺳﺘﻔﺎده‬ ‫ﻣﻮرد‬ ‫ﻫﺎ‬ ‫ﭘﺮوژه‬ ‫در‬ ‫ﻋﻤﺪه‬ ‫ﻫﺪف‬ ‫دو‬ ‫ﺑﺎ‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬: ‫ﻋﻨﻮان‬ ‫ﺑﻪ‬ ‫اﺳﺘﻔﺎده‬Doc‐Storage)‫از‬ ‫ﺑﺮﺧﻲ‬ ‫ﺑﻪ‬ ‫ﺷﺒﻴﻪ‬No‐SQL‫ﻣﺎﻧﻨﺪ‬ ‫دﻳﮕﺮ‬ ‫ﻫﺎي‬Mongo‐ DB( ‫ﻣﺘﻨﻲ‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﻮﺗﻮر‬ ‫ﻋﻨﻮان‬ ‫ﺑﻪ‬ ‫اﺳﺘﻔﺎده‬ ‫ﭘﺲ‬ ‫اﺳﺖ‬ ‫ﻣﺘﻨﻲ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻣﻮﺗﻮر‬ ‫ﻗﺎﺑﻠﻴﺖ‬ ،‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫ﻓﺮد‬ ‫ﺑﻪ‬ ‫ﻣﻨﺤﺼﺮ‬ ‫وﻳﮋﮔﻲ‬‫ﻛﺎرﺑﺮد‬ ‫اﺳﺖ‬ ‫ﺗﺮ‬ ‫ﻣﻬﻢ‬ ‫دوم‬. ‫ﻋﻨﻮان‬ ‫ﺑﻪ‬ ،‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫اﻧﺪازي‬ ‫راه‬Doc‐Storage‫اﺳﺖ‬ ‫ﺳﺎده‬ ‫ﻧﺴﺒﺘﺎ‬. ‫اﻻﺳﺘﻴﻚ‬ ‫اﻧﺪازي‬ ‫راه‬،‫ﺳﺮچ‬‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﻮﺗﻮر‬ ‫ﻋﻨﻮان‬ ‫ﺑﻪ‬‫ﺗﺠ‬ ‫ﺑﻪ‬ ‫ﻧﻴﺎز‬ ‫و‬ ‫اﺳﺖ‬ ‫دﺷﻮار‬ ‫ﻣﺘﻨﻲ‬‫ﺮﺑﻪ‬ ‫دارد‬. Elastic Search Ranking Function
  • 4. ‫دارﻳﻢ‬ ‫ﻧﻴﺎز‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬! ‫اﻛﺜﺮ‬‫وب‬‫ﺳﺎﻳﺖ‬‫ﻫﺎي‬،‫ﻛﺸﻮر‬‫رﺗﺒﻪ‬‫ﺑﻨﺪي‬‫ﻣﻨﺎﺳﺒ‬‫ﻲ‬ ‫ﻧﺪارﻧﺪ‬‫و‬‫در‬‫ﻧﺘﻴﺠﻪ‬‫ﻣﻮارد‬‫زﻳﺮ‬‫رخ‬‫ﻣﻲ‬‫دﻫﺪ‬: ‫ﺗﻀﻌﻴﻒ‬‫ﺗﺠﺮﺑﻪ‬‫ﻛﺎرﺑﺮي‬ ‫ﻛﺎﻫﺶ‬‫ﻓﺮوش‬ ‫ﻛﺎﻫﺶ‬‫ﺑﺎزﮔﺸﺖ‬‫ﻣﺸﺘﺮي‬ ‫اراﺋﻪ‬‫ﻳﻚ‬‫رﺗﺒﻪ‬‫ﺑﻨﺪي‬‫ﺑﻬﻴﻨﻪ‬‫ﻫﺪف‬‫ﻣﻬﻢ‬‫ﻫﺮ‬‫ﻣﻮﺗﻮر‬‫ﺟﺴﺘ‬‫ﺠﻮ‬ ‫اﺳﺖ‬! ‫ﻛﺎرﺑﺮ‬‫ﻧﻴﺎز‬‫ﺧﻮد‬‫را‬‫ﺑﺎ‬‫ﭼﻨﺪ‬‫ﻛﻠﻤﻪ‬‫ﺑﻴﺎن‬‫ﻣﻲ‬،‫ﻛﻨﺪ‬‫ﻣﻮﺗﻮ‬‫ر‬ ‫ﺟﺴﺘﺠﻮ‬‫ﺑﺎﻳﺪ‬‫ﺑﻬﺘﺮﻳﻦ‬‫ﻧﺘﻴﺠﻪ‬‫را‬‫در‬‫ﺑﻬﺘﺮﻳﻦ‬‫رﺗﺒﻪ‬‫ﻧ‬‫ﻤﺎﻳﺶ‬ ‫دﻫﺪ‬! ‫اراﺋﻪ‬‫رﺗﺒﻪ‬‫ﺑﻨﺪي‬،‫ﺧﻮب‬‫ﺳﺎده‬‫ﻧﻴﺴﺖ‬!
  • 5. ‫و‬ ‫ﻣﺒﺪا‬ ‫در‬ ‫ﺷﻮﻧﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﺎي‬ ‫آﻳﺘﻢ‬ ‫ﻧﻤﺎﻳﺶ‬ ‫ﻧﺤﻮه‬‫ﻣﻘﺼ‬‫ﺪ‬ ‫ﻫ‬ ‫آﻳﺘﻢ‬ ‫از‬ ‫ﻫﺎﻳﻲ‬ ‫ﻣﺜﺎل‬ ‫ﻛﻨﻨﺪ‬ ‫ﻣﻲ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫و‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫را‬ ‫ﻣﺸﺨﺺ‬ ‫ﻫﺎي‬ ‫آﻳﺘﻢ‬ ‫از‬ ‫ﻧﻮﻋﻲ‬ ،‫ﺳﺎزﻣﺎﻧﻲ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻣﻮﺗﻮرﻫﺎي‬ ‫از‬ ‫ﻳﻚ‬ ‫ﻫﺮ‬‫ﺎ‬: ‫ﺳﺎزﻣﺎﻧﻲ‬ ‫ﻫﺎي‬ ‫ﻧﺎﻣﻪ‬‫اﺗﻮﻣﺎﺳﻴﻮن‬ ‫ﻫﺎي‬ ‫ﺳﺎﻣﺎﻧﻪ‬ ‫در‬ ‫ﻫﺎي‬ ‫ﺳﺎﻳﺖ‬ ‫وب‬ ‫در‬ ‫ﻫﺎ‬ ‫ﻛﺎﻻ‬ ‫و‬ ‫ﻣﺤﺼﻮﻻت‬E‐commerce ‫اﺳﺘﺨﺪاﻣﻲ‬ ‫ﻫﺎي‬ ‫ﺳﺎﻳﺖ‬ ‫وب‬ ‫در‬ ‫اﺳﺘﺨﺪام‬ ‫ﻫﺎي‬ ‫آﮔﻬﻲ‬ ‫و‬... ‫ﺷﻮد‬ ‫ﺗﺒﺪﻳﻞ‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﻣﻨﺎﺳﺐ‬ ‫ﻓﺮﻣﺖ‬ ‫ﺑﻪ‬ ‫ﻣﺒﺪا‬ ‫داده‬ ‫ﭘﺎﻳﮕﺎه‬ ‫در‬ ‫ﻫﺎ‬ ‫آﻳﺘﻢ‬ ‫اﻃﻼﻋﺎت‬ ‫ﺑﺎﻳﺪ‬ ،‫ﺑﻬﻴﻨﻪ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻳﻚ‬ ‫ﺑﺮاي‬. ‫ﻣﺒﺪا‬ ‫در‬ ‫داده‬ ‫ﻓﺮﻣﺖ‬ ‫ﻣﻘﺼﺪ‬ ‫در‬ ‫داده‬ ‫ﻓﺮﻣﺖ‬ ‫ﻛﺎرا‬ ‫ﺳﺎزي‬ ‫ذﺧﻴﺮه‬ ‫ﺑﺮاي‬ ‫ﻃﺮاﺣﻲ‬ ‫ﻛﺎرا‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫ﺑﺮاي‬ ‫ﻃﺮاﺣﻲ‬ ‫ﻛﻨﻨﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﻣﺤﻮرﻳﺖ‬ ‫ﺑﺎ‬ ‫ﻃﺮاﺣﻲ‬‫ﺳﻴﺴﺘﻢ‬ ‫ﻛﺎراﻳﻲ‬ ‫ﻣﺤﻮرﻳﺖ‬ ‫ﺑﺎ‬ ‫ﻃﺮاﺣﻲ‬
  • 6. ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫داده‬ ‫ﻓﺮﻣﺖ‬ ‫از‬ ‫ﻣﺠﻮﻋﻪ‬ ‫ﺻﻮرت‬ ‫ﺑﻪ‬ ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﻫﺎ‬ ‫آﻳﺘﻢ‬ ‫از‬ ‫ﻳﻚ‬ ‫ﻫﺮ‬Field‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ذﺧﻴﺮه‬ ‫ﻫﺎ‬. ‫ﻣﻬﻢ‬ ‫ﺳﻮال‬:‫از‬ ‫ﻳﻚ‬ ‫ﻫﺮ‬ ‫ﺑﺎ‬ ‫ﻣﻌﺎدل‬ ‫آﻳﺎ‬Attribute‫ﻣﻘﺼﺪ‬ ‫در‬ ‫ﻓﻴﻠﺪ‬ ‫ﻳﻚ‬ ‫ﺑﺎﻳﺪ‬ ،‫داده‬ ‫ﻣﺒﺪا‬ ‫در‬ ‫آﻳﺘﻢ‬ ‫ﻫﺎي‬)‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬(‫ﺑﮕﻴﺮﻳ‬ ‫ﻧﻈﺮ‬ ‫در‬‫ﻢ؟‬ ‫ﭘﺎﺳﺦ‬:‫ﻛ‬ ‫ﻓﻜﺮي‬ ‫ﻣﺪل‬ ‫ﺑﺎﻳﺪ‬ ‫و‬ ‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ﻃﺮاﺣﻲ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﺪف‬ ‫ﺑﺎ‬ ‫ﺻﺮﻓﺎ‬ ،‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﺷﺪه‬ ‫ﺗﻌﺮﻳﻒ‬ ‫ﻓﻴﻠﺪﻫﺎي‬ ،‫ﺧﻴﺮ‬‫در‬ ‫ﺎرﺑﺮ‬ ‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﻣﺪﻧﻈﺮ‬ ‫را‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﻨﮕﺎم‬. Item Lucene Document Field 1 Field 2 Field n Multi Field & Flat representation of Item
  • 7. ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬ ‫ﺷﻜﻞ‬ ‫ﺳﻨﺪ‬ ‫ﻫﺮ‬ ‫ﺑﻪ‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻣﻮﺗﻮر‬ ،‫ﺷﺪه‬ ‫داده‬ ‫ﻛﻮﺋﺮي‬ ‫ﻳﻚ‬ ‫ﺑﺮاي‬)‫آﻳﺘﻢ‬(‫دﻫﺪ‬ ‫ﻣﻲ‬ ‫اﻣﺘﻴﺎز‬ ‫ﻳﻚ‬.‫ﺻﻮرت‬ ‫ﺑﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬ ‫ﺷﻜﻞ‬‫اﺳﺖ‬ ‫زﻳﺮ‬: ‫اﻣﺘﻴﺎزﺳﻴﮕﻨﺎل‬‫اﻫﻤﻴﺖ‬‫ﺳﻴﮕﻨﺎل‬‫ﻫﺎ‬ ‫ﺳﻴﮕﻨﺎل‬ ‫وزﻧﻲ‬ ‫ﺟﻤﻊ‬ Elastic QueryBoostingBoolean (SHOULD) ‫ﺳﺮچ‬ ‫اﻻﺳﺘﻴﻚ‬ ‫در‬ ‫ﻣﻌﺎدل‬
  • 8. ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﻛﻠﻲ‬ ‫ﺷﻜﻞ‬ ‫ﺷﻮﻧﺪ‬ ‫ﻣﻲ‬ ‫ﺗﻘﺴﻴﻢ‬ ‫زﻳﺮ‬ ‫دﺳﺘﻪ‬ ‫ﭼﻬﺎر‬ ‫ﺑﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬.
  • 9. ‫ﭘﺎﻳﻪ‬ ‫ﺳﻴﮕﻨﺎل‬ ‫اﺳﺖ‬ ‫ﭘﺎﻳﻪ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﻳﻚ‬ ‫اراﺋﻪ‬ ‫ﺳﻴﮕﻨﺎل‬ ‫اﻳﻦ‬ ‫از‬ ‫ﻫﺪف‬. ‫ﺳﻴﮕﻨﺎل‬ ‫اﻳﻦ‬ ‫از‬ ‫اﺳﺘﻔﺎده‬Recall‫دﻫﺪ‬ ‫ﻣﻲ‬ ‫اﻓﺰاﻳﺶ‬ ‫را‬ ‫ﺑﺎزﻳﺎﺑﻲ‬. ‫اﺳﺖ‬ ‫ﺳﺎده‬ ‫اﻳﺪه‬: ◦‫اﺳﺖ‬ ‫داده‬ ‫رخ‬ ‫ان‬ ‫در‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻛﻠﻤﺎت‬ ‫ﺑﻴﺸﺘﺮﻳﻦ‬ ‫ﻛﻪ‬ ‫اﺳﺖ‬ ‫ﺑﻬﺘﺮ‬ ‫اﻳﺘﻤﻲ‬. ‫ﻧﻮع‬ ‫از‬ ‫ﻛﻮﺋﺮي‬ ‫ﻳﻚ‬ ‫از‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬query_string‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫اﻧﺠﺎم‬. Base signal
  • 10. ‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬ ‫ﺑﮕﻴﺮﻳﺪ‬ ‫ﻧﻈﺮ‬ ‫در‬ ‫را‬ ‫زﻳﺮ‬ ‫ﻣﻮارد‬: ‫در‬ ،‫ﻋﻴﻨﺎ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﺗﻮﺳﻂ‬ ‫ﺷﺪه‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻋﺒﺎرت‬ ‫اﮔﺮ‬Subject‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫را‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫در‬ ‫اول‬ ‫رﺗﺒﻪ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻧﺎﻣﻪ‬ ‫آن‬ ،‫دارد‬ ‫وﺟﻮد‬ ‫ﻧﺎﻣﻪ‬ ‫ﻳﻚ‬. ‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫در‬ ‫را‬ ‫رﺗﺒﻪ‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻣﺤﺼﻮل‬ ‫آن‬ ،‫ﺷﻮد‬ ‫ﺟﺴﺘﺠﻮ‬ ‫ﻛﺎرﺑﺮ‬ ‫ﻳﻚ‬ ‫ﺗﻮﺳﻂ‬ ‫ﻋﻴﻨﺎ‬ ‫ﻣﺤﺼﻮل‬ ‫ﻳﻚ‬ ‫ﻧﺎم‬ ‫اﮔﺮ‬. ◦... ‫از‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬ ‫ﺑﺎﻻ‬ ‫ﻣﻮارد‬match_phrase‫ﺷﻮد‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬ ‫ﺑﺎﻳﺪ‬.
  • 11. ‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫واﺑﺴﺘﻪ‬ ‫ﻣﺘﻨﻲ‬ ‫ﻏﻴﺮ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬ ‫از‬ ‫ﺑﻴﺶ‬50‫ﻣﻮﺟﻮدﻳﺖ‬ ‫ﻳﻚ‬ ‫ﺑﺎزﻳﺎﺑﻲ‬ ‫ﺑﻪ‬ ‫ﻣﺮﺑﻮط‬ ‫ﻫﺎ‬ ‫ﻛﻮﺋﺮي‬ ‫از‬ ‫درﺻﺪ‬)‫و‬ ‫ﻣﻜﺎن‬ ،‫ﺳﺎزﻣﺎن‬ ،‫ﻓﺮد‬(...‫اﺳﺖ‬. ‫ﻣﻬﻢ‬ ‫ﻧﻜﺘﻪ‬:‫ﺑﺮ‬ ‫ﻣﺒﺘﻨﻲ‬ ‫دﻫﻲ‬ ‫اﻣﺘﻴﺎز‬ ‫از‬ ‫ﻧﺒﺎﻳﺪ‬ ‫ﻣﻮارد‬ ‫اﻳﻦ‬ ‫در‬TF‐IDF‫ﻛﺮد‬ ‫اﺳﺘﻔﺎده‬. ‫ﻛﻨﺪ‬ ‫ﻣﻲ‬ ‫درﻳﺎﻓﺖ‬ ‫ﻣﺸﺨﺺ‬ ‫اﻣﺘﻴﺎز‬ ‫ﻳﻚ‬ ‫دارد‬ ‫را‬ ‫ﻣﻮردﻧﻈﺮ‬ ‫ﻣﻮﺟﻮدﻳﺖ‬ ‫ﻛﻪ‬ ‫آﻳﺘﻤﻲ‬ ‫ﻫﺮ‬. ‫از‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬ ‫ﺑﺎﻻ‬ ‫ﻣﻮارد‬multi_match‫ﺷﻮد‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬ ‫ﺑﺎﻳﺪ‬. ‫داد‬ ‫اﻓﺰاﻳﺶ‬ ‫زﻳﺎدي‬ ‫ﺣﺪ‬ ‫ﺗﺎ‬ ‫را‬ ‫ﺟﺴﺘﺠﻮ‬ ‫دﻗﺖ‬ ‫ﺗﻮان‬ ‫ﻣﻲ‬ ‫ﻫﺎ‬ ‫ﺳﻴﮕﻨﺎل‬ ‫اﻳﻦ‬ ‫از‬ ‫ﻣﻨﺎﺳﺐ‬ ‫اﺳﺘﻔﺎده‬ ‫ﺑﺎ‬. Field Based Search
  • 12. ‫ﻛﻮﺋﺮي‬ ‫ﺑﻪ‬ ‫ﻏﻴﺮواﺑﺴﺘﻪ‬ ‫ﻫﺎي‬ ‫ﺳﻴﮕﻨﺎل‬ ‫ﺑﮕﻴﺮﻧﺪ‬ ‫ﻗﺮار‬ ‫ﺑﻬﺘﺮي‬ ‫ﻫﺎي‬ ‫رﺗﺒﻪ‬ ‫در‬ ‫ﺑﺎﻳﺪ‬ ‫ﺟﺪﻳﺪﺗﺮ‬ ‫ﺳﻨﺪﻫﺎي‬ ،‫ﺳﻨﺪﻫﺎ‬ ‫ﺟﺴﺘﺠﻮي‬ ‫ﻫﻨﮕﺎم‬ ‫در‬)Recency( ‫ﻳﻚ‬ ‫اﺳﺖ‬ ‫ﻣﻤﻜﻦ‬ ‫ﻛﺎرﺑﺮ‬ ،‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﻨﮕﺎم‬ ‫در‬Preference‫ﻛﺎﻻﻫﺎي‬ ‫ﻛﺎرﺑﺮ‬ ‫ﻳﻚ‬ ‫ﻣﺜﻼ‬ ،‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﻣﺸﺨﺺ‬ ‫دﻫﺪ‬ ‫ﻣﻲ‬ ‫ﺗﺮﺟﻴﺢ‬ ‫را‬ ‫ﺗﺮ‬ ‫ارزان‬. ،‫ﺟﺴﺘﺠﻮ‬ ‫ﻫﻨﮕﺎم‬ ‫در‬‫ﻛﺎر‬ ‫و‬ ‫ﻛﺴﺐ‬)Business(‫ﻣﻤﻜﻦ‬‫ﻳﻚ‬ ‫اﺳﺖ‬Preference‫ﻣﺜﻼ‬ ،‫ﺑﺎﺷﺪ‬ ‫داﺷﺘﻪ‬ ‫ﻣﺸﺨﺺ‬ ‫دﻫﺪ‬ ‫ﻧﻤﺎﻳﺶ‬ ‫ﺑﻬﺘﺮي‬ ‫رﺗﺒﻪ‬ ‫در‬ ‫را‬ ‫اﻧﺒﺎر‬ ‫در‬ ‫ﻣﻮﺟﻮد‬ ‫ﻛﺎﻻﻫﺎي‬. ‫ﺑﺎ‬ ‫ﺑﺎﻻ‬ ‫ﻣﻮارد‬function_score‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ﺳﺎزي‬ ‫ﭘﻴﺎده‬. ‫ﺷﺪه‬ ‫ﻃﺮاﺣﻲ‬ ‫ﺗﺎﺑﻊ‬ ‫ﺑﺎﻳﺪ‬ ‫ﻣﻌﻤﻮﻻ‬log‐scale‫ﺑﻴﺎﻳﺪ‬ ‫دﺳﺖ‬ ‫ﺑﻪ‬ ‫ﻧﺘﻴﺠﻪ‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺗﺎ‬ ‫ﺑﺎﺷﺪ‬. Function Score
  • 13. ‫ﮔﻴﺮي‬ ‫ﻧﺘﻴﺠﻪ‬ ‫ﻳﺎﺑﺪ‬ ‫ﺑﻬﺒﻮد‬ ‫زﻳﺮ‬ ‫ﻣﻮارد‬ ‫ﺗﺎ‬ ‫ﺷﻮد‬ ‫ﻣﻲ‬ ‫ﺑﺎﻋﺚ‬ ‫ﺑﻨﺪي‬ ‫رﺗﺒﻪ‬ ‫ﺗﺎﺑﻊ‬ ‫ﺑﻬﺘﺮﻳﻦ‬ ‫ﺗﻨﻈﻴﻢ‬: ‫ﻛﺎرﺑﺮي‬ ‫ﺗﺠﺮﺑﻪ‬ ‫ﺗﺒﺪﻳﻞ‬ ‫ﻧﺮخ‬ ‫ﻣﺤﺼﻮل‬ ‫ﻓﺮوش‬ ‫ﺗﻨﻈﻴﻢ‬Ranking Function‫ﺷﻮد‬ ‫اﻧﺠﺎم‬ ‫ﺑﺎﻳﺪ‬ ‫داﻣﻨﻪ‬ ‫ﻫﺮ‬ ‫ﺑﺮاي‬ ‫ﻇﺮاﻓﺖ‬ ‫و‬ ‫دﻗﺖ‬ ‫ﺑﺎ‬. ‫ﺑﮕﻴﺮﻳﺪ‬ ‫ﺗﻤﺎس‬ ‫زﻳﺮ‬ ‫آدرس‬ ‫ﺑﺎ‬ ‫ﻣﺸﺎوره‬ ‫درﻳﺎﻓﺖ‬ ‫ﺟﻬﺖ‬: Mahmood.Neshati@gmail.com