ݺߣ

ݺߣShare a Scribd company logo
VERİ MADENCİLİĞİ
  UYGULAMALARI
- APRIORI ALGORİTMASI -


   Nesibe YALÇIN – Emre GÜNGÖR
BİRLİKTELİK KURALLARI
• Birliktelik kuralı, geçmiş verilerin analiz edilerek bu
  veriler içindeki birliktelik davranışlarının tespiti ile
  geleceğe yönelik çalışmalar yapılmasını destekleyen bir
  yaklaşımdır.
• Birliktelik kurallarının kullanıldığı en tipik örnek Market
  Sepeti Analizidir (Market Basket Analysis). Bu işlem,
  müşterilerin yaptıkları alışverişlerdeki ürünler
  arasındaki birliktelikleri bularak müşterilerin satın alma
  alışkanlıklarını analiz eder. Bu tip birlikteliklerin
  keşfedilmesi, müşterilerin hangi ürünleri bir arada
  aldıkları bilgisini ortaya çıkarır ve market yöneticileri de
  bu bilgi ışığında daha etkili satış stratejileri
  geliştirebilirler.
                          Apriori Algoritması                2
Market Sepet Analizi
• Bir müşteri süt satın alıyorsa, aynı
  alışverişte sütün yanında ekmek alma
  olasılığı nedir? Bu tip bir bilgi ışığında
  rafları düzenleyen market yöneticileri
  ürünlerindeki satış oranını
  arttırabilirler. Örneğin bir marketin
  müşterilerinin süt ile birlikte ekmek
  satın alma oranı yüksekse, market
  yöneticileri süt ile ekmek raflarını yan
  yana koyarak ekmek satışlarını
  arttırabilirler.
• Örneğin; bir A ürününü satın alan
  müşteriler aynı zamanda B ürününü
  da satın alıyorlarsa, bu durum
  Birliktelik Kuralı ile gösterilir.


                                 Apriori Algoritması   3
APRIORI ALGORİTMASI
• Apriori algoritması, Agrawal ve Srikant
  tarafından 1994 yılında geliştirilmiştir.
• Veri Madenciliğinde, birliktelik kuralı çıkarım
  algoritmaları içerisinde en fazla bilinen ve
  kullanılan algoritmadır.
• Algoritmanın ismi, yaygın nesnelerin önsel
  bilgilerini kullanmasından yani bilgileri bir
  önceki adımdan almasından “önceki (prior)”
  anlamında aprioridir.

                      Apriori Algoritması           4
Temel Yaklaşım
• Öğe kümesi (itemset)
  – Bir veya daha çok öğeden oluşan küme
  – k-öğe kümesi (k-itemset): k öğeden oluşan küme
     • 3-öğe kümesi: {Bal, Süt, Ekmek}
• Bu algoritmada temel yaklaşım, “eğer k-öğe
  kümesi minimum destek kriterini sağlıyorsa,
  bu kümenin alt kümeleri de minimum destek
  kriterini sağlar. ” şeklindedir.

                         Apriori Algoritması         5
Destek ve Güven Kriterleri
• Birliktelik Kuralında, öğeler arasındaki birliktelik, destek ve
  güven kriterleri ile hesaplanır.
• Destek (support) kriteri, veride öğeler arasındaki bağıntının ne
  kadar sık olduğunu belirtir.
• X ve Y farklı ürünler olmak üzere,
   – X ürünü için destek, tüm alışverişler içinde X ürününün oranıdır.



   – X ve Y ürünleri için destek, X ve Y’ nin bir arada tüm alışverişler içinde
     bulunma olasılığıdır.



                                 Apriori Algoritması                              6
Destek ve Güven Kriterleri
• Güven (confidence) kriteri ise Y ürününün hangi
  olasılıkla X ürünü ile beraber olacağını söyler.




• Elde edilen kuralların güvenirliliği, destek ve güven
  değerleri ile doğru orantılıdır.


                        Apriori Algoritması               7
Destek ve Güven Kriterleri
• Her kural bir destek ve güven değeri ile ifade edilir.
• A⇒B
   ⇒        [destek = 2%, güven = 60%]
• Birliktelik kuralı için 2% destek değeri, analiz edilen
  tüm alışverişlerden 2%’sinde A ile B ürünlerinin
  birlikte satıldığını belirtir.
• 60% oranındaki güven değeri ise A ürününü satın
  alan müşterilerin 60%’ının aynı alışverişte B ürününü
  de satın aldığını gösterir.


                         Apriori Algoritması                8
Algoritmanın Adımları
1. Minimum destek sayısı (min.support ) ve minimum güven değerinin
    (min.confidence) belirlenmesi
2. Öğe kümeler içerisindeki her bir öğenin destek değerinin bulunması
3. Minimum destek değerinden daha düşük desteğe sahip olan
    öğelerin devre dışı bırakılması
4. Elde edilen tekli birliktelikler dikkate alınarak ikili birlikteliklerin
    oluşturulması
5. Minimum destek değerinden düşük olan öğe kümelerin çıkartılması
6. Üçlü birlikteliklerin oluşturulması
7. Üçlü birlikteliklerden minimum destek değerini geçenlerin
    dışındakilerin çıkarılması
8. Üçlü birlikteliklerden birliktelik kurallarının çıkarılması



                                Apriori Algoritması                           9
Uygulama Alanları
•   Eğitim
•   Tıp
•   Mühendislik
•   Finans
•   Telekomünikasyon
•   Pazarlama
•   Bankacılık
•   E-Ticaret
•   …

                       Apriori Algoritması   10
Kaynaklar
•    Karabatak M. ve İnce M.C., Apriori Algoritması ile Öğrenci Başarısı
    Analizi.
•   Şen F., 2008, Veri Madenciliği ile Birliktelik Kurallarının Bulunması,
    Sakarya Üniversitesi.
•   Yıldız E., 2011, ASP.NET ile Kitap Takas Sitesi ve Birliktelik Kuralları ile
    Kitap Önerileri Oluşturma Sistemi, Kocaeli Üniversitesi.
•   Takçı H., 2008, Birliktelik Kuralları: Temel Kavramlar ve Algoritmalar.
•   Altıntop Ü., 2006, Internet Tabanlı Öğretimde Veri Madenciliği
    Tekniklerinin Uygulanması, Kocaeli Üniversitesi.
•   Özseven T. ve Düğenci M., 2011, LOG Analiz: Erişim Kayıt Dosyaları
    Analiz Yazılımı ve GOP Üniversitesi Uygulaması, Bilişim Teknolojileri
    Dergisi, 4(2).
•   Döşlü A., 2008, Veri Madenciliğinde Market Sepet Analizi ve
•   Birliktelik Kurallarının Belirlenmesi, Yıldız Teknik Üniversitesi.

                                  Apriori Algoritması                         11

More Related Content

Apriori algoritması

  • 1. VERİ MADENCİLİĞİ UYGULAMALARI - APRIORI ALGORİTMASI - Nesibe YALÇIN – Emre GÜNGÖR
  • 2. BİRLİKTELİK KURALLARI • Birliktelik kuralı, geçmiş verilerin analiz edilerek bu veriler içindeki birliktelik davranışlarının tespiti ile geleceğe yönelik çalışmalar yapılmasını destekleyen bir yaklaşımdır. • Birliktelik kurallarının kullanıldığı en tipik örnek Market Sepeti Analizidir (Market Basket Analysis). Bu işlem, müşterilerin yaptıkları alışverişlerdeki ürünler arasındaki birliktelikleri bularak müşterilerin satın alma alışkanlıklarını analiz eder. Bu tip birlikteliklerin keşfedilmesi, müşterilerin hangi ürünleri bir arada aldıkları bilgisini ortaya çıkarır ve market yöneticileri de bu bilgi ışığında daha etkili satış stratejileri geliştirebilirler. Apriori Algoritması 2
  • 3. Market Sepet Analizi • Bir müşteri süt satın alıyorsa, aynı alışverişte sütün yanında ekmek alma olasılığı nedir? Bu tip bir bilgi ışığında rafları düzenleyen market yöneticileri ürünlerindeki satış oranını arttırabilirler. Örneğin bir marketin müşterilerinin süt ile birlikte ekmek satın alma oranı yüksekse, market yöneticileri süt ile ekmek raflarını yan yana koyarak ekmek satışlarını arttırabilirler. • Örneğin; bir A ürününü satın alan müşteriler aynı zamanda B ürününü da satın alıyorlarsa, bu durum Birliktelik Kuralı ile gösterilir. Apriori Algoritması 3
  • 4. APRIORI ALGORİTMASI • Apriori algoritması, Agrawal ve Srikant tarafından 1994 yılında geliştirilmiştir. • Veri Madenciliğinde, birliktelik kuralı çıkarım algoritmaları içerisinde en fazla bilinen ve kullanılan algoritmadır. • Algoritmanın ismi, yaygın nesnelerin önsel bilgilerini kullanmasından yani bilgileri bir önceki adımdan almasından “önceki (prior)” anlamında aprioridir. Apriori Algoritması 4
  • 5. Temel Yaklaşım • Öğe kümesi (itemset) – Bir veya daha çok öğeden oluşan küme – k-öğe kümesi (k-itemset): k öğeden oluşan küme • 3-öğe kümesi: {Bal, Süt, Ekmek} • Bu algoritmada temel yaklaşım, “eğer k-öğe kümesi minimum destek kriterini sağlıyorsa, bu kümenin alt kümeleri de minimum destek kriterini sağlar. ” şeklindedir. Apriori Algoritması 5
  • 6. Destek ve Güven Kriterleri • Birliktelik Kuralında, öğeler arasındaki birliktelik, destek ve güven kriterleri ile hesaplanır. • Destek (support) kriteri, veride öğeler arasındaki bağıntının ne kadar sık olduğunu belirtir. • X ve Y farklı ürünler olmak üzere, – X ürünü için destek, tüm alışverişler içinde X ürününün oranıdır. – X ve Y ürünleri için destek, X ve Y’ nin bir arada tüm alışverişler içinde bulunma olasılığıdır. Apriori Algoritması 6
  • 7. Destek ve Güven Kriterleri • Güven (confidence) kriteri ise Y ürününün hangi olasılıkla X ürünü ile beraber olacağını söyler. • Elde edilen kuralların güvenirliliği, destek ve güven değerleri ile doğru orantılıdır. Apriori Algoritması 7
  • 8. Destek ve Güven Kriterleri • Her kural bir destek ve güven değeri ile ifade edilir. • A⇒B ⇒ [destek = 2%, güven = 60%] • Birliktelik kuralı için 2% destek değeri, analiz edilen tüm alışverişlerden 2%’sinde A ile B ürünlerinin birlikte satıldığını belirtir. • 60% oranındaki güven değeri ise A ürününü satın alan müşterilerin 60%’ının aynı alışverişte B ürününü de satın aldığını gösterir. Apriori Algoritması 8
  • 9. Algoritmanın Adımları 1. Minimum destek sayısı (min.support ) ve minimum güven değerinin (min.confidence) belirlenmesi 2. Öğe kümeler içerisindeki her bir öğenin destek değerinin bulunması 3. Minimum destek değerinden daha düşük desteğe sahip olan öğelerin devre dışı bırakılması 4. Elde edilen tekli birliktelikler dikkate alınarak ikili birlikteliklerin oluşturulması 5. Minimum destek değerinden düşük olan öğe kümelerin çıkartılması 6. Üçlü birlikteliklerin oluşturulması 7. Üçlü birlikteliklerden minimum destek değerini geçenlerin dışındakilerin çıkarılması 8. Üçlü birlikteliklerden birliktelik kurallarının çıkarılması Apriori Algoritması 9
  • 10. Uygulama Alanları • Eğitim • Tıp • Mühendislik • Finans • Telekomünikasyon • Pazarlama • Bankacılık • E-Ticaret • … Apriori Algoritması 10
  • 11. Kaynaklar • Karabatak M. ve İnce M.C., Apriori Algoritması ile Öğrenci Başarısı Analizi. • Şen F., 2008, Veri Madenciliği ile Birliktelik Kurallarının Bulunması, Sakarya Üniversitesi. • Yıldız E., 2011, ASP.NET ile Kitap Takas Sitesi ve Birliktelik Kuralları ile Kitap Önerileri Oluşturma Sistemi, Kocaeli Üniversitesi. • Takçı H., 2008, Birliktelik Kuralları: Temel Kavramlar ve Algoritmalar. • Altıntop Ü., 2006, Internet Tabanlı Öğretimde Veri Madenciliği Tekniklerinin Uygulanması, Kocaeli Üniversitesi. • Özseven T. ve Düğenci M., 2011, LOG Analiz: Erişim Kayıt Dosyaları Analiz Yazılımı ve GOP Üniversitesi Uygulaması, Bilişim Teknolojileri Dergisi, 4(2). • Döşlü A., 2008, Veri Madenciliğinde Market Sepet Analizi ve • Birliktelik Kurallarının Belirlenmesi, Yıldız Teknik Üniversitesi. Apriori Algoritması 11