際際滷

際際滷Share a Scribd company logo
Konsep Data Mining
VISUALISASI
Visualisasi adalah konversi data ke dalam format
visual atau tabel sehingga karakteristik dari data dan
relasi diantara item data atau atribut dapat di analisis
atau dilaporkan
Visualisasi data adalah satu dari yang teknik paling baik
dan menarik untuk eksplorasi data
Manusia memiliki kemampuan membangun yang baik
untuk menganalisis sejumlah besar informasi yang
dipresentasi secara visual
Ia dapat mendeteksi pola umum dan trend, pencilan dan
pola yang tidak umum
Konsep Data Mining
Gambar berikut ini menunjukkan suhu
permukaan laut pada bulan Juli tahun 1982
Sepuluh dari ribuan titik data diringkas dalam
satu gambar
Konsep Data Mining
Representasi
Representasi adalah pemetaan informasi menjadi
format visual
Objek data, atribut-atributnya dan relasi diantara
objek-objek data diterjemahkan ke dalam elemen
grafis seperti titik, garis, bentuk-bentuk tertentu dan
warna
Contoh :
Objek-objek sering direpresentasikan sebagai titik
Nilai atribut-atributnya dapat direpresentasikan sebagai posisi dari
titik-titik atau karakteristik dari titik sebagai contoh warna, ukuran
dan bentuk
Jika posisi di gunakan, maka relasi pada titik , apakah terbentuk
dalam group atau sebuah titik pencilan, dapat dengan mudah dilihat
Konsep Data Mining
Penyusunan/Arrangement
Adalah penempatan elemen-elemen visual
diantara
Dapat membuat perbedaan besar mengenai
bagaimana mudahnya untuk memahami data
Konsep Data Mining
Seleksi
Seleksi adalah : eliminasi atau penekanan kembali
dari beberapa objek tertentu dan atribut-atribut
Seleksi juga merupakan pemilihan subset dari atribut
 Reduksi secara dimensi sering digunakan untuk mengurangi jumlah
dimensi menjadi 2 atau 3 dimensi
 Alternatifnya, sepasang atribut dapat dipertimbangkan
Seleksi dapat juga merupakan pemilihan subset dari objek
 Sebagian wilayah dari layar hanya dapat menunjukkan
banyak titik
Konsep Data Mining
Teknik Visualisasi : Histogram
Histogram
Biasanya menunjukkan distribusi dari nilai dari variabel tunggal
Histogram membagi nilai ke dalam bin dan menunjukkan batang plot dari
sejumlah objek dalam setiap bin
Tinggi dari setiap batang menunjukkan jumlah dari objek
Bentuk histogram tergantung dari jumlah bin
Contoh : lebar mahkota (10 dan 20 bin)
Konsep Data Mining
Histogram dua dimensi
Histogram jenis ini menunjukkan distribusi
gabungan nilai-nilai dari atribut
Contoh : lebar mahkota dan panjang mahkota
Apa yang
ingin
disampaikan
oleh gambar
di samping
ini ?
Konsep Data Mining
Teknik visualisasi : Box Plots
outlier
10th
percentile
25th
percentile
75th
percentile
50th
percentile
10th
percentile
Box plots
Ditemukan oleh J. Tukey
Box plot merupakan cara alternatif untuk menggambarkan
distribusi data
Gambar berikut ini menunjukkan bagian dasar dari box plot
Konsep Data Mining
Contoh Box Plot
Box plot dapat digunakan untuk membandingkan
atribut
Konsep Data Mining
Teknik Visualisasi : Scatter Plots
Scatter plot
Scatter plot merupakan nilai-nilai atribut yang menentukan posisi
Scatter plot dua dimensi adalah bentuk yang paling umum, tapi dapat
juga dibuat dalam scatter plot tiga dimensi
Kadangkala atribut tambahan dapat digambarkan dengan menggunakan
ukuran, bentuk dan warna dari tanda yang mewakili objek
Akan sangat berguna jika kita memiliki array dari scatter plot yang
secara terpadu merangkum hubungan dari beberapa pasang atribut
Lihat contoh pada slide berikut
Konsep Data Mining
Array Scatter Plot dari atribut Iris
Konsep Data Mining
Teknik visualisasi : contour plots
Contour plots
 Contour plots berguna jika atribut kontinu diukur dengan garis
 Contour plot membagi ke dalam daerah-daerah yang nilainya sama
 Garis contour yang membentuk batas dari daerah/wilayah
menghubungkan titik-titik dengan nilai yang sama
 Contoh yang paling umum adalah contour maps of elevation
 Contour plots juga menggambarkan suhu, curah hujan, tekanan
udara dsb.
Sbg contoh : adalah Sea Surface Temperature (SST) pada slide
berikut
Konsep Data Mining
Contoh Contour Plot : Sea Surface Temperature
December 1998
Celsius
Konsep Data Mining
Teknik visualisasi : Matrix Plots
Matrix Plot :
 dapat menempatkan/plot data matriks
 Matriks plot ini dapat berguna pada saat objek diurut
menurut kelas
 Biasanya, atribut-atribut dinormalisasikan untuk
mencegah satu atribut dari dominasi plot
 Plot dari kesamaan atau jarak matriks dapat juga
menjadi berguna untuk menggambarkan hubungan diantara objek-
objek
 Contoh matriks plot dapat dilihat pada slide berikut
Konsep Data Mining
standard
deviation
Visualisasi dari Matriks Data Iris
Konsep Data Mining
Visualisasi dari Matriks korelasi Iris
Konsep Data Mining
Teknik visualisasi : Koordinat paralel
Koordinat paralel
Berguna untuk menempatkan nilai atribut dari data dimensi tinggi
Daripada menggunakan perpendicular axes, maka digunakan
parallel axes
Nilai atribut untuk setiap objek di-plot sebagai titik pada setiap sumbu
koordinat yang berhubungan dan titik-titik dihubungkan dengan garis
Kemudian, setiap objek direpresentasikan sebagai garis
Seringkali, garis merepresentasikan kelas yang berbeda dari group objek
bersama, paling tidak untuk beberapa atribut
Pengurutan atribut adalah penting mengingat kondisi pengelompokan
(group) seperti di atas
Konsep Data Mining
Plot Koordinat Paralel untuk data Iris
Konsep Data Mining
Teknik Visualisasi lainnya
Star Plots
Chernoff Faces
Teknik visualisasi dengan star plot pendekatannya sama dengan
koordinat paralel, namun sumbu menyebar dari titik tengah
Garis yang menghubungkan nilai dari objek disebut dengan poligon
Pendekatan dengan chernoff faces diciptakan oleh Herman chernoff
Pendekatan ini berasosiasi dengan setiap atribut dengan karakteristik
dari setiap wajah
Nilai dari setiap atribut menentukan penampakan dari hubungan
karakteristik wajah
Setiap objek menjadi wajah yang terpisah
Chernoff faces ini tergantung pada kemampuan manusia dalam
membedakan beberapa wajah
Konsep Data Mining
Star Plots untuk Data Iris
Setosa
Versicolour
Virginica
Konsep Data Mining
Chernoff Faces untuk Data Iris
Setosa
Versicolour
Virginica

More Related Content

20731 21 visualisasi data

  • 1. Konsep Data Mining VISUALISASI Visualisasi adalah konversi data ke dalam format visual atau tabel sehingga karakteristik dari data dan relasi diantara item data atau atribut dapat di analisis atau dilaporkan Visualisasi data adalah satu dari yang teknik paling baik dan menarik untuk eksplorasi data Manusia memiliki kemampuan membangun yang baik untuk menganalisis sejumlah besar informasi yang dipresentasi secara visual Ia dapat mendeteksi pola umum dan trend, pencilan dan pola yang tidak umum
  • 2. Konsep Data Mining Gambar berikut ini menunjukkan suhu permukaan laut pada bulan Juli tahun 1982 Sepuluh dari ribuan titik data diringkas dalam satu gambar
  • 3. Konsep Data Mining Representasi Representasi adalah pemetaan informasi menjadi format visual Objek data, atribut-atributnya dan relasi diantara objek-objek data diterjemahkan ke dalam elemen grafis seperti titik, garis, bentuk-bentuk tertentu dan warna Contoh : Objek-objek sering direpresentasikan sebagai titik Nilai atribut-atributnya dapat direpresentasikan sebagai posisi dari titik-titik atau karakteristik dari titik sebagai contoh warna, ukuran dan bentuk Jika posisi di gunakan, maka relasi pada titik , apakah terbentuk dalam group atau sebuah titik pencilan, dapat dengan mudah dilihat
  • 4. Konsep Data Mining Penyusunan/Arrangement Adalah penempatan elemen-elemen visual diantara Dapat membuat perbedaan besar mengenai bagaimana mudahnya untuk memahami data
  • 5. Konsep Data Mining Seleksi Seleksi adalah : eliminasi atau penekanan kembali dari beberapa objek tertentu dan atribut-atribut Seleksi juga merupakan pemilihan subset dari atribut Reduksi secara dimensi sering digunakan untuk mengurangi jumlah dimensi menjadi 2 atau 3 dimensi Alternatifnya, sepasang atribut dapat dipertimbangkan Seleksi dapat juga merupakan pemilihan subset dari objek Sebagian wilayah dari layar hanya dapat menunjukkan banyak titik
  • 6. Konsep Data Mining Teknik Visualisasi : Histogram Histogram Biasanya menunjukkan distribusi dari nilai dari variabel tunggal Histogram membagi nilai ke dalam bin dan menunjukkan batang plot dari sejumlah objek dalam setiap bin Tinggi dari setiap batang menunjukkan jumlah dari objek Bentuk histogram tergantung dari jumlah bin Contoh : lebar mahkota (10 dan 20 bin)
  • 7. Konsep Data Mining Histogram dua dimensi Histogram jenis ini menunjukkan distribusi gabungan nilai-nilai dari atribut Contoh : lebar mahkota dan panjang mahkota Apa yang ingin disampaikan oleh gambar di samping ini ?
  • 8. Konsep Data Mining Teknik visualisasi : Box Plots outlier 10th percentile 25th percentile 75th percentile 50th percentile 10th percentile Box plots Ditemukan oleh J. Tukey Box plot merupakan cara alternatif untuk menggambarkan distribusi data Gambar berikut ini menunjukkan bagian dasar dari box plot
  • 9. Konsep Data Mining Contoh Box Plot Box plot dapat digunakan untuk membandingkan atribut
  • 10. Konsep Data Mining Teknik Visualisasi : Scatter Plots Scatter plot Scatter plot merupakan nilai-nilai atribut yang menentukan posisi Scatter plot dua dimensi adalah bentuk yang paling umum, tapi dapat juga dibuat dalam scatter plot tiga dimensi Kadangkala atribut tambahan dapat digambarkan dengan menggunakan ukuran, bentuk dan warna dari tanda yang mewakili objek Akan sangat berguna jika kita memiliki array dari scatter plot yang secara terpadu merangkum hubungan dari beberapa pasang atribut Lihat contoh pada slide berikut
  • 11. Konsep Data Mining Array Scatter Plot dari atribut Iris
  • 12. Konsep Data Mining Teknik visualisasi : contour plots Contour plots Contour plots berguna jika atribut kontinu diukur dengan garis Contour plot membagi ke dalam daerah-daerah yang nilainya sama Garis contour yang membentuk batas dari daerah/wilayah menghubungkan titik-titik dengan nilai yang sama Contoh yang paling umum adalah contour maps of elevation Contour plots juga menggambarkan suhu, curah hujan, tekanan udara dsb. Sbg contoh : adalah Sea Surface Temperature (SST) pada slide berikut
  • 13. Konsep Data Mining Contoh Contour Plot : Sea Surface Temperature December 1998 Celsius
  • 14. Konsep Data Mining Teknik visualisasi : Matrix Plots Matrix Plot : dapat menempatkan/plot data matriks Matriks plot ini dapat berguna pada saat objek diurut menurut kelas Biasanya, atribut-atribut dinormalisasikan untuk mencegah satu atribut dari dominasi plot Plot dari kesamaan atau jarak matriks dapat juga menjadi berguna untuk menggambarkan hubungan diantara objek- objek Contoh matriks plot dapat dilihat pada slide berikut
  • 16. Konsep Data Mining Visualisasi dari Matriks korelasi Iris
  • 17. Konsep Data Mining Teknik visualisasi : Koordinat paralel Koordinat paralel Berguna untuk menempatkan nilai atribut dari data dimensi tinggi Daripada menggunakan perpendicular axes, maka digunakan parallel axes Nilai atribut untuk setiap objek di-plot sebagai titik pada setiap sumbu koordinat yang berhubungan dan titik-titik dihubungkan dengan garis Kemudian, setiap objek direpresentasikan sebagai garis Seringkali, garis merepresentasikan kelas yang berbeda dari group objek bersama, paling tidak untuk beberapa atribut Pengurutan atribut adalah penting mengingat kondisi pengelompokan (group) seperti di atas
  • 18. Konsep Data Mining Plot Koordinat Paralel untuk data Iris
  • 19. Konsep Data Mining Teknik Visualisasi lainnya Star Plots Chernoff Faces Teknik visualisasi dengan star plot pendekatannya sama dengan koordinat paralel, namun sumbu menyebar dari titik tengah Garis yang menghubungkan nilai dari objek disebut dengan poligon Pendekatan dengan chernoff faces diciptakan oleh Herman chernoff Pendekatan ini berasosiasi dengan setiap atribut dengan karakteristik dari setiap wajah Nilai dari setiap atribut menentukan penampakan dari hubungan karakteristik wajah Setiap objek menjadi wajah yang terpisah Chernoff faces ini tergantung pada kemampuan manusia dalam membedakan beberapa wajah
  • 20. Konsep Data Mining Star Plots untuk Data Iris Setosa Versicolour Virginica
  • 21. Konsep Data Mining Chernoff Faces untuk Data Iris Setosa Versicolour Virginica