1. Dokumen ini memberikan penjelasan tentang pengenalan dataset bunga iris dan perintah dasar untuk mengeksplorasi dan mevisualisasikan dataset tersebut di R.
2. Dataset bunga iris digunakan sebagai contoh untuk mempelajari cara menganalisis dataset melalui perintah-perintah dasar seperti mengetahui dimensi, nama label, isi data, visualisasi dan korelasi antar variabel.
3. Siswa diajak untuk mempraktekkan perintah-perintah
1 of 24
Downloaded 40 times
More Related Content
Introduction to Data Mining with Rstudio
1. +
Introduction to Data Mining with R and Data
Import/Export in R
linkedin.com/in/apakabarnizam
2. +
R is a free software environment for
statistical computing and graphics.
Apa itu R?
R can be easily extended with 4,728
packages available on CRAN.
Many other packages provided, such
as on GitHub.
3. +
R is widely used in both academia
and industry.
Kenapa memakai R?
R is ranked no. 1 again in the
KDnuggets 2013 poll on Top
Languages for analytics, data mining,
data science.
The CRAN Task Views 8 provide
collections of packages for different
tasks, such as clustering, estimation.
5. +
#01
#02
PERINTAH DASAR MENENTUKAN TEMPAT PENYIMPANAN DATA
setwd( )
perintah tempat penyimpanan data pada osx
contoh:
setwd("~/Dropbox/Rstudio/social-media-workshop/dataset/beta1")
setwd( )
perintah tempat penyimpanan data pada windows
contoh:
setwd(D:DropboxRstudiosocial-media-workshopdatasetbeta1)
6. +
Save( )
perintah save data dgn format .Rdata
contoh:
save(x, 鍖le= ")
#01
#02
PERINTAH DASAR SAVE DAN LOAD .RDATA
load( )
perintah load data dgn format .Rdata
contoh:
load( ")
#03rm( )
perintah u/ menghapus data pada workspace
contoh:
rm(x)
7. +
#01
#02
LATIHAN, TULIS PERINTAH DIBAWA INI PADA RSCRIPT.
Cara membaca script (dgn perumpamaan):
line 1, jika nanti saya memiliki data tolong simpan di folder ini.
line 2, x adalah sebuah kumpulan data dari angka 1 sampai 10.
line 3, tolong save data saya ya.
line 4, tolong hapus data dengan nama label x
line 5, tolong load data yang sudah saya simpan.
line 6, perlihatkan kumpulan data pada label x
8. +
write.csv( )
perintah export data dgn format .csv
contoh:
save(x, 鍖le=dataperternakan.csv)
#01
#02
PERINTAH DASAR IMPORT DAN IMPORT .CSV
read.csv( )
perintah import data dgn format .csv
contoh:
load(dataperternakan.csv)
#03data.frame( )
perintah u/ membuat values/beberapa tabel menjadi 1 鍖le
contoh:
data.frame(nomortable, stokhewan, jenishewan)
9. +
#01
#02
LATIHAN, TULIS PERINTAH DIBAWA INI PADA RSCRIPT.
Cara membaca script (dgn perumpamaan):
line 1, buatkan nomor dengan angka 1 sampai 5 pada label nomortable
line 2, isikan angka 20, 30, 4, 15, dan 2 pada label stokhewan
line 3, isikan ayam, bebek, kuda, burung, beruang pada label jenishewan
line 4, tolong satukan data pada line 1-3 (bahasa lainnya, buatkan struktur data
dengan isian nomortable, stokhewan, jenis hewan)
line 5, tunjukan dataperternakan.
line 6, tolong simpan data tersebut dengan format csv.
10. 55%
55%
55%
55%
untuk anda yg duduk di
kanan
TUGAS LATIHAN LAB 3.1
untuk anda yg duduk di
Kiri
Anda diperbolehkan bekerjasama untuk saling membantu teman anda.
12. +
Bunga iris, merupakan tumbuhan yang
berasal dari Jepang. Biasa ditanam
sebagai tumbuhan hias karena
bunganya yang indah.
Bunga iris, memiliki beberapa sub jenis
seperti: versicolour, virginica, setosa.
kita akan menggunakan dataset bunga
iris sebagai latihan pada lab hari ini.
PERNAH MENDENGAR BUNGA IRIS?
13. +
#01
#02
PERINTAH DASAR UNTUK MELIHAT/MENGENAL DATA
dim(namadataset)
perintah untuk melihat dimensi pada dataset
contoh:
dim(iris)
output:
names(namadaset)
perintah mengetahui nama-nama label pd dataset
contoh:
names(iris)
output:
Jumlah label
jumlah data dalam dataset
14. +
#01
#02
PERINTAH DASAR UNTUK MELIHAT LEBIH DETAIL DATASET
#03
str(namadataset)
perintah untuk mengetahui secara detail dimensi
pada dataset, output yang akan muncul juga beserta
nama label dan isiian data yg ada di dalam label.
contoh:
str(iris)
head(namadataset)
perintah untuk melihat isian data pada suatu label,
dengan cara melihat dr sudut 6 data paling atas.
contoh:
head(iris)
tail(namadataset)
perintah untuk melihat isian data pada suatu label,
dengan cara melihat dr sudut 6 data paling bawah.
contoh:
tail(iris)
15. +
#01
#02
PERINTAH DASAR UNTUK MELIHAT/MENGENAL DATA
summary(namadataset)
perintah untuk mengetahui nilai minumum, maximum,
rata-rata, angka yg sering muncul, quartiles dari setiap
label yg memiliki angka didalamnya.
contoh:
summary(iris)
var(namadataset$namalabel)
perintah untuk menghitung variasi dari satu label.
contoh:
var(iris$Sepal.Length))
16. +
#01
#02
PERINTAH DASAR UNTUK MELIHAT/MENGENAL DATA
cov(iris[,1:4])
perintah untuk mengukur varians dari satu dataset.
contoh:
cor(iris$Sepal.Length, iris$Petal.Length)
cor(namadataset$namalabelX, namadataset$namalabelY)
perintah untuk mengukur korelasi antara variabel x dan y.
contoh:
cor(iris$Sepal.Length, iris$Petal.Length)
17. +
#01
#02
PERINTAH DASAR MEMVISUALISASIKAN DATASET
plot(density(namadataset$namalabel))
perintah untuk melihat penyebaran angka dalam
bentuk visual.
contoh:
plot(density(iris$Sepal.Length))
hist(namadataset$namalabel)
perintah untuk melihat penyebaran data
dlm bentuk histogram.
contoh:
hist(iris$Sepal.Length)
18. +
#01
#02
PERINTAH DASAR MEMVISUALISASIKAN DATASET
With(namadataset, plot(labelX, labelY, col=namakategori, pch=as.numeric(namakaetgori)
perintah untuk memvisualisakan penyebaran angka yg ada di dalam dataset.
contoh:
with(iris, plot(Sepal.Length, Sepal.Width, col=Species, pch=as.numeric(Species)))
qplot(namalabelX, namalabelY, data=namadataset, facets=namakategori ~.)
perintah untuk memvisualisasikan penyebaran angka tergantung dari nama kategori
contoh:
qplot(Sepal.Length, Sepal.Width, data=iris, facets=Species ~.)
19. Buatkan Rscript dan dataset .csv kartu keluarga
dari web:
bit.ly/kartukeluargakotabandung
dikumpulkan H-2 sebelum kelas bigdata ke
bit.ly/yaampuntugasbigdata
Penamaan 鍖le
harikelasbigdata_jammasuk_pekerjaan31_noabsenlab
contoh:
senin_0930_pekerjaan31_20.csv
senin_0930_pekerjaan32_20.rscript
PEKERJAAN RUMAH 31
20. Dalam website dinas kependudukan terdapat 30
kecamatan di kota Bandung.
Jika absen anda di nomor 5, berarti anda
mengerjakan tugas dimulai dengan urutan 5.
maka dimulai dengan kecamatan Babakan ciparay,
Bandung kidul, Bandung kulon dan seterusnya.
Jika Absen anda di nomor 3, berarti anda
mengerjakan tugas dimulai dengan urutan 3.
maka dimulai dengan kecamatan Arcamanik,
Astana Anyar, Babakan Ciparay dan seterusnya.
ATURAN MENGERJAKAN PEKERJAAN RUMAH 31
21. Jika Absensi anda di nomor 31-seterusnya, maka
mengulang dari urutan nomor 1 kecamatan
dalam membuat tugas tetapi data dalam Jumlah
KK ditambah angka 2000.
Anda cukup membuat 10 data kecamatan saja
untuk membuat dataset. (tidak perlu membuat
30 data kecamatan).
List Label yang harus ada dalam dataset.csv yaitu:
Kecamatan, Jumlah KK dan percentase. sisanya
tidak harus ada dalam dataset.
ATURAN MENGERJAKAN PEKERJAAN RUMAH 31
23. +
Jika anda sudah mempunyai dropbox
silahkan maju ke depan, untuk di invite
ke group dropbox bigdata, oleh kami.
Jika anda belum memiliki account
dropbox silahkan klik link dibawah ini:
bit.ly/daftarduludropbox
SAATNYA MENG-INVITE ANDA KE DROPBOX
24. +
#01 #02 #03
Delete 鍖le tugas
yang anda telah
buat di mac lab
Pastikan mouse
dan keyboard
sudah dlm kondisi
mati
Matikan Mac Lab,
agar hemat energi
YANG ANDA HARUS LAKUKAN SEBELUM PULANG
linkedin.com/in/apakabarnizam