1. A. Pendahuluan
Dalam kehidupan sehari-hari tanpa disadari sebenarnya kita sering membuat suatu kegiatan evaluasi
dan selalu menggunakan prinsip mengukur dan menilai. Namun, banyak orang belum memahami secara
tepat arti kata evaluasi, pengukuran, dan penilaian bahkan masih banyak orang yang lebih cenderung
mengartikan ketiga kata tersebut dengan suatu pengertian yang sama.
Secara umum orang hanya mengidentikkan kegiatan evaluasi sama dengan menilai, karena aktifitas
mengukur biasanya sudah termasuk didalamnya. Pengukuran, penilaian dan evaluasi merupakan
kegiatan yang bersifat hierarki. Artinya ketiga kegiatan tersebut tidak dapat dipisahkan satu sama lain
dan dalam pelaksanaannya harus dilaksanakan secara berurutan.
B. Pengertian Pengukuran, Penilaian, dan Evaluasi
Untuk memahami pengertian evaluasi, pengukuran dan penilaian kita dapat memahaminya lewat contoh
berikut :
1. Apabila ada seseorang yang memberikan kepada kita 2 pensil yang berbeda ukuran ,yang satu
panjang dan yang satu lebih pendek dan kita diminta untuk memilihnya, maka otomatis kita akan
cenderung memilih pensil yang panjang karena akan bisa lebih lama digunakan. Kecuali memang
ada kriteria lain sehingga kita memilih sebaliknya.
2. Peristiwa menjual dan membeli di pasar. Kadang kala sebelum kita membeli durian di pasar, sering
kali kita membandingkan terlebih dahulu durian yang ada sebelum membelinya. Biasanya kita akan
mencium, melihat bentuknya, jenisnya ataupun tampak tangkai yang ada pada durian tersebut untuk
mengetahui durian manakah yang baik dan layak dibeli.
Dari kedua contoh diatas maka dapat kita simpulkan bahwa kita selalu melakukan penilaian sebelum
menentukan pilihan untuk memilih suatu objek/benda. Pada contoh pertama kita akan memilih pensil
yang lebih panjang dari pada pensil yang pendek karena pensil yang lebih panjang dapat kita gunakan
lebih lama. Sedangkan pada contoh yang kedua kita akan menentukan durian mana yang akan kita beli
berdasarkan bau, bentuk, jenis, ataupun tampak tangkai dari durian yang dijual tersebut. Sehingga kita
dapat memperkirakan mana durian yang manis.
Untuk mengadakan penilaian, kita harus melakukan pengukuran terlebih dahulu. Dalam contoh 1 diatas,
jika kita mempunyai pengaris, maka untuk menentukan pensil mana yang lebih panjang maka kita akan
mengukur kedua pensil tersebut dengan menggunakan pengaris kemudian kita akan melakukan
penilaian dengan membandingkan ukuran panjang dari masing-masing penggaris sehingga pada
akhirnya kita dapat mengatakan bahwa Yang ini panjang dan Yang ini pendek lalu yang panjanglah
yang kita ambil.
Dalam contoh yang ke 2, kita memilih durian yang terbaik lewat bau, tampak tangkai, maupun jenisnya.
Hal itu juga diawali dengan proses pengukuran dimana kita membanding-bandingkan beberapa durian
yang ada sekalipun tidak menggunakan alat ukur yang paten tetapi berdasarkan pengalaman. Barulah
kita melakukan penilaian mana durian yang terbaik berdasarkan ukuran yang kita tetapkan yang akan
dibeli.
2. Dari hal ini kita dapat mengetahui bahwa dalam proses penilaian kita menggunakan 3 ukuran, yakni
ukuran baku (meter, kilogram, takaran, dan sebagainya), ukuran tidak baku (depa, jengkal, langkah, dan
sebagainya) dan ukuran perkiraan yakni berdasarkan pengalaman.
Langkah langkah mengukur kemudian menilai sesuatu sebelum kita mengambilnya itulah yang
dinamakan mengadakan evaluasi yakni mengukur dan menilai. Kita tidak dapat mengadakan evaluasi
sebelum melakukan aktivitas mengukur dan menilai.
Berdasarkan contoh diatas dapat kita simpulkan pengertian pengukuran, penilaian, dan evaluasi sebagai
berikut :
Pengukuran adalah kegiatan membandingkan sesuatu dengan ukuran tertentu dan bersifat kuantitatif.
Penilaian adalah kegiatan mengambil keputusan untuk menentukan sesuatu berdasarkan kriteria baik
buruk dan bersifat kualitatif. Sedangkan
Evaluasi adalah kegiatan yang meliputi pengukuran dan penilaian
C. Evaluasi dalam Pendidikan
Secara harafiah evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian atau penaksiran
(John M. Echols dan Hasan Shadily: 1983). Menurut Stufflebeam, dkk (1971) mendefinisikan evaluasi
sebagai The process of delineating, obtaining, and providing useful information for judging decision
alternatives. Artinya evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikan
informasi yang berguna untuk merumuskan suatu alternatif keputusan.
Evaluasi menurut Kumano (2001) merupakan penilaian terhadap data yang dikumpulkan melalui kegiatan
asesmen. Sementara itu menurut Calongesi (1995) evaluasi adalah suatu keputusan tentang nilai
berdasarkan hasil pengukuran. Sejalan dengan pengertian tersebut, Zainul dan Nasution (2001)
menyatakan bahwa evaluasi dapat dinyatakan sebagai suatu proses pengambilan keputusan dengan
menggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakan
instrumen tes maupun non tes.
Secara garis besar dapat dikatakan bahwa evaluasi adalah pemberian nilai terhadap kualitas sesuatu.
Selain dari itu, evaluasi juga dapat dipandang sebagai proses merencanakan, memperoleh, dan
menyediakan informasi yang sangat diperlukan untuk membuat alternatif-alternatif keputusan. Dengan
demikian, Evaluasi merupakan suatu proses yang sistematis untuk menentukan atau membuat
keputusan sampai sejauhmana tujuan-tujuan pengajaran telah dicapai oleh siswa (Purwanto, 2002).
Arikunto (2003) mengungkapkan bahwa evaluasi adalah serangkaian kegiatan yang ditujukan untuk
mengukur keberhasilan program pendidikan. Tayibnapis (2000) dalam hal ini lebih meninjau pengertian
evaluasi program dalam konteks tujuan yaitu sebagai proses menilai sampai sejauhmana tujuan
pendidikan dapat dicapai.
Berdasarkan tujuannya, terdapat pengertian evaluasi sumatif dan evaluasi formatif. Evaluasi formatif
dinyatakan sebagai upaya untuk memperoleh feedback perbaikan program, sementara itu evaluasi
sumatif merupakan upaya menilai manfaat program dan mengambil keputusan (Lehman, 1990).
3. D. Penilaian Dalam Pendidikan
Penilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat penilaian untuk
memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau ketercapaian kompetensi
(rangkaian kemampuan) peserta didik. Penilaian menjawab pertanyaan tentang sebaik apa hasil atau
prestasi belajar seorang peserta didik.Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratif
dalam kata-kata) dan nilai kuantitatif (berupa angka). Pengukuran berhubungan dengan proses pencarian
atau penentuan nilai kuantitatif tersebut.
Penilaian hasil belajar pada dasarnya adalah mempermasalahkan, bagaimana pengajar (guru) dapat
mengetahui hasil pembelajaran yang telah dilakukan. Pengajar harus mengetahui sejauh mana pebelajar
(learner) telah mengerti bahan yang telah diajarkan atau sejauh mana tujuan/kompetensi dari kegiatan
pembelajaran yang dikelola dapat dicapai. Tingkat pencapaian kompetensi atau tujuan instruksional dari
kegiatan pembelajaran yang telah dilaksanakan itu dapat dinyatakan dengan nilai.
E. Pengukuran dalam pendidikan
Pengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya terhadap suatu standar
atau satuan pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi juga dapat
diperluas untuk mengukur hampir semua benda yang bisa dibayangkan, seperti tingkat ketidakpastian,
atau kepercayaan konsumen.
Pengukuran adalah proses pemberian angka-angka atau label kepada unit analisis untuk
merepresentasikan atribut-atribut konsep. Proses ini seharusnya cukup dimengerti orang walau misalnya
definisinya tidak dimengerti. Hal ini karena antara lain kita sering kali melakukan pengukuran.
Menurut Cangelosi (1995) yang dimaksud dengan pengukuran (Measurement) adalah suatu proses
pengumpulan data melalui pengamatan empiris untuk mengumpulkan informasi yang relevan dengan
tujuan yang telah ditentukan. Dalam hal ini guru menaksir prestasi siswa dengan membaca atau
mengamati apa saja yang dilakukan siswa, mengamati kinerja mereka, mendengar apa yang mereka
katakan, dan menggunakan indera mereka seperti melihat, mendengar, menyentuh, mencium, dan
merasakan. Menurut Zainul dan Nasution (2001) pengukuran memiliki dua karakteristik utama yaitu: 1)
penggunaan angka atau skala tertentu; 2) menurut suatu aturan atau formula tertentu.
Measurement (pengukuran) merupakan proses yang mendeskripsikan performance siswa dengan
menggunakan suatu skala kuantitatif (system angka) sedemikian rupa sehingga sifat kualitatif dari
performance siswa tersebut dinyatakan dengan angka-angka (Alwasilah et al.1996). Pernyataan tersebut
diperkuat dengan pendapat yang menyatakan bahwa pengukuran merupakan pemberian angka terhadap
suatu atribut atau karakter tertentu yang dimiliki oleh seseorang, atau suatu obyek tertentu yang
mengacu pada aturan dan formulasi yang jelas. Aturan atau formulasi tersebut harus disepakati secara
umum oleh para ahli (Zainul & Nasution, 2001). Dengan demikian, pengukuran dalam bidang pendidikan
berarti mengukur atribut atau karakteristik peserta didik tertentu. Dalam hal ini yang diukur bukan peserta
didik tersebut, akan tetapi karakteristik atau atributnya. Senada dengan pendapat tersebut, Secara lebih
ringkas, Arikunto dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai kegiatan
membandingkan suatu hal dengan satuan ukuran tertentu sehingga sifatnya menjadi kuantitatif.
F. Perbedaan Evaluasi, Penilaian dan Pengukuran
4. Berdasarkan pengertian di atas dapat kita simpulkan bahwa penilaian adalah suatu proses untuk
mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar
baik yang menggunakan tes maupun nontes. Pengukuran adalah membandingkan hasil tes dengan
standar yang ditetapkan. Pengukuran bersifat kuantitatif. Sedangkan menilai adalah kegiatan mengukur
dan mengadakan estimasi terhadap hasil pengukuran atau membanding-bandingkan dan tidak sampai ke
taraf pengambilan keputusan.Penilaian bersifat kualitatif.
Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian masing-masing :
Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan nilai, kriteria-judgment
atau tindakan dalam pembelajaran.
Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan berbagai informasi secara
berkala, berkesinambungan, dan menyeluruh tentang proses dan hasil dari pertumbuhan dan
perkembangan yang telah dicapai oleh anak didik melalui program kegiatan belajar.
Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk menentukan kuantitas
sesuatu yang bersifat numerik. Pengukuran lebih bersifat kuantitatif, bahkan merupakan instrumen
untuk melakukan penilaian. Dalam dunia pendidikan, yang dimaksud pengukuran sebagaimana
disampaikan Cangelosi (1995: 21) adalah proses pengumpulan data melalui pengamatan empiris.
DAFTAR PUSTAKA
Alwasilah, et al. (1996). Glossary of educational Assessment Term. Jakarta: Ministry of Education and
Culture.
Arikunto, S & Jabar. 2004. Evaluasi Program Pendidikan. Jakarta: Bumi Aksara
Calongesi, J.S. 1995. Merancang Tes untuk Menilai Prestasi Siswa. Bandung : ITB
Kumano, Y. 2001. Authentic Assessment and Portfolio Assessment-Its Theory and Practice. Japan:
Shizuoka University.
Pengertian Non tes
Teknik penilaian non tes berarti tehnik penilaian dengan tidak menggunakan tes. Tehnik penilaian ini
umumnya untuk menilai kepribadian anak secara menyeluruh meliputi sikap, tingkah laku, sifat, sikap
sosial, ucapan, riwayat hidup dan lain-lain. Yang berhubungan dengan kegiatan belajar dalam
pendidikan, baik secara individu maupun secara kelompok. Alat penilaian non-test, yang biasanya
menyertai atau inheren dalam pelaksanaan proses belajar mengajar sangat banyak macamnya. Di
antaranya bisa disebutkan adalah angket (kuesioner), observasi, wawancara, sosiometri, checklist,
concept map, portfolio, student journal, pertanyaan-pertanyaan, dan sebagainya. Keberhasilan siswa
dalam proses belajar-mengajar tidak dapat diukur dengan alat tes. Sebab masih banyak aspek-aspek
5. kemampuan siswa yang sulit diukur secara kuantitatif dan mencakup objektifitas misalnya aspek
efektif psikomotor.
Jenis-jenis Instrument Non Tes
Berikut ini adalah beberapa instrument yang tergolong ke dalam non tes yaitu:
a. Kuesioner
Kuesioner juga sering dikenal sebagai angket. Pada dasarnya, quesioner adalah sebuah daftar
pertanyaan yang harus diisi oleh orang yang akan diukur (responden). Pada umumnya tujuan
penggunaan angket atau kuesioner dalam proses pembelajaran terutama adalah untuk memperoleh
data mengenai latar belakang peserta didik sebagai salah satu bahan dalam menganalisis tingkah laku
dan proses belajar mereka. Hal ini juga disampaikan oleh Yusuf (dalam Arniatiu, 2010) yang
menyatakan kuisioner adalah suatu rangkaian pertanyaan yang berhubungan dengan objek yang
dinilai dengan maksud untuk mendapatkan data atau inform.
Selain itu, data yang dihimpun melalui angket biasanya juga berupa data yang berkenaan dengan
kesulitan-kesulitan yang dihadapi oleh siswa dalam mengikuti pelajaran. Misalnya: cara belajar,
bimbingan guru dan orang tua, sikap belajar dan lain sebagainya.
Angket pada umumnya dipergunakan untuk menilai hasil belajar pada ranah afektif. Angket dapat
disajikan dalam bentuk pilihan ganda atau skala sikap.
Tujuan Pengembangan Kuesionar (Angket)
Adapun beberapa tujuan dari pengembangan angket adalah :
(1). Mengumpulkan informasi sebanyak mungkin dari siswa tentang pembelajaran matematika.
(2).Membimbing siswa untuk belajar efektif sampai tingkat penguasaan tertentu.
(3). Mendorong siswa untuk lebih kreatif dalam belajar.
(4). Membantu anak yang lemah dalam belajar.
(5).Untuk mengetahui kesulitan kesulitan siswa dalam pembelajaran matematika.
Jenis-jenis kuesioner (menurut Yusuf , dalam Artiatiu, 2010)
1. Kuesioner dari segi isi dapat dibedakan atas 4 bagian yaitu:
Pertanyaan fakta adalah pertanyaan yang menanyakan tentang fakta antara lain seperti
jumlah sekolah, jumlah jam belajar, dll.
Pertanyaan perilaku adalah apabila guru menginginkan tingkah laku seseorang siswa dalam
kegiatan di sekolah atau dalam proses belajar mengajar.
Pertanyaan informasi adalah apabila melalui instrument itu guru ingin mengungkapkan
berbagai informasi atau menggunakan fakta.
Pertanyaan pendapat dan sikap adalah kuesioner yang berkaitan dengan perasaan,
kepercayaan predisposisi, dan nilai-nilai yang berhubungan dengan objek yang dinilai.
2. Kuesioner dari jenisnya dapat dibedakan atas 3 yaitu :
6. Tertutup, kuesioner yang alternative jawaban sudah ditentukan terlebih dahulu. Responden
hanya memilih diantara alternative yang telah disediakan.
Terbuka, kuesioner ini memberikan kesempatan pada siswa untuk mengemukakan pendapatnya
tentang sesuatu yang ditanyakan sesuai dengan pandangan dan kemampuannya. Alternative
jawaban tidak disediakan. Mereka menciptakan sendiri jawabannya dan menyusun kalimat dalam
bahasa sendiri
Tertutup dan terbuka, kuesioner ini merupakan gabungan dari kedua bentuk yang telah
dibicarakan. Yang berarti bahwa dalam bentuk ini, disamping disediakan alternative, diberi juga
kesempatan keoada siswa/mahasiswa untuk mengemukakan alternative jawabannya sendiri,
apabila alternative yang disediakan tidak sesuai dengan keadaan yang bersangkutan.
3. Kuesioner dari segi yang menjawab dapat dibedakan atas 2, yaitu :
Kuesioner langsung, yaitu kuesioner yang langsung dijawab/diisi oleh individu yang akan diminta
keterangannya.
Kuesioner tidak langsung, yaitu kuesioner yang diisi oleh orang lain, (orang yang tidak diminta
keterangannya).
4. Kuesioner dari sisi bagaimana kuesioner itu diadministrasikan pada responden dapat
dibedakan atas 2, yaitu :
Kuesioner yang dikirimkan (Mail Questionaire)
Kuesioner yang dapat dibagikan langsung pada responden.
Kelebihan dan Kekurangan Angket
Ada beberapa hal yang menjadi kelebihan angket sebagai instrument evaluasi, diantaranya yaitu:
(1). Dengan angket kita dapat memperoleh data dari sejumlah anak yang banyak yang hanya
membutuhkan waktu yang sigkat.
(2). Setiap anak dapat memperoleh sejumlah pertanyaan yang sama
(3). Dengan angket anak pengaruh subjektif dari guru dapat dihindarkan
Sedangkan kelemahan angket, antara lain:
(1). Pertanyaan yang diberikan melalui angket adalah terbatas, sehingga apabila ada hal-hal yang
kurang jelas maka sulit untuk diterangkan kembali
(2). Kadang-kadang pertanyaan yang diberikan tidak dijawab oleh semua anak, atau mungkin dijawab
tetapi tidak sesuai dengan kenyataan yang sebenarnya. Karena anak merasa bebas menjawab dan
tidak diawasi secara mendetail.
(3). Ada kemungkinan angket yang diberikan tidak dapat dikumpulkan semua, sebab banyak anak
yang merasa kurang perlu hasil dari angket yang diterima, sehingga tidak memberikan kembali
angketnya.
Langkah-langkah Pengembangan Angket
Adapun cara penyusunan atau pengembangan angket adalah sebagai berikut:
(1). Merumuskan tujuan
7. (2). Merumuskan kegiatan
(3). Menyusun langkah-langkah
(4). Menyusun kisi-kisi
(5). Menyusun panduan angket
(6). Menyusun alat penilaian
b. Pengamatan (observation)
Pengamatan observasi adalah suatu tehnik yang dilakukan dengan cara mengadakan pengamatan
secara teliti serta pencatatan secara sistematis terhadap fenomena-fenomena yang dijadikan objek
pengamatan
Observasi sebagai alat evaluasi banyak digunakan untuk menilai tingkahlaku individu atau proses
terjadinya suatu kegiatan yang dapat diamati. Observasi yang dapat menilai atau mengukur hasil
belajar adalah tingkah laku para siswa ketika guru sedang mengajar.
Tujuan Pengembangan Observasi
Sebagai alat evaluasi , observasi digunakan untuk:
a) Menilai minat, sikap dan nilai yang terkandung dalam diri siswa.
b) Melihat proses kegiatan yang dilakukan oleh siswa maupun kelompok.
c) Suatu tes essay / obyektif tidak dapat menunjukan seberapa kemampuan siswa dapat menjelaskan
pendapatnya secara lisan, dalam bekerja kelompok dan juga kemampuan siswa dalam mengumpulkan
data.
Jenis-jenis Observasi
Observasi atau pengamatan dapat dilakukan dalam berbagai cara. Berdasarkan cara dan tujuan,
onservasi dapat dibedakan menjadi 3 yaitu:
1) Observasi partisipatif dan nonpartisipatif
Observasi partisipatif adalah yaitu observasi yang dilakuakan oleh pengamat diamna pengamat sendiri
memasuki atau mengikuti kegiatan kelompok yang sedang diamati. Sedangkan observasi
nonpartisipatif, observasi tidak mengambil bagian dalam kegiatan yang dilakukan oleh objeknya. Atau
evaluator berada diluar garis seolah-olah sebagai penonton belaka.
Contoh observasi partisipatif : Misalnya guru mengamati setiap anak. Kalau observasi nonpartisipatif,
guru hanya sebagai pengamat, dan tidak ikut bermain.
2) Observasi sistematis dan observasi nonsitematis
Observasi sistematis adalah observasi yang sebelum dilakukan, observer sudah mengatur sruktur
yang berisi kategori atau kriteria, masalah yang akan diamati Sedangkan observasi nonsistematis
yaitu apabila dalam pengamatan tidak terdapat stuktur ketegori yang akan diamati.
8. Contoh observasi sistematis misalnya guru yang sedang mengamati anak-anak menanam bunga.
Disini sebelum guru melaksanakan observasi sudah membuat kategori-kategori yang akan diamati,
misalnya tentang: kerajinan, kesiapan, kedisiplinan, ketangkasan, kerjasama dan kebersihan.
Kemudian ketegori-kategori itu dicocokkan dengan tingkah laku murid dalam menanam bunga. Kalau
observasi nonsistematis maka guru tidak membuat kategori-kategori diatas, tetapi langsung
mengamati anak yang sedang menanam bunga.
3) Observasi experimental, yaitu observasi yang dilakukan dalan situasi yang dibuat atau
dirancang oleh observer.
Kelebihan dan Kekurangan Observasi
Observasi sebagai alat penilain nontes, mempunyai beberapa kelebihan, antara lain:
(1). Observasi dapat memperoleh data sebagai aspek tingkah laku anak.
(2). Dalam observasi memungkinkan pencatatan yang serempak dengan terjadinya suatu gejala
atau kejadian yang penting
(3). Observasi dapat dilakukan untuk melengkapi dan mencek data yang diperoleh dari teknik lain,
misalnya wawancara atau angket.
(4). Observer tidak perlu menggunakan bahasa untuk berkomunikasi dengan objek yang diamati,
kalaupun menggunakan, maka hanya sebentar dan tidak langsung memegang peran.
Sedangkan kelemahan dari observasi adalah:
(1). Observer tiidak dapat mengungkapkan kehidupan pribadi seseorag yang sangat dirahasiakan.
(2). Apabila si objek yang diobservasikan mengetahui kalau sedang diobservasi maka tidak mustahil
tingkah lakunya dibuat-buat, agar observer merasa senang.
(3). Observer banyak tergantung kepada faktor-faktor yang tidak dapat dapat dikontrol sebelumya.
Langkah-langkah Pengembangan Observasi
1. Merumuskan tujuan
2. Merumuskan kegiatan
3. Menyusun langkah-langkah
4. Menyusun kisi-kisi
5. Menyusun panduan observasi
6. Menyusun alat penilaian
9. PENGERTIAN TES, JENIS-
JENIS TES,
16 DEC
DAN KRITERIA SUATU INSTRUMEN TES YANG BAIK
Penilaian pendidikan bukanlah semata-mata penilaian hasil belajar, tetapi mencangkup aspek yang
lebih luas yaitu input/komponen, proses, produk dan program pendidikan. Untuk dapat menilai
aspek-aspek tersebut dengan komponen-komponen yang menyertainya, maka instrumen-instrumen
penilaian pendidikan yang digunakan harus terkait dengan aspek yang dinilai dan tujuan pada
masing-masing aspek tersebut. Secara garis besar instrumen evaluasi dapat diklasifikasikan atas dua
bagian yaitu tes dan non tes. Perbedaan yang prinsip antara tes dan non tes, terletak pada jawaban
yang diberikan. Dalam suatu tes hanya ada kemungkinan benar atau salah, sedangkan untuk non tes
tidak ada jawaban benar atau salah, semuanya tergantung kepada keadaan seseorang. Selanjutnya
akan diuraikan lebih rinci mengenai tes sebagai sebagai alat evaluasi hasil belajar.
A. Pengertian Tes
Tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam
suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Tes hasil belajar adalah sekelompok
pertanyaan atau tugas-tugas yang harus dijawab atau diselesaikan oleh siswa dengan tujuan untuk
mengukur kemajuan belajar siswa.
B. Jenis-Jenis Tes
1. Dari segi bentuk pelaksanaannya
a. Tes Tertulis ( paper and pencil test)
Tes tertulis dalam pelaksanaannya lebih menekankan pada penggunaan kertas dan pencil sebagai
instrumen utamanya, sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian secara
tertulis, baik dengan tulisan tangan maupun menggunakan komputer.
10. b. Tes Lisan ( oral test)
Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru dan murid.
c. Tes Perbuatan (performance test)
Tes perbuatan mengacu pada proses penampilan seseorang dalam melakukan sesuatu unit kerja. Tes
perbuatan mengutamakan pelaksanaan perbuatan peserta didik.
2. Dari segi bentuk soal dan kemungkinan jawabannya
a. Tes Essay (uraian)
Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa menyusun,
mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat
bermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau mengungkapkan suatu
pendapat dalam bahasa sendiri.
b. Tes Objektif
Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif jawabannya.
Tes ini terdiri dariberbagai macam bentuk, antara lain ;
Tes Betul-Salah (TrueFalse)
Tes Pilihan Ganda (Multiple Choice)
Tes Menjodohkan (Matching)
Tes Analisa Hubungan (Relationship Analysis)
3. Dari segi fungsi tes di sekolah
a. Tes Formatif
Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan belajar selama proses
pembelajaran berlangsung. Tes ini diberikankan dalam tiap satuan unit pembelajaran. Manfaat tes
formatif bagi peserta didik adalah :
Untuk mengetahui apakah peserta didik sudah menguasai materi dalam tiap unit pembelajaran.
Merupakan penguatan bagi peserta didik.
Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif peserta didik mengetahui
kelemahan-kelemahan yang dimilikinya.
11. Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum dikuasainya.
b. Tes Summatif
Tes sumatif diberikan dengan maksud untuk mengetahui penguasaan atau pencapaian peserta didik
dalam bidang tertentu. Tes sumatif dilaksanakan pada tengah atau akhir semester.
c. Tes Penempatan
Tes penempatan adalah tes yang diberikan dalam rangka menentukan jurusan yang akan dimasuki
peserta didik atau kelompok mana yang paling baik ditempati atau dimasuki peserta didik dalam
belajar.
d. Tes Diagnostik
Tes diagnostik adalah tes yang digunakan untuk mendiagosis penyebab kesulitan yang dihadapi
seseorang baik dari segi intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan belajarnya.
C. Ciri-ciri Tes Yang Baik
Sebuah tes dikatakan baik jika memenuhi persyaratan:
1. Bersifat valid atau memiliki validitas yang cukup tinggi. Suatu tes dikatakan valid bila tes itu isinya
dapat mengukur apa yang seharusnya di ukur, artinya alat ukur yang digunakan tepat
2. Bersifat reliable, atau memiliki reliabelitas yang baik. Reliabelitas sering diartikan dengan
keterandalan. Suatu tes dikatakan relliabel jika tes itu diberikan berulang-ulang memberikan hasil
yang sama.
3. Bersifat praktis atau memiliki kepraktisan. Tes memiliki sifat kepraktisan artinya praktis dari segi
perencanaan, pelaksanaan tes dan memiliki nilai ekonomi tetapi harus tetap mempertimbangkan
kerahasiaan tes.
Namun syarat minimum yang harus dimiliki oleh sebuah tes yang baik adalah valid dan reliable.
D. Langkah-langkah Pengembangan Tes
Ada enam tahap dalam merencanakan dan menyusun tes agar diperoleh tes yang baik,yaitu:
1) Pengembangan spesifikasi tes
Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri yang
harus dimiliki oleh tes yang akan dikembangkan. Hal yang perlu diperhatikan adalah :
12. a) Menentukan tujuan, tujuan pembelajaran yang baik hendaklah berorientasi kepada peserta
didik, bersifat menguraikan hasil belajar, harus jelas dan dapat dimengerti, mengandung kata kerja
yang jelas (kata kerja operasional), serta dapat diamati dan dapat di ukur.
b) Menyusun kisi-kisi soal, penyusunan kisi-kisi soal bertujuan untuk merumuskan setepat
mungkin ruang lingkup, tekanan dan bagian-bagian tes sehingga perumusan tersebut dapat menjadi
petunjuk yang efektif bagi penyusun tes.
c) Memilih tipe soal, dalam memilih tipe soal perlu diperhatikan kesesuaian antara tipe soal
dengan materi, tujuan evaluasi, skoring, pengelolaan hasil evaluasi, penyelenggaraan tes, serta
ketersediaan dana dan kepraktisan.
d) Merencanakan tingkat kesukaran soal, untuk soal objektif dapat diketahui melalui uji coba atau
dapat juga diperkirakan berdasarkan berat ringannya beban penyeleaian soal tersebut
e) Merencanakan banyak soal
f) Merencanakan jadwal penerbitan soal
2) Penulisan soal
3) Penelaahan soal, yaitu menguji validitas soal yang bertujuan untuk mencermati apakah butir-
butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah dirumuskan,
ditinjau dari segi isi/materi, kriteria dan psikologis.
4) Pengujian butir-butir soal secara empiris, kegiatan ini sangat penting jika soal yang dibuat akan
dibakukan.
5) Penganalisisan hasil uji coba.
6) Pengadministrasian soal
E. Menganalisis Tes
Menganalisis instrument (alat evaluasi) bertujuan untuk mengetahui apakah alat ukur yang
digunakan atau yang akan digunakan sudah memenuhi syarat-syarat sebagai alat ukur yang baik,
tepat mengukur sesuatu sesuai tujuan yang telah dirumuskan. Sebuah instrument dikatakan baik
jika memenuhi syarat validitas, reliabelitas dan bersifat praktis.
1. Validitas Tes
Suatu tes dikatakan valid jika tes itu dapat mengukur apa yang seharusnya diukur. Valid disebut juga
sahih, terandalkan atau tepat. Tes hasil belajar yang valid, harus dapat menggambarkan hasil belajar
yang di ukur
13. Macam-macam validitas
1). Validitas isi (content validity)
Validitas isi sering juga disebut validitas logis atau validitas rasional. Validitas isi dapat dianalisis
dengan bantuan kisi-kisi tes dan pedoman penelaahan butir soal.
Penelaahan butir soal secara umum ditinjau dari tiga aspek yaitu:
1.
1. Aspek materi
2. Aspek bahasa
3. Aspek konstruksi
2). Validitas ramalan (predictive validity)
Suatu tes dikatakan memiliki validitas ramalan, apabila hasil pengukuran yang dilakukan dengan tes
itu dapat digunakan untuk meramalkan, atau tes itu mempunyai daya prediksi yang cukup kuat.
Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang memiliki
validitas ramalan dapat dilakukan dengan mengkorelasikan tes hasil belajar yang sedang diuji
dengan kriterium yang ada.
3) Validitas bandingan (concurent validity)
Suatu tes dikatakan memiliki validitas concurrent, apabila tes tersebut mempunyai kesesuaian
dengan hasil pengukuran lain yang dilaksanakan saat itu. Misalnya, membandingkan hasil tes dari
soal yang sedang dicari validitasnya dengan hasil tes dari soal standar. Jika terdapat korelasi yang
positif antara kedua tes tersbut, berarti soal tes yang dibuat mempunyai validitas concurrent.
4).Construct validity (validitas konstruk)
Validitas konstruk artinya butir-butir soal dalam tes tersebut membangun setiap aspek berpikir
seperti yang tercantum dalam tujuan pembelajaran yang telah dirumuskan. Penganalisisan validitas
ini dapat dilakukan dengan jalan melakukan pencocokan antara aspek berpikir yang dikehendaki
diungkapkan oleh tujuan pembelajaran, yaitu melalui penelaahan butir-butir soal.
Meski terdapat beberapa jenis validitas, dalam periode terakhir validitas dianggap sebagai suatu
konsep utuh, tidak dipilah-pilah sebagai jenis validitas.
o Cara menentukan validitas instrumen
14. Validitas instrument dapat diketahui dengan mencari korelasi hasil instrument dengan dengan
kriterium atau melakukan analisis butir. Apabila data yang digunakan adalah data interval maka
dapat digunakan rumus Product Moment Korelasi, sebagai berikut :
v Rumus Angka Kasar
Keterangan :
= Koefisien korelasi antara instrument X dan instrument Y
v Rumus untuk skor deviasi
Kriteria- kriteria hasil validitas :
Antara sangat tinggi
Antara tinggi
Antara cukup
Antara rendah
Antara sangat rendah (Yusuf, 2005:75).
o Cara menentukan validitas tiap butir soal
Tinggi rendahnya validitas soal secara keseluruhan berhubungan dengan validitas tiap butir soal.
Validitas butir soal dapat dicari dalam hubungannya dengan skor total tiap individu yang ikut serta
dalam evaluasi. Langkah-langkah yang ditempuh sebagai berikut :
1. Skor suatu instrument dengan baik dan teliti
15. Untuk individu yang benar diberi angka 1, sedangkan yang salah diberi angka nol.
2. Jumlahkan skor total untuk tiap individu.
3. Gunakan rumus product moment correlation atau korelasi biserial.
2. Reliabilitas
Suatu alat ukur dikatakan reliabel, apabila alat ukur itu dicobakan kepada objek yang sama secara
berulang-ulang maka hasilnya akan tetap sama, konsisten, stabil atau relatif sama.
o Faktor-faktor yang mempengaruhi reliabilitas
a. Konstruksi item yang tidak tepat, sehingga tidak dapat mempunyai daya pembeda yang kuat.
b. Panjang/pendeknya suatu instrumen
c. Evaluasi yang surjektif akan menurunkan reliabilitas
d. Ketidaktepatan waktu yang diberikan
e. Kemampuan yang ada dalam kelompok
f. Luas/tidaknya sampel yang diambil.
o Teknik pengujian reliabilitas tes hasil belajar
a. Bentuk objektif
1) Metode Belah dua
Dalam pelaksanaanya,seorang penilai hanya melakukan ujian satu kali terhadap sejumlah peserta,
sehingga tidak ada pengaruh dari instrumen yang terdahulu. Jumlah butir soal yang diberikan harus
genap sehingga dapat dibagi dua dan tiap kelompok mempunyai jumlah butir yang sama. Koefisien
reliabilitas akan menunjukkan internal konsistensi dari pada butir soal dalam keseluruhan
instrumen. Cara membelah dua instrumen tersebut dapat dilakukan dengan cara nomor genap dan
ganjil, awal dan akhir. Untuk menentukan reliabilitas kedua bagian instrumen tersebut dapat
digunakan Product Moment Coorelation, sedangkan untuk mencari reliabilitas keseluruhan
instrumen dapat digunakan rumus Spearman Brown, sebagai berikut :
Keterangan :
: koefisien reliabilitas
r : korelasi antara bagian instrumen
16. 2) Metode Ulangan
Pelaksanaannya dilakukan dua kali kepada sejumlah subjek yang sama, dalam waktu yang berbeda.
Reliabilitas metode ulangan ini untuk melihat bagaimana stabilnya skor setiap individu apabila
dilakukan pengujian dalam waktu yang berbeda, dengan kondisi dan perlengkapan yang sama/
hampir bersamaan. Rumus yang digunakan untuk menentukan metode ulangan ini adalah Product
Moment Correlation.
3) Metode Bentuk Paralel
Bentuk ini dapat digunakan untuk memperkirakan reliabilitas dari semua tipe, tetapi koefisien yang
dihasilkan hanya menggambarkan ekivalensi antara kedua instrumen. Tidak akan menunjukkan
ekivalensi dalam kesukaran butir dan isi. Kedua bentuk instrumen yang diberikan mengukura hal
yang sama, dengan memiliki tingkat kesukaran yang sama, pengetahuan dan keterangpilan yang
sama dengan sistematika yang tidak berbeda antara kedua bentuk instrumen tersebut, tetapi dalam
bentuk pertanyaan yang berbeda. Rumus yang dapat digunakan untuk menentukan reliabilitas
instrumen dalam bentuk paralel ini adalah product moment correlation dan Rank order correlation.
b. Bentuk essay
Rumus yang digunakan untuk mengukur reliabilitas tes berbentuk uraian dinamakan rumus Alpha,
yaitu :
Dimana:
: Koefisien reliabilitas tes
n : banyaknya butir item yang dikeluarkan dalam tes
: Jumlah variansi skor dari tiap-tiap butir item
:Variansitotal
Interpretasi terhadap koefisien reliabilitas tes pada umumnya digunakan patokan sebagai berikut:
0,80 < r11 贈 1,00 reliabilitas sangat tinggi
0,60 < r11 贈 0,80 reliabilitas tinggi
0,40 < r11 贈 0,60 reliabilitas sedang
0,20 < r11 贈 0,40 reliabilitas rendah
0,00 < r11 贈 0,20 reliabilitas sangat rendah
Nilai r yang diperoleh dibandingkan dengan rtabel. Jika rhitung > rtabel maka dapat disimpulkan bahwa
soal tes reliabel.
17. 3. Analisis soal tes
Untuk mendapatkan kualitas soal yang baik, maka dilakukan langkah-langkah sebagai berikut:
1) Daya pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai
dengan siswa yang bodoh. Angka yang menunjukkan besarnya daya pembeda disebut indek
diskriminan. Untuk menentukan daya pembeda soal dapat dilakukan seperti yang dikemukakan oleh
Prawironegoro (1985:11):
Terlebih dahulu dicari degress of freedom (df) dengan rumus:
df = (nt 1) + (nr 1)
dimana:
nt = nr = 27% x N
kemudian digunakan rumus:
dimana:
Ip = daya pembeda soal
Mt = rata-rata skor dari kelompok tinggi
Mr = rata-rata skor dari kelompok rendah
= jumlah kuadrat deviasi skor kelompok tinggi
= jumlah kuadrat deviasi skor kelompok rendah
n = 27% x N
N = banyak pengikut tes
Soal mempunyai daya pembeda yang berarti (signifikan) jika Ip hitung 続 Ip tabel pada derajat
kebebasan yang sudah ditentukan.
2) Indek kesukaran.
Agar tes dapat digunakan secara luas, setiap soal harus diselidiki tingkat kesukarannya yaitu apakah
soal tersebut termasuk soal yang mudah, sedang atau sukar. Untuk menentukan indek kesukaran
digunakan rumus yang dikemukakan Prawironegoro (1985:14) yaitu:
dimana:
18. Ik = indeks kesukaran
Dt = jumlah skor dari kelompok tinggi
Dr = jumlah skor dari kelompok rendah
m = skor setiap soal jika benar
n = 27% x N
N = banyak pengikut tes
Soal dinyatakan sukar, jika 0% 贈 Ik < 27%
sedang, jika 27% 贈 Ik 贈 73%
mudah, jika Ik > 73%
3) Penerimaan soal
Setiap soal yang telah dianalisa perlu diklasifikasikan menjadi soal yang tetap dipakai, direvisi atau
dibuang. Menurut Prawironegoro (1985:16) tentang klasifikasi soal:
a) Soal yang baik akan tetap dipakai jika Ip signifikan dan 0% < Ik 贈 100%.
b) Soal diperbaiki jika:
i. Ip signifikan dan Ik = 100% atau Ik = 0%.
ii. Ip tidak signifikan dan 0% < Ik < 100%.
c) Soal diganti jika Ip tidak signifikan dan Ik = 100% atau Ik = 0%.