REVIEW BUKU (2)

Judul               : EVALUASI HASIL BELAJAR

Penulis             : Dr. Purwanto, M.Pd

Penerbit           : Pustaka Belajar (Yogyakarta)

Tahun              : 2011

 

Sebagai sebuah program, pendidikan memerlukan evaluasi apabila ingin diketahui efektivitasnya.  Evaluasi merupakan pengambilan keputusan berdasarkan hasil pengukuran (pengumpulan data) dan kriterianya. Oleh karenanya kegiatan evaluasi harus didahului dengan kegiatan pengukuran. Dengan membandingkan hasil pengukuran dengan kriteria, keputusan evaluasi dapat dibuat. Pengukuran dilakukan agar pengambilan keputusan evaluasi dapat diambil secara akurat. Dalam pelaksanaannya, evaluasi dapat berfungsi penempatan, seleksi, diagnostik, dan pengukur keberhasilan.

Berbagai pihak seperti guru, siswa, sekolah, masyarakat dan pemerintah memperoleh manfaat dari kegiatan evaluasi pendidikan. Pengukuran dan evaluasi pendidikan mempunyai sejumlah ciri yaitu bersifat tidak langsung, menggunakan ukuran kuantitatif dan mengandung kesalahan.

Pendidikan merupakan sebuah program yang terdiri dari beberapa komponen yang bekerja dalam sistem. Program adalah kegiatan yang akan dilakukan dengan perencanaan dan tujuan yang akan dicapai. Sebagai sebuah program pendidikan memerlukan evaluasi untuk melihat apakah tujuan program yang direncanakan dapat dicapai. Evaluasi program berhubungan dengan komponen dan aspek yang akan dievaluasi. Terdapat beberapa model pengembangan evaluasi program pendidikan. Perbedaan model terletak pada perbedaannya pada komponen dan aspek yang dievaluasi. Model-model itu adalah model pengukuran, kesesuaian, evaluasi sistem, dan iluminatif. Evaluasi model pengukuran mengevaluasi komponen hasil belajar dalam ranah kognitif. Model kesesuaian mengevaluasi komponen hasil belajar dalam ranah kognitif, afektif dan psikomotorik. Model evaluasi sistem mengevaluasi semua komponen pendidikan secara terpisah-pisah dan kuantitatif. Model iluminatif mengevaluasi seluruh komponen sebagai sebuah keutuhan secara kuantitatif.

Tujuan pendidikan merupakan perubahan perilaku yang direncanakan dapat dicapai melalui proses belajar mengajar. Hasil belajar adalah hasil yang dicapai dari proses belajar mengajar sesuai dengan tujuan pendidikan. Hasil belajar diukur untuk mengetahui pencapaian tujuan pendidikan sehingga hasil belajar harus sesuai dengan tujuan pendidikan.

Hasil belajar adalah perubahan perilaku yang terjadi setelah mengikuti proses belajar mengajar sesuai dengan tujuan pendidikan. Manusia mempunyai potensi perilaku kejiwaan yang dapat dididik dan diubah perilakunya yang meliputi domain kognitif, afektif dan psikomotorik. Belajar mengusahakan perubahan perilaku dalam domain-domain tersebut sehingga hasil belajar merupakan perubahan perilaku dalam domain kognitif, afektif dan psikomotorik.

Domain-domain dalam perilaku kejiwaan bukanlah kemampuan tunggal. Untuk kepentingan pengukuran hasil belajar domain-domain disusun secara hirarkhis dalam tingkat-tingkat mulai dari yang paling rendah dan sederhana hingga yang paling tinggi dan kompleks. Dalam domain kognitif diklasifikasikan menjadi kemampuan hafalan, pemahaman, penerapan, analisis, sintesis dan evaluasi. Dalam domain afektif hasil belajar meliputi level: penerimaan, partisipasi, penilaian, organisasi dan karakterisasi. Sedang domain psikomotorik terdiri dari level: persepsi, kesiapan, gerakan terbimbing, gerakan terbiasa, gerakan kompleks dan kreativitas.

Untuk memperoleh data yang obyektif, maka pengumpulannya dilakukan dengan cara pengukuran. Pengukuran melakukan pengumpulan data menggunakan alat ukur atau instrument. Dalam pendidikan, pengumpulan data dengan cara melakukan pengukuran juga dapat dilakukan. Pengukuran dilakukan atas atribut yang disebut variabel. Berdasarkan perlu tidaknya instrument factual dan konsep. Sedang menurut penampilan responden dalam memberikan respons atas instrument, variabel dapat berupa variabel tipikal dan maksimal. Instrument pendidikan, seperti juga alat ukur yang lain, harus memenuhi syarat validitas dan reliabilitas.

Tes merupakan salah satu jenis instrument, disamping non-tes. Tes sebagai instrument berhubungan dengan fungsinya untuk mengukur penampilan maksimal. Dalam kegiatan pengukurannya, tes dapat dibagi menjadi dua yaitu tes yang mengukur penguasaan dan tes yang mengukur kemampuan. Tes penguasaan mengukur apa yang telah dikuasai oleh siswa dari materi yang yang telah dipelajari. Dengan kata lain, tes penguasaan mengukur apa yang diperoleh, sedangkan tes kemampuan mengukur apa yang dimiliki.

Tes hasil belajar (THB) merupakan salah satu jenis tes yang mengukur penguasaan. Menurut macamnya, THB terdiri dari tes formatif, sumatif, diagnostik, dan penempatan. Menurut bentuknya, THB dapat berbentuk esai dan obyektif. Komponen THB terdiri dari perangkat, petunjuk pengerjaan, butir soal, pilihan, kunci jawaban dan pengecoh. Dalam pelaksanaannya, THB dapat dilakukan dengan pengamatan, lisan, tertulis atau analisis dokumen karya.

Menilai hasil belajar siswa adalah pengambilan keputusan penting yang menentukan nasib akademik siswa, sehingga harus didasarkan pada data yang tepat dan akurat. Data hasil belajar yang menjadi dasar penilaian haruslah obyektif, bebas dari pertimbangan subyektif dan dapat diuji kembali. Data demikian diperoleh dari hasil pengukuran menggunakan tes hasil belajar. Data hasil belajar yang baik diperoleh dari pengukuran menggunakan tes hasil belajar yang baik. THB yang baik digunakan setelah melalui proses pengembangan. Pengembangan THB dilakukan melalui beberapa kegiatan: identifikasi hasil belajar, deskripsi materi, pengembangan spesifikasi, penulisan butir dan kunci jawaban, pengumpulan data uji coba, uji kualitas dan kompilasi butir THB.

Sebagai sebuah alat ukur, THB harus memenuhi syarat ukur yang baik yaitu validitas dan reliabilitas. Sebelum pengujian syarat alat ukur yang baik dilakukan, maka terlebih dahulu butir-butir THB harus diuji coba menggunakan analisis butir. Analisis butir dapat dilakukan menggunakan teori klasik atau modern. Oleh karena pertimbangan kepraktisan, tes klasik lebih banyak digunakan dengan beberapa kekurangannya.

Dalam analisis butir menggunakan teori tes klasik, karakteristik butir yang diuji adalah tingkat kesukaran, daya beda dan efektivitas pengecoh. Dalam pengujian itu keputusan butir yang baik didasarkan oleh beberapa kriteria yaitu tingkat kesukaran harus sedang, daya beda harus positif dan tinggi, dan pengecoh harus dipilih paling tidak satu orang peserta tes.

Validitas adalah salah satu syarat THB yang baik. Validitas berhubungan dengan kemampuan THB untuk mengukur keadaan yang akan diukurnya. Pengujian validitas dapat dikelompokkan menjadi tiga: validitas isi, kriteria dan konstruk. Pengujian validitas isi dapat dilakukan dengan cara menelaah butir, meminta pertimbangan ahli dan menghitung korelasi butir dengan total. Pengujian validitas kriteria dapat berupa validitas konkuren dan prediktif. Pengujian validitas konstruk dapat dilakukan dengan menelaah butir, meminta pertimbangan ahli, konvergensi dan diskriminabilitas, multirait-multimethod, dan analisis faktor.

Analisi Faktor (AF) merupakan analisis uji validitas konstruk. Analisis dilakukan dengan menguji butir-butir atau variabel-variabel yang sangat banyak diringkas menjadi faktor-faktor yang lebih sedikit dan sederhana. Peringkasan dilakukan dengan menyatukan butir-butir atau variabel-variabel yang mempunyai varians faktor bersama yang besar ke dalam satu faktor Karena dalam keadaan demikian butir-butir atau variabel-variabel tersebut sebenarnya mengukur dimensi yang sama. Dalam penggunaannya, AF dapat dilakukan secara eksploratif maupun konfirmatif.

AF ditempuh dengan prosedur yang melibatkan beberapa langkah yaitu: menguji kelayakan analisis, menyajikan matriks korelasi, melakukan ekstraksi, melakukan rotasi dan memberi nama faktor. Hasil perhitungan dari langkah-langkah uji akan ditafsirkan. Data dapat dianalisis bila sampel cukup dan berdistribusi normal. Hal itu ditunjukkan oleh koefisien KMO minimal 0,80 dan taraf signifikansi yang ditetapkan dibawah rekomendasi hasil perhitungan. Butir yang mempunyai dimensi sama memiliki eigenvalues minimal 1,00. Sebuah butir memberi dukungan pada sebuah faktor bila mempunyai muatan faktor minimal 0,30. Faktor hasil proses rotasi selanjutnya diberi nama atau label sesuai dengan sifat butir-butir muatannya.

Reliabilitas adalah salah satu syarat THB yang baik. Reliabilitas adalah koefisien yang menunjukkan kemampuan THB untuk memberikan hasil pengukuran yang relatif tetap dan konsisten. Reliabilitas dapat dipandang sebagai stabilitas internal dan konsistensi internal. Metode pengujian yang memandang reliabilitas sebagai stabilitas eksternal adala metode tes ulang dan paralel. Sedang metode yang memandang reliabilitas sebagai koefisien konsistensi internal adalah metode belah dua, Flanagan, Rulon, Kuder Richardson, Hoyt, dan Alpha Cronbach.

Keputusan reliabilitas dilakukan dengan mengonfirmasikan koefisien reliabilitas hasil perhitungan dengan kriteria batas tertentu. Beberapa memandang kriteria itu merupakan batas relatif, beberapa memberikan petunjuk tentang besar koefisien minimal, beberapa yang lain memandang koefisien reliabilitas sebagai koefisien korelasi yang konfirmasi signifikansinya menggunakan tabel.

Disamping koefisien reliabilitas, dalam THB yang digunakan untuk mengukur skor-skor yang akan dibandingkan secara individual, maka untuk menilai kecermatan THB dalam mengukur, perlu dipertimbangkan pula kesalahan standar pengukuran. Kesalahan standar pengukuran merupakan ukuran yang dapat digunakan untuk menilai akurasi skor yang diperoleh dari kegiatan pengukuran.

Data hasil belajar adalah keterangan kuantitatif mengenai hasil belajar siswa. Data itu mencerminkan perubahan perilaku siswa setelah belajar. Data hasil belajar dapat dikelompokkan dalam beberapa macam. Menurut cara pengumpulannya, data hasil belajar dibagi menjadi data primer dan sekunder. Sedang menurut sumber yang menjadi obyek pengumpulan data, data hasil belajar dapat diambil dari sampel atau populasi.

Data hasil belajar dihasilkan dari pengukuran menggunakan THB yang menghasilkan skor. Perhitungan skor dilakukan berdasarkan aturan skoring. Pengumpulan data hasil belajar dilakukan dengan mengubah jawaban peserta tes kedalam ukuran kuantitatif berdasarkan aturan skoring yang ditetapkan. Dalam pengukuran menggunakan THB, aturan skoring yang digunakan sangat dipengaruhi oleh bentuk THB dan ketentuan mengenai denda.

Skor data hasil belajar dapat dikelompokkan menjadi beberapa macam. Menurut unsurnya, skor dapat berupa skor murni, skor amatan dan skor kesalahan. Sedang menurut jumlah unsurnya, skor dapat berupa skor tunggal atau gabungan.

Statistika membantu mengolah skor data hasil belajar menjadi nilai melalui proses penilaian. Dalam melakukan analisis data hasil belajar, statistika melibatkan proses pengumpulan, penyajian dan pengolahan data. Pengumpulan data dilakukan dengan mengukur menggunakan tes hasil belajar. Penyajian data dilakukan dengan menggunakan tabel dan grafik, khususnya tabel distributif dan kurva. Pengolahan data dilakukan menggunakan statistika deskriptif khususnya mean dan standar deviasi.

Hasil pengukuran berupa skor belum mempunyai arti untuk dapat digunakan dalam membuat keputusan. Skor hanya bermakna dan dapat digunakan untuk membuat keputusan setelah diubah menjadi nilai melalui proses penilaian. Dalam mengubah skor menjadi nilai, proses penilaian menggunakan skala dan acuan tertentu. Oleh karenanya pemberian makna kepada nilai dalam pengambilan keputusan harus mempertimbangkan skala dan acuan yang digunakan untuk mengubah skor menjadi nilai.

REVIEW BUKU

Judul               : PENGANTAR EVALUASI PENDIDIKAN

Penulis             : Prof. Drs. Anas Sudijono

Penerbit           : PT. RajaGrafindo Persada / Rajawali Pers (Jakarta)

Tahun              : 2011

 

Makna evaluasi dibatasi pada pengertiannya sebagai proses atau kegiatan yang bertujuan memajukan pendidikan dan guna memperoleh informasi berupa umpan balik (feed back) bagi penyempurnaan pendidikan itu. Evaluasi atau penilaian sangat berhubungan erat dengan pengukuran, dimana hasil-hasil pengukuran menjadi sebagian besar sumber dalam menggambarkan evaluasi yang dilakukan pada suatu lembaga pendidikan.

Fungsi penilaian yang penting dalam dunia pendidikan, diantaranya pada aspek psikologis, didaktik dan administratif. Sedangkan pendidikan sendiri mengklasifikasikan penilaian berdasarkan pada tiga hal, yakni fungsinya, penggunaan informasi, dan sesuai asas pertanyaan “dimana atau pada bagian manakah penilaian tersebut dilakukan”. Sedangkan pelaku atau subyek evaluasi pendidikan, bila menyasar pada prestasi belajar, maka ia adalah guru atau dosen yang mengampu mata pelajaran tersebut.

Evaluasi hasil belajar dikatakan akan bisa terlaksana dengan maksimal apabila dalam pelaksanaannya selalu berpedoman dengan tiga prinsip dasar pokok, meliputi prinsip keseluruhan, prinsip kesinambungan dan prinsip obyektivitas. Dan sebaliknya, jika tidak menyertakan ketiga unsur penting tersebut, maka akan menodai kemurnian pekerjaan evaluasi itu sendiri.

Kegiatan evaluasi setidaknya harus memiliki ciri-ciri yang akan membedakannya dengan kegiatan lainnya. Pertama, evaluasi yang dilakukan dalam usaha mengukur tingkat keberhasilan peserta didik itu diukur secara tidak langsung. Kedua, pengukurannya itu mayoritas memakai standar ukuran yang bersifat kuantitatif maupun simbol-simbol angka. Dan ketiga, evaluasi secara umum menggunakan satuan-satuan yang tetap dan konsisten. Dalam praktiknya, evaluasi diawali dengan menyusun evaluasi hasil belajar, menghimpun data, melakukan verifikasi data, mengolah-menganalisis data, memberikan interpretasi maupun menarik kesimpulan, serta diakhiri dengan proses menindak lanjuti hasil evaluasi tersebut.

Tes merupakan cara atau prosedur dalam upaya melakukan pengukuran dan penilaian di bidang pendidikan, sehingga akan dihasilkan nilai yang dapat dilambangkan. Berdasarkan fungsinya, ada beberapa teknik tes untuk mengukur perkembangan dan kemajuan belajar dari peserta didik. Diantara yang tergolong jenis itu adalah tes seleksi, tes awal, tes akhirm tes diagnostik, tes formatif, dan tes sumatif.

Adapun teknik non-tes dapat dirupakan dalam bentuk pengamatan secara sistematis, melakukan wawancara, menyebarkan angket dan memeriksa atau meneliti dokumen-dokumen. Berkebalikan dari kegunaan teknis tes yang berkutat di ranah kognitif peserta didik, maka teknik non-tes ini meliputi ranah afektif dan psikomotorik mereka.

Sebuah tes hasil belajar dapat dikategorikan baik bila memiliki validitas, reliabilitas, obyektifitas dan nilai praktis yang tepat. Karakteristik tersebut lebih sempurna lagi bila disertai dengan lima prinsip dalam menyusun dan membuat sebuah tes hasil belajar. Diantara kelima prinsip itu terdapat prinsip (1) dapat mengukur hasil belajar (learning outcomes) sesuai tujuan instruksional, dan (2) tiap butir soal tes itu merupakan sampel representatif yang mewakili keseluruhan performance yang didapat peserta didik.

Bentuk tes hasil belajar diklasifikasikan dalam dua bentuk, yakni tes uraian dan tes obyektif. Adapun tes uraian atau juga dikenal dengan essay test yang umumnya berbentuk pertanyaan, dimana mengharuskan peserta didik menjawab dengan paparan kalimat yang terkadang agak panjang dan penjelasan yang cukup detail. Dalam menyusunnya, dapat dimulai menyesuaikan dengan ide-ide pokok materi pelajaran, lalu membuat susunan kalimat yang berlainan dengan kalimat pada buku, membuat kunci jawabannya yang terumuskan secara tegas, merancang variasi bentuk kalimat perintah yang cukup beragam, meringkas susunan kalimat soal yang dirasa terlalu panjang dan disertakan pedoman cara mengerjakan soalnya.

Dalam praktiknya, pelaksanaan tes hasil belajar dapat dilakukan secara tertulis, lisan ataupun dengan perbuatan. Ketiga jenis ini sebaiknya dijalankan sesuai dengan pedoman yang benar agar terlaksana secara optimal dan meminimalisir kecurangan peserta didik. Diantaranya ketika tes tertulis, data-data berita acara pelaksanaan tes harus tercatat dan terdokumentasi secara baik. Dan ketika tes perbuatan, setiap tester telah menyiapkan instrument berupa lembar penilaian yang tersusun sistematis dan terencana.

Validitas merupakan salah satu ciri yang menandakan tingkat kebaikan suatu tes hasil belajar. Untuk menentukannya, dapat dilihat dari 2 segi, yakni segi tes itu sendiri sebagai suatu totalitas dan segi itemnya. Dalam mengamati segi totalitasnya, dapat diketahui dengan cara menganalisa dengan jalan berpikir secara rasional dan menganalisa berdasarkan kepada kenyataan empiris melalui empirical analysis. Suatu tes dapat dianalisa kerasionalannya lewat dua hal, meliputi isinya (content) dan susunannya (construct). Sedangkan tingkat empirik tes belajar dapat ditelusuri melalui 2 unsur, yakni daya ketepatan meramalnya (predictive validity) dan bandingannya (concurrent validity).

Item-item dalam tes juga dibutuhkan suatu proses untuk mengetahui tingkat validitasnya. Proses tersebut ialah teknik korelasi sebagai alat analisanya. Sebuah item soal dapat dinyatakan valid jika terbukti memiliki korelasi positif yang cukup signigfikan dengan skor totalnya.

Tes hasil belajar juga sebaiknya memiliki tingkat reliabilitas yang cukup tinggi. Adpapun untuk tes yang berbentuk uraian, dapat diketahui melalui acuan khusus, seperti dengan rumus alpha. Sedangkan untuk tes yang berbentuk obyektif, penentuan reliabilitasnya dijalani melalui tiga macam pendekatan, meliputi single test-single trial, test-retest/single tes-double trial, dan alternate form/double test-double trial.

Beragamnya jenis pelaksanaan tes hasil belajar tentunya akan menuntut adanya keragaman dalam pemeriksaan hasil-hasilnya, sehingga dibutuhkan cara yang tepat dalam mengoreksi dan menilai hasil tersebut secara baik. Penggunaan kunci jawaban sebagai alat koreksi pada tes uraian obyektif setidaknya memiliki 4 model yang bisa dipergunakan, yaitu kunci berdamping (strip keys), kunci sistem karbon (carbon system keys), kunci sistem tusukan (pinprick system keys), dan kunci berjendela (window keys). Adapun tes tulis subyektif, sebaiknya penguji memiliki pedoman yang kuat dan disiplin dalam penerapannya agar nilai yang dihasilkan dapat merepresentasikan penguasaan dan kemampuan peserta didik yang sesungguhnya.

Pemberian skor merupakan langkah awal dalam pengolahan hasil tes yang selanjutnya akan diubah menjadi nilai-nilai (grade) dengan penggunaan symbol tertentu. Untuk tes uraian, skoring umumnya didasarkan pada bobot setiap butir soal dan tingkat kesukarannya. Perlu diketahui, bahwa di tanah air kita, nilai standar yang dianut pada tingkat dasar dan menengah adalah berskala sebelas (stanel), sedangkan pada tingkat pendidikan tinggi mengacu pada skala lima (stanfive) atau nilai huruf. Penilaian berpatokan atau yang beracuan kriterium dengan standar mutlak sebaiknya diterapkan pada tes yang bersifat standar atau mendekatinya, sehingga akan mampu menghasilkan bukti yang dapat diandalkan ketepatannya, dari segi derajat kesukaran, daya beda, fungsi distraktor, validitas hingga reliabilitasnya.

Identifikasi terhadap setiap butir item tes hasil belajar juga dilakukan pada langkah berikutnya, mengingat pentingnya sekolah mengetahui informasi dalam upaya perbaikan, pembenahan dan penyempurnaan tes-tes di masa mendatang. Karenanya, diadakan suatu pengukuran dengan kualitas yang tinggi yang sering disebut dengan analisis item (item analysis). Penganalisaan ini diterapkan dalam tiga segi, meliputi derajat kesukaran, daya beda dan fungsi distraktor tiap itemnya. Namun yang tidak boleh dilupakan, setelah melakukan analisa item tersebut, seharusnya dapat ditindak lanjuti demi kebaikan dan kemajuan, bila tidak maka dikhawatirkan akan sia-sia belaka.

Tahapan terakhir yang sangat penting pula dilakukan ialah penentuan nilai akhir. Nilai akhir yang baik akan dapat berfungsi pada segi administratif, informatif, bimbingan dan instruksional pada kedua belah pihak, pendidik dan peserta didik. Faktor yang perlu diperhatikan pendidik dalam memberikan nilai akhir diantaranya faktor pencapaian (achievement), usaha (effort), aspek pribadi-sosial (personal and social characteristics) dan kebiasaan kerja (work habbit) dari setiap anak didiknya, sehingga akan diperoleh nilai yang komprehensif.

Adapun penentuan ranking sangat berguna sebagai laporan dan informasi penting untuk pihak-pihak atasan, orang tua peserta didik maupun bagi peserta didik itu sendiri. Dalam praktiknya, penentuan rangking memiliki beberapa jenis, diantaranya ranking sederhana (simple rank) dan ranking persenan (percentile rank). Sebagai hasil nyatanya, salah satu bentuk lain yang umumnya dapat dilakukan ialah dengan membuat profil prestasi belajar. Dengan ini, pendidik akan memperoleh gambaran secara visual mengenai perkembangan dan hasil apa yang telah dicapai oleh peserta didiknya.