A. Pengertian Pengukuran, Penilaian dan Evaluasi
Wiersma dan Jurs membedakan antara evaluasi, pengukuran dan testing. Mereka berpendapat bahwa evaluasi adalah suatu proses yang mencakup pengukuran dan mungkin juga testing, yang juga berisi pengambilan keputusan tentang nilai. Pendapat ini sejalan dengan pendapat Arikunto yang menyatakan bahwa evaluasi merupakan kegiatan mengukur dan menilai. Kedua pendapat di atas secara implisit menyatakan bahwa evaluasi memiliki cakupan yang lebih luas daripada pengukuran dan testing.
Ralph W. Tyler, yang dikutif oleh Brinkerhoff dkk. Mendefinisikan evaluasi sedikit berbeda. Ia menyatakan bahwa evaluation as the process of determining to what extent the educational objectives are actually being realized. Sementara Daniel Stufflebeam (1971) yang dikutip oleh Nana Syaodih S., menyatakan bahwa evaluation is the process of delinating, obtaining and providing useful information for judging decision alternatif. Demikian juga dengan Michael Scriven (1969) menyatakan evaluation is an observed value compared to some standard. Beberapa definisi terakhir ini menyoroti evaluasi sebagai sarana untuk mendapatkan informasi yang diperoleh dari proses pengumpulan dan pengolahan data.
Sementara itu Asmawi Zainul dan Noehi Nasution mengartikan pengukuran sebagai pemberian angka kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal, atau obyek tertentu menurut aturan atau formulasi yang jelas, sedangkan penilaian adalah suatu proses untuk mengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan tes maupun nontes. Pendapat ini sejalan dengan pendapat Suharsimi Arikunto yang membedakan antara pengukuran, penilaian, dan evaluasi. Arikunto menyatakan bahwa mengukur adalah membandingkan sesuatu dengan satu ukuran. Pengukuran bersifat kuantitatif. Sedangkan menilai adalah mengambil suatu keputusan terhadap sesuatu dengan ukuran baik buruk. Penilaian bersifat kualitatif. Hasil pengukuran yang bersifat kuantitatif juga dikemukakan oleh Norman E. Gronlund (1971) yang menyatakan “Measurement is limited to quantitative descriptions of pupil behavior”
Pengertian penilaian yang ditekankan pada penentuan nilai suatu obyek juga dikemukakan oleh Nana Sudjana. Ia menyatakan bahwa penilaian adalah proses menentukan nilai suatu obyek dengan menggunakan ukuran atau kriteria tertentu, seperti Baik , Sedang, Jelek. Seperti juga halnya yang dikemukakan oleh Richard H. Lindeman (1967) “The assignment of one or a set of numbers to each of a set of person or objects according to certain established rules”
B. Tujuan Evaluasi
Sebagaimana diuraikan pada bagian terdahulu bahwa evaluasi dilaksanakan dengan berbagai tujuan. Khusus terkait dengan pembelajaran, evaluasi dilaksanakan dengan tujuan:
1. Mendeskripsikan kemampuan belajar siswa.
2. mengetahui tingkat keberhasilan PBM
3. menentukan tindak lanjut hasil penilaian
4. memberikan pertanggung jawaban (accountability)
C. Fungsi Evaluasi
Sejalan dengan tujuan evaluasi di atas, evaluasi yang dilakukan juga memiliki banyak fungsi, diantaranya adalah fungsi:
1. Selektif
2. Diagnostik
3. Penempatan
4. Pengukur keberhasilan
Selain keempat fungsi di atas Asmawi Zainul dan Noehi Nasution menyatakan masih ada fungsi-fungsi lain dari evaluasi pembelajaran, yaitu fungsi:
1. Remedial
2. Umpan balik
3. Memotivasi dan membimbing anak
4. Perbaikan kurikulum dan program pendidikan
5. Pengembangan ilmu
D. Manfaat Evaluasi
Secara umum manfaat yang dapat diambil dari kegiatan evaluasi dalam pembelajaran, yaitu :
1. Memahami sesuatu : mahasiswa (entry behavior, motivasi, dll), sarana dan prasarana, dan kondisi dosen
2. Membuat keputusan : kelanjutan program, penanganan “masalah”, dll
3. Meningkatkan kualitas PBM : komponen-komponen PBM
Sementara secara lebih khusus evaluasi akan memberi manfaat bagi pihak-pihak yang terkait dengan pembelajaran, seperti siswa, guru, dan kepala sekolah.
Bagi Siswa
Mengetahui tingkat pencapaian tujuan pembelajaran : Memuaskan atau tidak memuaskan
Bagi Guru
1. mendeteksi siswa yang telah dan belum menguasai tujuan : melanjutkan, remedial atau pengayaan
2. ketepatan materi yang diberikan : jenis, lingkup, tingkat kesulitan, dll.
3. ketepatan metode yang digunakan
Bagi Sekolah
1. hasil belajar cermin kualitas sekolah
2. membuat program sekolah
3. pemenuhan standar
E. Macam-macam Evaluasi
1. Formatif
Evaluasi formatif adalah evaluasi yang dilakukan pada setiap akhir pembahasan suatu pokok bahasan / topik, dan dimaksudkan untuk mengetahui sejauh manakah suatu proses pembelajaran telah berjalan sebagaimana yang direncanakan. Winkel menyatakan bahwa yang dimaksud dengan evaluasi formatif adalah penggunaan tes-tes selama proses pembelajaran yang masih berlangsung, agar siswa dan guru memperoleh informasi (feedback) mengenai kemajuan yang telah dicapai. Sementara Tesmer menyatakan formative evaluation is a judgement of the strengths and weakness of instruction in its developing stages, for purpose of revising the instruction to improve its effectiveness and appeal. Evaluasi ini dimaksudkan untuk mengontrol sampai seberapa jauh siswa telah menguasai materi yang diajarkan pada pokok bahasan tersebut. Wiersma menyatakan formative testing is done to monitor student progress over period of time. Ukuran keberhasilan atau kemajuan siswa dalam evaluasi ini adalah penguasaan kemampuan yang telah dirumuskan dalam rumusan tujuan (TIK) yang telah ditetapkan sebelumnya. TIK yang akan dicapai pada setiap pembahasan suatu pokok bahasan, dirumuskan dengan mengacu pada tingkat kematangan siswa. Artinya TIK dirumuskan dengan memperhatikan kemampuan awal anak dan tingkat kesulitan yang wajar yang diperkiran masih sangat mungkin dijangkau/ dikuasai dengan kemampuan yang dimiliki siswa. Dengan kata lain evaluasi formatif dilaksanakan untuk mengetahui seberapa jauh tujuan yang telah ditetapkan telah tercapai. Dari hasil evaluasi ini akan diperoleh gambaran siapa saja yang telah berhasil dan siapa yang dianggap belum berhasil untuk selanjutnya diambil tindakan-tindakan yang tepat. Tindak lanjut dari evaluasi ini adalah bagi para siswa yang belum berhasil maka akan diberikan remedial, yaitu bantuan khusus yang diberikan kepada siswa yang mengalami kesulitan memahami suatu pokok bahasan tertentu. Sementara bagi siswa yang telah berhasil akan melanjutkan pada topik berikutnya, bahkan bagi mereka yang memiliki kemampuan yang lebih akan diberikan pengayaan, yaitu materi tambahan yang sifatnya perluasan dan pendalaman dari topik yang telah dibahas.
2. Sumatif
Evaluasi sumatif adalah evaluasi yang dilakukan pada setiap akhir satu satuan waktu yang didalamnya tercakup lebih dari satu pokok bahasan, dan dimaksudkan untuk mengetahui sejauhmana peserta didik telah dapat berpindah dari suatu unit ke unit berikutnya. Winkel mendefinisikan evaluasi sumatif sebagai penggunaan tes-tes pada akhir suatu periode pengajaran tertentu, yang meliputi beberapa atau semua unit pelajaran yang diajarkan dalam satu semester, bahkan setelah selesai pembahasan suatu bidang studi.
3. Diagnostik
Evaluasi diagnostik adalah evaluasi yang digunakan untuk mengetahui kelebihan-kelebihan dan kelemahan-kelemahan yang ada pada siswa sehingga dapat diberikan perlakuan yang tepat. Evaluasi diagnostik dapat dilakukan dalam beberapa tahapan, baik pada tahap awal, selama proses, maupun akhir pembelajaran. Pada tahap awal dilakukan terhadap calon siswa sebagai input. Dalam hal ini evaluasi diagnostik dilakukan untuk mengetahui kemampuan awal atau pengetahuan prasyarat yang harus dikuasai oleh siswa. Pada tahap proses evaluasi ini diperlukan untuk mengetahui bahan-bahan pelajaran mana yang masih belum dikuasai dengan baik, sehingga guru dapat memberi bantuan secara dini agar siswa tidak tertinggal terlalu jauh. Sementara pada tahap akhir evaluasi diagnostik ini untuk mengetahui tingkat penguasaan siswa atas seluruh materi yang telah dipelajarinya.
Perbandingan Tes Diagnostik, Tes Formatif, dan Tes Sumatif
Ditinjau dari
Tes Diagnostik
Tes Formatif
Tes Sumatif
Fungsinya
*mengelompokkan siswa berdasarkan kemampuannya
*menentukan kesulitan belajar yang dialami
*Umpan balik bagi siswa, guru maupun program untuk menilai pelaksanaan suatu unit program
*Memberi tanda telah mengikuti suatu program, dan menentukan posisi kemampuan siswa dibandingkan dengan anggota kelompoknya
cara memilih tujuan yang dievaluasi
*memilih tiap-tiap keterampilan prasarat
*memilih tujuan setiap program pembelajaran secara berimbang
*memilih yang berhubungan dengan tingkah laku fisik, mental dan perasaan
Mengukur semua tujuan instruksional khusus
Mengukur tujuan instruksional umum
Skoring (cara menyekor)
*menggunakan standar mutlak dan relatif
*menggunakan standar mutlak
*menggunakan standar relatif
F. Prinsip Evaluasi
Terdapat beberapa prinsip yang harus diperhatikan dalam melaksanakan evaluasi, agar mendapat informasi yang akurat, diantaranya:
1. Dirancang secara jelas abilitas yang harus dinilai, materi penilaian, alat penilaian, dan interpretasi hasil penilaian. à patokan : Kurikulum/silabi.
2. Penilaian hasil belajar menjadi bagian integral dalam proses belajar mengajar.
3. Agar hasil penilaian obyektif, gunakan berbagai alat penilaian dan sifatnya komprehensif.
4. Hasilnya hendaknya diikuti tindak lanjut.
Prinsip lain yang dikemukakan oleh Ngalim Purwanto adalah:
1. Penilaian hendaknya didasarkan pada hasil pengukuran yang komprehensif.
2. Harus dibedakan antara penskoran (scoring) dengan penilaian (grading)
3. Hendaknya disadari betul tujuan penggunaan pendekatan penilaian (PAP dan PAN)
4. Penilaian hendaknya merupakan bagian integral dalam proses belajar mengajar.
5. Penilaian harus bersifat komparabel.
6. Sistem penilaian yang digunakan hendaknya jelas bagi siswa dan guru.
G. Pendekatan Evaluasi
Ada dua jenis pendekatan penilaian yang dapat digunakan untuk menafsirkan sekor menjadi nilai. Kedua pendekatan ini memiliki tujuan, proses, standar dan juga akan menghasilkan nilai yang berbeda. Karena itulah pemilihan dengan tepat pendekatan yang akan digunakan menjadi penting. Kedua pendekatan itu adalah Pendekatan Acuan Norma (PAN) dan Pendekatan Acuan Patokan (PAP).
Sejalan dengan uraian di atas, Glaser (1963) yang dikutip oleh W. James Popham menyatakan bahwa terdapat dua strategi pengukuran yang mengarah pada dua perbedaan tujuan substansial, yaitu pengukuran acuan norma (NRM) yang berusaha menetapkan status relatif, dan pengukuran acuan kriteria (CRM) yang berusaha menetapkan status absolut. Sejalan dengan pendapat Glaser, Wiersma menyatakan norm-referenced interpretation is a relative interpretation based on an individual’s position with respect to some group. Glaser menggunakan konsep pengukuran acuan norma (Norm Reference Measurement / NRM) untuk menggambarkan tes prestasi siswa dengan menekankan pada tingkat ketajaman suatu pemahaman relatif siswa. Sedangkan untuk mengukur tes yang mengidentifikasi ketuntasan / ketidaktuntasan absolut siswa atas perilaku spesifik, menggunakan konsep pengukuran acuan kriteria (Criterion Reference Measurement).
1. Penilaian Acuan Patokan (PAP), Criterion Reference Test (CRT)
Tujuan penggunaan tes acuan patokan berfokus pada kelompok perilaku siswa yang khusus. Joesmani menyebutnya dengan didasarkan pada kriteria atau standard khusus. Dimaksudkan untuk mendapat gambaran yang jelas tentang performan peserta tes dengan tanpa memperhatikan bagaimana performan tersebut dibandingkan dengan performan yang lain. Dengan kata lain tes acuan kriteria digunakan untuk menyeleksi (secara pasti) status individual berkenaan dengan (mengenai) domain perilaku yang ditetapkan / dirumuskan dengan baik.
Pada pendekatan acuan patokan, standar performan yang digunakan adalah standar absolut. Semiawan menyebutnya sebagai standar mutu yang mutlak. Criterion-referenced interpretation is an absolut rather than relative interpetation, referenced to a defined body of learner behaviors. Dalam standar ini penentuan tingkatan (grade) didasarkan pada sekor-sekor yang telah ditetapkan sebelumnya dalam bentuk persentase. Untuk mendapatkan nilai A atau B, seorang siswa harus mendapatkan sekor tertentu sesuai dengan batas yang telah ditetapkan tanpa terpengaruh oleh performan (sekor) yang diperoleh siswa lain dalam kelasnya. Salah satu kelemahan dalam menggunakan standar absolut adalah sekor siswa bergantung pada tingkat kesulitan tes yang mereka terima. Artinya apabila tes yang diterima siswa mudah akan sangat mungkin para siswa mendapatkan nilai A atau B, dan sebaliknya apabila tes tersebut terlalu sulit untuk diselesaikan, maka kemungkinan untuk mendapat nilai A atau B menjadi sangat kecil. Namun kelemahan ini dapat diatasi dengan memperhatikan secara ketat tujuan yang akan diukur tingkat pencapaiannya.
Dalam menginterpretasi skor mentah menjadi nilai dengan menggunakan pendekatan PAP, maka terlebih dahulu ditentukan kriteria kelulusan dengan batas-batas nilai kelulusan. Umumnya kriteria nilai yang digunakan dalam bentuk rentang skor berikut:
Rentang Skor Nilai
80% s.d. 100% A
70% s.d. 79% B
60% s.d. 69% C
45% s.d. 59% D
<>
2. Penilaian Acuan Norma (PAN), Norm Reference Test (NRT)
Tujuan penggunaan tes acuan norma biasanya lebih umum dan komprehensif dan meliputi suatu bidang isi dan tugas belajar yang besar. Tes acuan norma dimaksudkan untuk mengetahui status peserta tes dalam hubungannya dengan performans kelompok peserta yang lain yang telah mengikuti tes. Tes acuan kriteria Perbedaan lain yang mendasar antara pendekatan acuan norma dan pendekatan acuan patokan adalah pada standar performan yang digunakan.
Pada pendekatan acuan norma standar performan yang digunakan bersifat relatif. Artinya tingkat performan seorang siswa ditetapkan berdasarkan pada posisi relatif dalam kelompoknya; Tinggi rendahnya performan seorang siswa sangat bergantung pada kondisi performan kelompoknya. Dengan kata lain standar pengukuran yang digunakan ialah norma kelompok. Salah satu keuntungan dari standar relatif ini adalah penempatan sekor (performan) siswa dilakukan tanpa memandang kesulitan suatu tes secara teliti. Kekurangan dari penggunaan standar relatif diantaranya adalah (1) dianggap tidak adil, karena bagi mereka yang berada di kelas yang memiliki sekor yang tinggi, harus berusaha mendapatkan sekor yang lebih tinggi untuk mendapatkan nilai A atau B. Situasi seperti ini menjadi baik bagi motivasi beberapa siswa. (2) standar relatif membuat terjadinya persaingan yang kurang sehat diantara para siswa, karena pada saat seorang atau sekelompok siswa mendapat nilai A akan mengurangi kesempatan pada yang lain untuk mendapatkannya.
H. Bila jumlah pesertanya ratusan, maka untuk memberi nilainya menggunakan statistik sederhana untuk menentukan besarnya skor rata-rata kelompok dan simpangan baku kelompok (mean dan standard deviation) sehingga akan terjadi penyebaran kemampuan menurut kurva normal.