BAB I
PENDAHULUAN
A.
Latar
Belakang Masalah
Tes merupakan alat
ukur, pengukuran merupakan proses pemberian angka yang bersifat kuantitatif dan
penilaian merupakan proses pengambilan keputusan yang bersifat kualitatif
berdasarkan hasil pengukuran. Pengukuran adalah proses pemberian angka atau
usaha memperoleh deskripsi numerik dari suatu tingkatan di mana seorang peserta
didik telah mencapai karakteristik tertentu. Kemampuan dalam pengukuran ini
dibutuhkan keahlian tersendiri. Oleh sebab itu, kemampuan dalam membuat tes dan
melakukan pengukuran dan penilaian merupakan kemampuan profesional yang harus
dimiliki oleh guru.
Tes sebagai alat penilaian adalah
pertanyaan-pertanyaan yang diberikan kepada siswa untuk mendapat jawaban dari
siswa dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tulisan), atau
dalam bentuk perbuatan (tes tindakan). Tes pada umumnya digunakan untuk menilai
dan mengukur hasil belajar siswa, terutama hasil belajar kognitif berkenaan
dengan penguasaan bahan pengajaran sesuai dengan tujuan pendidikan dan
pengajaran. Untuk dapat menentukan nilai, diperlukan
adanya ukuran atau kriteria yang dijadikan dasar. Untuk menentukan bahwa suatu
sistem itu baik atau kurang baik, perlu ada ketentuan tentang bagaimana yang
baik tersebut, dan ketentuan inilah yang disebut kriteria.[1]
Pencapaian hasil belajar siswa yang rendah tidak selalu
menunjukkan kompetensi siswa yang rendah atau pembelajaran yang kurang
bermakna. Pencapaian tersebut mungkin disebabkan oleh kualitas instrumen hasil
belajar yang kurang memadai. Untuk meningkatkan kualitas instrumen hasil
belajar dalam bentuk tes dapat dilakukan dengan cara analisis soal. Di samping
itu hasil analisis juga dapat memberikan informasi untuk perbaikan pembelajaran
jika ada masalah dalam pembelajaran. Analisis butir soal menghasilkan soal yang
siap direvisi.
Pengembangan bank soal akan mempermudah guru atau sekolah
dalam menyediakan soal yang sudah diketahui kualitasnya dalam aspek spesifikasi
dan karakteristiknya. Tes adalah satu atau seperangkat pertanyaan yang
direncanakan untuk memperoleh informasi akurat tentang hasil belajar.
Pertanyaan tersebut harus mempunyai jawaban yang benar. Tes dapat berupa tes
formatif yang dimaksudkan untuk mengetahui apakah siswa sudah atau belum
memahami materi yang diajarkan oleh guru. Tes juga dapat berupa tes sumatif
yang merupakan tes hasil belajar dalam suatu periode waktu tertentu sesuai
kebutuhan.
Kedudukan
evaluasi dalam proses belajar mengajar sangat penting dan tidak dapat
dipisahkan. Demikian juga, agar proses evaluasi itu berfungsi dengan semestinya
dan sesuai tujuan, maka alat evaluasi itu sendiri harus baik. Hal ini
seringkali dilupakan oleh para praktisi pendidikan di lapangan, mereka hanya
berhenti pada pelaporan hasil evaluasi tanpa merasa perlu untuk mengetahui
seberapa baik alat evaluasi yang telah mereka gunakan. Alat evaluasi yang
dimaksud adalah tes hasil belajar yang berisi butir-butir soal.
B.
Perumusan
Masalah
Berdasarkan uraian
latar belakang masalah di atas, maka dapat dirumuskan permasalahan-permasalahan
sebagai berikut :
1. Apa
yang dimaksud dengan analisis butir soal?
2. Bagaimana
teknik menganalisis butir soal secara kuantitatif?
C.
Tujuan
Pembahasan
Berdasarkan uraian
latar belakang dan perumusan masalah di atas, maka tujuan pembahasan dalam
makalah ini adalah sebagai berikut :
1. Untuk
mengetahui apa yang dimaksud dengan analisis butir soal;
2. Untuk
mengetahui bagimana menganalisis butir soal secara kuantitatif.
BAB II
PEMBAHASAN
A.
Pengertian
Analisis Butir Soal
Menganalisis
butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk meningkatkan mutu soal yang telah ditulis.
Kegiatan ini merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa
untuk membuat keputusan tentang setiap
penilaian.[2] Tujuan penelaahan adalah untuk mengkaji
dan menelaah setiap butir
soal agar diperoleh soal yang bermutu sebelum soal digunakan. Di samping
itu, tujuan analisis butir soal juga untuk membantu meningkatkan tes melalui
revisi atau membuang soal yang tidak efektif, serta untuk mengetahui informasi
diagnostik pada siswa apakah mereka sudah atau belum
memahami materi yang telah diajarkan.[3] Soal yang bermutu adalah soal yang dapat
memberikan informasi setepat-tepatnya sesuai dengan tujuannya di antaranya dapat menentukan peserta didik mana yang
sudah atau belum menguasai materi yang diajarkan guru.
Dalam melaksanakan analisis butir soal, para penulis
soal dapat menganalisis secara kualitatif,
dalam kaitan dengan isi dan bentuknya, dan kuantitatif dalam kaitan dengan
ciri-ciri statistiknya[4] atau prosedur
peningkatan secara judgment dan
prosedur peningkatan secara empirik. Analisis kualitatif mencakup pertimbangan validitas isi dan konstruk, sedangkan analisis
kuantitatif mencakup pengukuran kesulitan butir soal dan diskriminasi soal yang termasuk validitas soal dan
reliabilitasnya.
Jadi, ada dua cara yang dapat digunakan dalam
penelaahan butir soal yaitu penelaahan
soal secara kualitatif dan kuantitatif. Kedua teknik ini masing-masing memiliki
keunggulan dan kelemahan.
Oleh karena itu teknik terbaik
adalah menggunakan keduanya (penggabungan).
B.
Teknik
Analisis Butir Soal secara Kuantitatif
Setelah data terkumpul dari hasil pengumpulan data, perlu segera diadakan
pengolahan data. Secara garis besar, pekerjaan analisis data meliputi tiga
langkah, yaitu :
1.
Perispan;
2.
Tabulasi; dan
3.
Penerapan data sesuai dengan pendekatan
penelitian.[5]
Penelaahan soal secara
kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir
soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern. Analisis butir soal secara klasik adalah proses penelaahan butir soal
melalui informasi dari jawaban peserta
didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik.
Kelebihan analisis butir soal secara klasik adalah
murah, dapat dilaksanakan sehari-hari
dengan cepat menggunakan komputer, murah, sederhana, familier dan dapat menggunakan data dari beberapa
peserta didik atau sampel kecil. Adapun proses analisisnya sudah banyak dilaksanakan para guru di sekolah
seperti beberapa contoh di bawah ini.
1.
Langkah pertama yang
dilakukan adalah menabulasi jawaban yang telah dibuat pada setiap butir soal
yang meliputi berapa peserta didik yang: (1) menjawab benar pada setiap soal,
(2) menjawab salah (option pengecoh), (3) tidak menjawab soal. Berdasarkan
tabulasi ini, dapat diketahui tingkat kesukaran setiap butir soal, daya pembeda
soal, alternatif jawaban yang dipilih peserta didik.
2.
(1) urutkan skor siswa
dari yang tertinggi sampai yang terendah. (2) Pilih lembar jawaban pada
kelompok atas dan lembar jawaban pada kelompok bawah. (3) Ambil kelompok tengah
dan tidak disertakan dalam analisis. (4) Untuk masing-masing soal, susun jumlah
siswa kelompok atas dan bawah pada setiap pilihan jawaban. (5) Hitung tingkat
kesukaran pada setiap butir soal. (6) Hitung daya pembeda soal. (7) Analisis
efektivitas pengecoh pada setiap soal.
Aspek yang perlu diperhatikan dalam analisis butir
soal secara klasik adalah setiap butir soal ditelaah dari segi : tingkat
kesukaran butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal
bentuk obyektif) atau frekuensi jawaban pada setiap pilihan jawaban.
a. Tingkat Kesukaran (TK)
Tingkat kesukaran soal adalah
peluang untuk menjawab benar suatu soal pada tingkat
kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat
kesukaran ini pada umumnya dinyatakan dalam bentuk
proporsi yang besarnya berkisar 0,00 - 1,00. Semakin besar indeks tingkat kesukaran yang
diperoleh dari hasil hitungan, berarti
semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK=
1,00 artinya bahwa siswa menjawab benar. Perhitungan
indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh
peserta didik pada butir soal yang
bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan untuk soal obyektif :
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes.
Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki tingkat
kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang memiliki tingkat
kesukaran tinggi/sukar, dan untuk keperluan diagnostik biasanya digunakan butir
soal yang memiliki tingkat kesukaran rendah/mudah.
Untuk mengetahui tingkat kesukaran soal bentuk uraian digunakan rumus berikut ini.
Hasil perhitungan dengan menggunakan rumus di atas
menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat kesukaran soal
dapat dicontohkan seperti berikut ini :
0,00 - 0,30 soal tergolong sukar
0,31 - 0,70 soal tergolong sedang
0,71 - 1,00 soal tergolong mudah
Tingkat kesukaran butir soal dapat
mempengaruhi bentuk distribusi total skor tes. Untuk tes yang sangat sukar (TK=
< 0,25) distribusinya berbentuk positif skewed,
sedangkan tes yang mudah dengan TK= >0,80) distribusinya berbentuk negatif skewed.
Di samping kedua kegunaan di atas, dalam konstruksi
tes, tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir
dapat: (1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan
penyebaran skor tes atau jumlah soal dan korelasi antarsoal), (2) berhubungan
dengan reliabilitas. Tingkat kesukaran butir soal juga dapat digunakan untuk
mempredikst alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam
memahami materi yang diajarkan guru.
Namun, analisis secara klasik ini memang memiliki
keterbatasan, yaitu bahwa tingkat kesukaran sangat sulit untuk mengestimasi
secara tepat karena estimasi tingkat kesukaran dibiaskan oleh sampel.[6]
Jika sampel berkemampuan tinggi, maka soal akan sangat mudah (TK= >0,90).
Jika sampel berkemampuan rendah, maka soal akan sangat sulit (TK = < 0,40).
b. Daya Pembeda (DP)
Daya pembeda soal adalah kemampuan suatu butir soal
dapat membedakan antara warga belajar/siswa yang telah menguasai materi yang
ditanyakan dan warga belajar/siswa yang tidak/kurang/belum menguasai materi
yang ditanyakan. Manfaat daya pembeda butir soal adalah seperti berikut ini :
1) Untuk
meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal
dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak.
2) Untuk mengetahui seberapa jauh setiap butir
soal dapat mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah
memahami atau belum memahami materi yang diajarkan guru.
Indeks
daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk proporsi.
Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang
bersangkutan membedakan warga belajar/siswa yang telah memahami materi dengan
warga belajar/peserta didik yang belum memahami materi. Indeks daya pembeda
berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu
soal, maka semakin kuat/baik soal itu. Jika daya pembeda negatif (<0)
berarti lebih banyak kelompok bawah (warga belajar/peserta didik yang tidak
memahami materi) menjawab benar soal dibanding dengan kelompok atas (warga
belajar/peserta didik yang memahami materi yang diajarkan guru).
Untuk
mengetahui daya pembeda soal bentuk pilihan ganda adalah dengan menggunakan
rumus berikut ini.
DP = daya pembeda soal,
BA = jumlah jawaban benar pada
kelompok atas,
BB =
jumlah jawaban benar pada kelompok bawah, N=jumlah siswa yang mengerjakan tes.
Untuk
mengetahui daya pembeda soal bentuk uraian adalah dengan menggunakan rumus
berikut ini :
Hasil perhitungan dengan menggunakan rumus di atas dapat
menggambarkan tingkat kemampuan soal dalam membedakan antar peserta didik yang
sudah memahami materi yang diujikan dengan peserta didik yang belum/tidak
memahami materi yang diujikan. Adapun klasifikasinya adalah seperti berikut ini
:
0,40 -
1,00 soal diterima baik
0,30 -
0,39 soal diterima tetapi perlu
diperbaiki
0,20 -
0,29 soal diperbaiki
0,19 -
0,00 soal tidak dipakai/dibuang
c. Penyebaran (Distribusi)
Jawaban
Penyebaran
pilihan jawaban dijadikan dasar dalam penelaahan soal. Hal ini dimaksudkan untuk mengetahui berfungsi
tidaknya jawaban yang tersedia. Suatu pilihan jawaban (pengecoh) dapat
dikatakan berfungsi apabila pengecoh :
1) paling
tidak dipilih oleh 5 % peserta tes/siswa,
2) lebih
banyak dipilih oleh kelompok siswa yang belum paham materi.
d.
Reliabilitas Skor Tes
Tujuan
utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat
ketepatan (precision) dan keajegan (consistency) skor tes. Indeks reliabilitas berkisar antara 0 -
1. Semakin tinggi koefisien reliabilitas suatu tes (mendekati 1), makin tinggi pula keajegan/ketepatannya.
Tes yang memiliki konsistensi
reliabilitas tinggi adalah akurat, reproducible, dan generalized terhadap
kesempatan testing dan instrumen tes lainnya. Secara rinci faktor yang
mempengaruhi reliabilitas skor tes di antaranya :
1)
Semakin banyak jumlah
butir soal, semakin ajek suatu tes.
2)
Semakin lama waktu tes,
semakin ajek.
3)
Semakin
sempit range kesukaran butir soal,
semakin besar keajegan.
4)
Soal-soal
yang saling berhubungan akan mengurangi keajegan.
5)
Semakin
objektif pemberian skor, semakin besar keajegan.
6)
Menjawab besar soal
dengan cara menebak.
7)
Semakin homogen materi
semakin besar keajegan.
8)
Menjawab soal dengan
buru-buru/cepat.
9)
Kesiapan mental
peserta ujian.
10) Adanya gangguan dalam pelaksanaan tes.
11)
Jarak antara tes
pertama dengan tes kedua.
Ada
3 cara yang dapat dilakukan untuk menentukan reliabilitas skor tes, yaitu :
1)
Keajegan pengukuran
ulang : kesesuaian antara hasil pengukuran pertama dan kedua dari sesuatu alat
ukur terhadap kelompok yang sama.
2)
Keajegan pengukuran
setara: kesesuaian hasil pengukuran dan 2 atau lebih alat ukur berdasarkan
kompetensi kisi-kisi yang lama.
3)
Keajegan belah dua:
kesesuaian antara hasil pengukuran belahan pertama dan belahan kedua dari alat
ukur yang sama.
e. Reliabilitas
Instrumen Tes (soal bentuk pilihan ganda)
Untuk
mengetahui koefisien reliabilitas tes soal bentuk pilihan ganda digunakan rumus
Kuder Richadson 20 (KR-20) seperti berikut ini.
Keterangan:
k :
Jumlah butir soal
(SD)2 :
Varian
BAB III
PENUTUP
A.
Kesimpulan
Ada
dua cara yang dapat digunakan dalam penelaahan
butir soal yaitu penelaahan soal secara kualitatif dan kuantitatif. Kedua teknik ini
masing-masing memiliki keunggulan dan kelemahan. Oleh karena itu teknik terbaik
adalah menggunakan keduanya (penggabungan).
Penelaahan soal secara
kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir
soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah
diujikan. Ada dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern. Analisis
butir soal secara klasik adalah proses penelaahan butir soal melalui informasi
dari jawaban peserta didik guna
meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik.
Aspek yang perlu diperhatikan dalam analisis butir soal
secara klasik adalah setiap butir soal ditelaah dari segi : tingkat kesukaran
butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk
obyektif) atau frekuensi jawaban pada setiap pilihan jawaban.
B.
Saran
1. Analisis
butir soal secara kuantitatif memerlukan ketelitian dan pengetahuan yang lebih,
sehingga seyogyanya analisis ini dilakukan oleh para pakar dari berbagai
disiplin ilmu yang terkait;
2. Analisis
secara kuantitatif hendaknya dilaksanakan oleh para penganalisis
melaksanakannya seobjektif mungkin, agar hasilnya optimal dan akuntabel;
3. Penganalisis
hendaknya menggunakan prosedur standar yang telah dibakukan dalam menganalisis
butir soal, sehingga tingkat error dapat
diminimalisir.
DAFTAR PUSTAKA
Arikunto,
Suharsimi. 2006. Prosedur Penelitian
Suatu Pendekatan Praktik, Revisi VI, Cet. 13. Jakarta : Rineka Cipta.
Aiken,
Lewis R. 1994. Psychological Testing and
Assessment, (Eight Edition), Boston:
Allyn and Bacon.
Anastasi, Anne and Urbina, Susana. 1997. Psicoholological Testing. (Seventh Edition).
New Jersey: Prentice-Hall, Inc.
Haladyna, Thomas M. 1994. Developing and Validating Multiple-Choice
Test Items. New Jersey: Lawrence Erlbaum
Associates, Publishers.
Nitko,
Anthony J. 1996. Educational Assessment
of Students, Second Edition. Ohio: Merrill an Imprint of Prentice Hall
Englewood Cliffs.
Sudjana, Nana & Ibrahim. 2009. Penelitian
dan Penilaian Pendidikan, Cet. 5. Bandung : Sinar Baru Algensindo.
[1]
Dr. Nana Sudjana & Dr. Ibrahim, M.A, Penelitian
dan Penilaian Pendidikan, Cet. 5, (Bandung
: Sinar Baru Algensindo, 2009), hal. 219.
[2]
Anthony Nitko, Educational Assessment of
Students, Second Edition, (Ohio : Merrill an Imprint of Prentice Hall
Englewood Cliffs, 1996), hal. 308.
[3] Lewis R. Aiken, Psychological
Testing and Assessment, Eight
Edition, (Boston: Allyn and Bacon, 1994), hal. 63.
[4] Susana Anastasi &
Anne Urbina, Psicoholological Testing, Seventh Edition, (New
Jersey: Prentice-Hall, Inc., 1997), hal. 72.
[5]
Prof. Dr. Suharsimi Arikunto, Prosedur
Penelitian Suatu Pendekatan Praktik, Revisi VI, Cet. 13, (Jakarta : Rineka
Cipta, 2006), hal. 235.
[6] Thomas M Haladyna,
Developing and Validating Multiple-Choice
Test Items, (New Jersey:
Lawrence Erlbaum Associates, Publishers, 1994), hal.
145.
Tidak ada komentar:
Posting Komentar
Silakan tulis komentar Anda