Rabu, 24 Desember 2014
ANALISIS TES
BAB
1
PENDAHULUAN
A. Latar
Belakang Masalah
Usaha yang lebih baik yaitu untuk selalu meningkatkan
mutu tes yang disusun oleh seorang tenaga pendidik, namun hal ini tidak
dilaksanakan karena kecenderungan seseorang untuk beranggapan bahwa hasil
karyanya adalah yang terbaik atau setidak – tidaknya sudah cukup baik.
Tenaga pendidik yang sudah banyak berpengalaman
mengajar dan menyusun soal – soal tes, juga masih sukar menyadari bahwa tesnya
masih belum sempurna. Oleh karena itu, cara yang paling baik adalah secara
jujur melihat hasil yang diperoleh oleh siswa, masalah inilah yang
melatarbelakangi penulisan makalah ini yang berjudul Analisis Tes.
B. Rumusan
Masalah
Dari latar belakang
diatas, dapat dirumuskan sebagai berikut :
1.
Apa pengertian Analisis Tes?
2.
Bagaimana cara mengetahui Validitas Tes?
3.
Bagaimana cara mengetahui Reliabitas Tes?
4.
Bagaimana cara mengetahui Analisis Butir Soal?
C. Tujuan Penulisan
Dari rumusan masalah diatas akan
didapatkan sebagai berikut :
1.
Untuk mengetahui pengertian analisis tes;
2.
Untuk mengetahui cara validitas tes;
3.
Untuk mengetahui cara reliabitas tes;
4.
Untuk mengetahui analisis butir soal (item analysis).
BAB II
PEMBAHASAN
A. Pengertian Analisis Tes
Analisis tes adalah salah satu
kegiatan dalam rangka mengkonstruksi tes untuk mendapatkan gambaran tentang
mutu tes, baik mutu keseluruhan tes maupun mutu tiap butir soal/tugas. Analisis
dilakukan setelah tes disusun dan dicobakan kepada sejumlah subyek dan hasilnya
menjadi umpan balik untuk perbaikan/peningkatan mutu tes bersangkutan. Oleh
karena itu kegiatan analisis tes merupakan keharusan dalam keseluruhan proses
mengkonstruksi tes. Dalam analisis tes juga ada beberapa yang harus kita
perhatikan, diantaranya:
1.
Menilai tes yang dibuat sendiri
Secara teoritis, siswa dalam satu
kelas merupakan populasi atau kelompok yang keadaannya heterogen. Dengan
demikian, maka apabila dikenai sebuah tes akan tercermin hasilnya dalam suatu
kurva normal. Sebagai besar siswa berada di daerah sedang, sebagian kecil
berada di ekor kiri, dan sebagaian kecil yang lain berada di ekor kanan kurva.
Apabila keadaan setelah hasil
dianalisis tidak seperti yang diharapkan dalam kurva normal, maka tentu ada
“apa-apa” dengan soal tesnya.
Apabila hampir seluruh siswa
memperoleh skor jelek, berarti bahwa tes yang disusun mungkin terlalu sukar.
Sebaliknya jka seluruh siswa memperoleh skor baik, dapat diartikan bahwa tesnya
terlalu mudah. Tentu saja interpretasi terhadap soal tes akan lain seandainya
tes itu sudah disusun sebaik-baiknya sehingga memenuhi persyaratan sebagai tes.
Dengan demikian maka apabila kita
memperoleh keterangan tentang hasil tes, akan membantu kita dalam mengadakan
penilaian secara objektif terhadap tes yang kita susun.
Ada 4
(empat) cara untuk menilai tes, yaitu:
a.
Cara pertama meneliti secara jujur soal-soal yang
sudah disusun, kadang-kadang dapat diperoleh jawaban tentang ketidakjelasan
perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut.
Pertanyaan-pertanyaan tersebut,
antara lain:
1. Apakah
banyaknya soal untuk tiap topik sudah seimbang?
2 . Apakah semua soal
menanyakan bahan yang telah diajarkan?
b.
Cara kedua adalah mengadakan analisis soal (item
analysis). Analisis soal adalah suatu prosedur yang sistematis, yang akan
memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita
susun.
c.
Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting
dari tes buatan guru adalah validitas kurikuler (content validity). Untuk mengadakan checking validitas kurikuler,
kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas
sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.
d. Cara ke empat adalah dengan mengadakan checking reliabilita,
salah satu indikator untuk tes yang mempunyai reliabilitas tes yang tinngi
adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang
tinggi.
2.
Cakupan kegiatan analisis tes
Kegiatan
analisis tes meliputi empat hal yakni :
a.
Analisis validitas tes
b.
Analisis reliabilitas tes
c.
Analisis butir soal yang meliputi :
1. Analisis
daya pembeda tiap butir soal,
2. Analisis
tingkat kesukaran tiap butir soal,
3. Analisis
pengecoh (distraktor) pada setiap butir soal,
4. Analisis
homogenitas tiap butir soal.
d.
Analisis teknis kegunaan tes.
Dengan melakukan analisis tes, guru
dapat “menabung-soal” atau membuat “bank-soal” yakni kumpulan soal-soal yang
sudah teruji kebaikannya. Manfaat terbesar dari kegiatan analisis tes ialah
guru makin memahami bagaimana wujud tes yang baik, bagaimana butir soal yang
baik. Sehingga pada akhirnya guru makin terampil menyusun tes dengan baik dan
efisien
Kritik terhadap tes bentuk pilihan ganda yang dianggap
lebih buruk dari tes bentuk uraian karena “makin membodohkan siswa”, sebenarnya
bersumber pada tes pilihan ganda yang buruk. Tes pilihan ganda (tes obyektif)
yang baik, yang dianalisis dari berbagai segi dan digunakan sesuai tujuan
pendidikan, akan lebih baik dibanding tes bentuk uraian yang tidak dianalisis.
Oleh sebab itu tes bentuk apapun perlu dianalisis agar dapat terjamin
obyektifitas dan keakuratannya.
Pembahasan analisis tes di sini akan
terbatas pada tes buatan guru/dosen, dan bukan psikotes yang dibuat para ahli
atau THB yang dibakukan.
B. Validitas
Validitas tes adalah tingkat
keabsahan atau ketepatan suatu tes. Tes yang valid (absah = sah) adalah tes
benar-benar mengukur apa yang hendak diukur. Dengan kata lain, validitas tes
menunjukkan tingkat ketepatan tes dalam mengukur sasaran yang hendak diukur.
1. Macam-macam
validitas
a. Validitas
logis
Logis yang berati penalaran, validitas logis bearti
sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang
memenuhi persysratan valid berdasarkan hasi penalaran.Validitas logis dapat
dicapai apabila instrumen disusun mengikuti ketentuan yang ada, Dapat
disimpukan bahwa validitas logis tidak perlu diuji kondisi nya tetapi langsung
diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh
sebuah instrumen yaitu validitas isi dan validitas konstrak.
1. Validitas isi bagi sebuah instrumen
menunjuk suatu kondisi sebuah instrument yang disusun berdasarkan isi materi
pelajaran yang dievaluasi. Sebuah tes dikatakan memiliki validitas isi apabila
mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran
yang di berikan.
2. Validitas konstruk sebuah instrumen
menunjukkan suatu kondisi sebuah instrumen yang disusun berdasarkan
konstruk-konstruk aspek kejiwaan yang seharusnya dievaluasi. Sebuah tes
dikatakan memiliki validitas konstruk apabila butir-butir soal yang membangun
tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam
tujuan instruksional khusus.
b. Validitas Empiris
Mengandung
arti kata pengalaman. Sebuah instrument dikatakan memiliki validitas empiris
apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang dapat diakui
jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang jujur.
Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya
sehingga dia menjadi valid. Pengujian itu dilakuakn dengan membandingkan
kondisi instrumen yang bersangkutan dengan suatu ukuran. Kriteria yang
digunakan adalah
1. Validitas Konkuren
Disebut
juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan validitas
empiris. Sebuah instrument dikatakan memiliki validitas empiris jika hasilnya
sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang
dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada. Dalam membandingkan hasil sebuah tes
maka diperlukan suatu alat pembanding. Maka hasil tes merupakan sesuatu yang
dibandingkan.
2. Validitas prediksi
Prediksi artinya meramal, dengan
meramal selalu mengenai hal yang akan datang jadi sekarang belum terjadi.
Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai kemampuan
untuk meramalkan apa yang terjadi pada masa yang akan datang. Misalnya
tes masuk perguruan tinggi adalah sebuah tes yang diperkirakan dapat meramalkan
keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Sebagai alat pembanding validitas prediksi
adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran
diperguruan tinggi.
2 . cara mengukur validitas alat
ukur
Sebuah tes dikatakan valid apabila
memilki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang
digunakan untuk mengetahui jesejajaran adalah teknuk korelasi produk moment,
Rumusnya yaitu:
a. Korelasi produk momen dengan simpangan
Dimana :
rxy = koefisien korelasi antara variabel X dan variabel Y
∑xy =jumlah perkalian x dengan y
x2 = kuadrat dari x
y2
= kuadrat dari Y
contoh
perhitungan :
misalnya
akan menghitung validitas tes prestasi belajar matematika. Sebagai kriteria
diambil rata-rata ulangan yang akan di cari validitas nya diberi kode X dan
rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai
berikut :
No
|
Nama
|
X
|
Y
|
x
|
y
|
x2
|
y2
|
xy
|
1
|
Ucha
|
6,5
|
6,3
|
0
|
-0,1
|
0,0
|
0,01
|
0,0
|
2
|
Eva
|
7
|
6,8
|
+0,5
|
+0,4
|
0,25
|
0,16
|
+0,2
|
3
|
Iref
|
7,5
|
7,2
|
+1,0
|
+0,8
|
1,0
|
0,64
|
+0,8
|
4
|
Ice
|
7
|
6,8
|
+0,5
|
+0,4
|
0,25
|
0,16
|
+02
|
5
|
Rusdi
|
6
|
7
|
-0,5
|
+0,6
|
0,25
|
0,36
|
-0,3
|
6
|
Iceh
|
6
|
6,2
|
-0,5
|
-0,2
|
0,25
|
0,04
|
+0,1
|
7
|
Eki
|
5,5
|
5,1
|
-1,0
|
-1,3
|
1,0
|
1,69
|
+1,3
|
8
|
Oma
|
6,5
|
6
|
0
|
-0,4
|
0,0
|
0,16
|
0,0
|
9
|
Harti
|
7
|
6,5
|
+
0,5
|
+0,1
|
0,25
|
0,01
|
+0,05
|
10
|
Rina
|
6
|
5,9
|
-
0,5
|
-0,6
|
0,25
|
0,36
|
+0,3
|
Jumlah
|
65,0
|
63,8
|
|
|
3,5
|
3,59
|
2,65
|
X=
∑X / N =6,5
Ȳ=∑Y
/ N =6,38 dibulatkan 6,4
x=
X-X
y=Y-Y
dimasukan
kedalam rumus
=
=
=0,748
b. Rumus
korelasi produk momen dengan angka kasar
rXY
=
dimana
:
rxy
= koefisien korelasi antara variabel Xdan variabel Y
No
|
Nama
|
X
|
Y
|
X2
|
Y2
|
XY
|
1
|
Ucha
|
6,5
|
6,3
|
42,25
|
39,69
|
40,95
|
2
|
Eva
|
7
|
6,8
|
49
|
46,24
|
47,6
|
3
|
Iref
|
7,5
|
7,2
|
56,25
|
51,84
|
54
|
4
|
Ice
|
7
|
6,8
|
49
|
46,24
|
47,6
|
5
|
Rusdi
|
6
|
7
|
36
|
49
|
42
|
6
|
Iceh
|
6
|
6,2
|
36
|
38,44
|
37,2
|
7
|
Eki
|
5,5
|
5,1
|
30,25
|
26,01
|
28,05
|
8
|
Oma
|
6,5
|
6
|
42,25
|
45,5
|
39
|
9
|
Harti
|
7
|
6,5
|
49
|
36
|
045,5
|
10
|
Rina
|
6
|
5,9
|
36
|
34,81
|
35,4
|
Jumlah
|
65,0
|
63,8
|
426,0
|
410,52
|
417,3
|
Dimasukan
kedalam rumus:
rXY =
rXY =
C.
Reliabilitas
Reliabilitas tes adalah tingkat keajegan (konsistensi)
suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor
yang ajeg/konsisten (tidak berubah-ubah). Tes yang reliabel atau dapat
dipercaya adalah tes yang menghasilkan skor secara ajeg, relatif tidak berubah
walaupun diteskan pada situasi dan waktu yang berbeda-beda. Sebaiknya, tes yang
tidak reliabel seperti karet untuk mengukur panjang, hasil pengukuran dengan
karet dapat berubah-ubah ( tidak konsisten ).
Beberapa
hal yang sedikit banyak mempengaruhi hasi tes banyak sekali.
a. Hal yang berhubungan dengan tes itu
sendiri ,yaitu panjang tes dan kualitas butir-burtir soalnya.dalam menghitung
besar nya realibilitas berhubung dengan penambahan banyak nya butir soal dalam
tes ini ada sebuah rumus yang diberikan oleh spearman dan brown
b. Hal yang berhubungan dengan tercoba,
tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukan reliabilitas
yang lebih besar dari pada yang dicobakan pada kelompok tertentu yang di ambil
secara dipilih.
c. Hal yang berhubungan dengan
penyenggaraan tes, Sudah disebutkan bahwa faktor penyenggaraan tes yang
bersifat administrasif sangat menentukan hasil tes.
Cara-cara mencari besar nya
reliabilitas :
1.
Tes-retest method (metoda tes ulang)
Suatu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan terhadap
kelompok siswa tertentu dua kali dengan jangka waktu tertentu (misalnya satu
semester atau satu catur wulan).
Skor hasil pengetesan pertama dikorelasikan dengan skor hasil pengetesan
kedua. Koefisien korelasi yang diperoleh menunjukkan koefisien reliabilitas tes
tersebut.
Contoh:
Siswa
|
Tes
Pertama
|
Tes Kedua
|
||
Skor
|
Ranking
|
Skor
|
Ranking
|
|
A
|
15
|
3
|
20
|
3
|
B
|
20
|
1
|
25
|
1
|
C
|
9
|
5
|
15
|
5
|
D
|
18
|
2
|
23
|
2
|
E
|
12
|
4
|
18
|
4
|
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua
siswa.
Metode ini disebut self-correlation
method (korelasi diri sendiri) karena mengkorelasikan hasil dari tes yang
sama.
2.
Paralel test method (metoda tes parallel)
Cara ini mengharuskan adanya dua tes yang parallel, yakni dua tes yang
disusun dengan tujuan yang sama (hanya sedikit perbedaan redaksi, isi atau
susunan kalimatnya). Dua tes tersebut diadministrasikan pada satu kelompok
siswa dengan perbedaan waktu beberapa hari saja. Skor dari kedua macam tes
tersebut dikorelasikan dengan teknik yang sama seperti pada metode tes-retest.
Koefisien korelasi yang diperoleh menunjukkan tingkat reliabilitas tes.
3.
Split-half method (metode belah dua)
Kelemahan penggunaan metode dua-tes kali percobaan dan satu-tes dua kali
percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam
menggunakan metode ini pengetes hanya
menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial-method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien
dan korelasi langsung ditafsirkan itulah koefisien reliabitas maka dengan
metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan
mengkorelasikan dua belahan, baru diketahui reliabitas separo tes.
D. Cara Mengetahui
Analisis Butir Soal (Item Analysis)
Analisis butir soal atau analisis item adalah
pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang
memiliki kualitas yang memadai. Ada dua jenis analisis butir soal, yakni
analisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas
dab reliabitas. Menganalisis tingkat kesukaran soal artinya mengkaji soal-soal
mana yang termasuk mudah, sedang dan sukar. Sedangkan menganalisis daya pembeda
artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam
membedakan siswa yang termasuk ke dalam kategori lemah atau rendah dan kategori
kuat atau tinggi prestasinya. Sedangkan validitas dan reliabitas mengkaji
kesulitan dan keajegan pertanyaan tes.
Salah
satu cara untuk memperbaiki proses belajar-mengajar yang paling efektif ialah
dengan jalan mengevaluasi test hasil belajar yang diperoleh hasil belajar dari
proses belajar-mengajar itu sendiri. Dengan kata lain, hasil test itu kita oleh
sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui kompenan-kompenan
manakakah dari proses belajar-mengajar itu yang masih lemah.
a. Taraf kesukaran
Asumsi yang
digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi
validitas dan reliabitas, adalah adanya keseimbangan dari tingkat kesulitan soal
tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang termasuk
mudah, sedang, sukar secara proporsional. Tingkat kesukaran soal dipandang dari
kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut
guru sebagai pembuat soal. Persoalan yanng penting dalam melakukan analisis
tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal yang
termasuk mudah, sedang, dan sukar.
Soal yang
baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal tersebut indeks
kesukaran (difficulty index).
Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini
menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukan
bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalnya
terlalu mudah.
Rumus
mencari P (indeks kesukaran ) :
P=
P = Indeks kesukaran
B = Banyaknya siswa yang menjawab soal itu dengan
betul
JS = Jumlah seluruh siswa peserta tes
Menurut
Ketentuan Yang Sering Diikuti, Indeks Kesukaran Sering diklasifikasikan sebagai
berikut, soal dengan P1,00 sampai 0,30 adalah soal sukar, soal dengan P0,30
sampai 0,70 adlah soal sedang dan soal dengan P 0,70 sampai 1,00 adalah soal
mudah.
Contoh
penggunaan
Misalnya
jumlah siswa peserta tes dalam suatu kelas ada 40 orang. Dari 40 orang siswa
tersebut yang dapat mengerjekan soal no 1 dengan betul.maka indeks kesukarannya
adalah :
P=
=
=0,30
Dari tabel yang disajikan tersebut,dapat ditafsirkan bahwa:
ü
Soal
nomor 1 mempunyai taraf kesukaran
= 0,5
ü
Soal
nomor 9 adalah soal yang tersuukar karena hanya dapat dijawab betul oleh 2
orang P=
=0,1
ü
Soal
nomor13 adalah yang paling mudah karena siswa perserta tes,dapat menjawab.
Indeks kesukaranya=
=1,0
Menurut ketentuan yang sering
diikuti, indeks kesukaran serta diklasifikasikan sebagai berikut:
-
Soal
dengan P 1,00 sampai 0,30 adalah sukar
-
Soal
dengan P 0,30 sampai 0,70 adalah soal sedang
-
Soal
dengan P 0,70 sampai 1,00 adalha soal
muadh
b. Daya Pembeda
Daya pembeda soal adalah kemampuan sesuatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang
bodoh (berkemampuan rendah).
Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi,
disingkat D (d besar). Seperti hanya indeks kesukaran, indeks diskriminasi
(daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks
kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi
digunakan jika sesuatu soal “terbalik” menunjukan kualitas testee. Yaitu anak
pandai disebut bodoh dan anak bodoh disebut pandai. Dengan demikian ada tiga
titik pada daya pembeda, yaitu:
.daya
pembeda daya pembeda daya pembeda
negatif rendah tinggi (positif)
Bagi soal yang dapat dijawab benar oleh siswa pandai
maupun siswa bodoh, maka soal itu tidak baik karena tidak mempunyai daya
pembeda. Demikian pula jika semua siswa baik pandai maupun bodoh tidak dapat
menjawab dengan benar. Soal tersebut tidak baik juga karena tidak mempunyai
daya pembeda. Soal yang baik adalah soal yang dapat dijawab benar oleh
siswa-siswa pandai saja.
Analisis daya pembeda mengkaji butir-butir soal dengan
tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong
mampu (tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah
prestasinya. Artinya, bila soal tersebut diberikan kepada anak yang mampu,
hasilnya menunjukan prestasi yang tinggi; dan bila diberikan kepada siswa yang
lemah, hasilnya rendah. Tes dikatakan tidak memiliki daya pembeda apabila tes
tersebut, jika diujikan kepada anak berprestasi, hasilnya rendah, tetapi bila
diberikan kepada anak yang lemah hasilnya lebih tinggi. Atau bila diiberikan
kepada kedua kategori siswa tersebut, hasilnya sama aja. Dengan demikian, tes
yang tiidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil yang
sesuai dengan kemampuan siswa yang sebenarnya. Sungguh aneh bila anak pandai
tidak lulus, tetapi anak bodoh lulus dengan baik tanpa dilakukan manipulasi
oleh si penilai atau di luar faktor kebetulan.
Cara
menentukan daya pembeda(nilai D)
Untuk ini
perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100
ke atas )
a. Untuk kelompok kecil
Seluruh
kelompok teste dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah.
Contoh :Siswa Skor
A 9
B 8
C 7
D 7
E 6
F 5
G 5
H 4
I 4
J 3
Seluruh
pengikut tes,dideretkan mulai dari skor teratas sama terbawah,lalu dibagi 2.
b. Untuk kelompok besar
c. Mengingat biaya dan waktu untuk
menganalisis,maka untuk kelompok besar biasnya hanya diambil kedua kutubnya saja,ya 27%skor teratas sebagaibkelompok atas (JA)
dan 27%
d. Untuk kelompokbesar
e. Mengingat biaya dan waktu untuk
menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutub saja
yaitu 27% teratas sebagai kelompok atas
(JA)dan 27%skor terbawah sebagai kelompk bawah(JB)
Rumus
mencari D
D=
=
PA-PB
Dimana :
D
= Daya pembeda
J
= jumlah peserta tes
JA
= banyak peserta kelompok atas
JB
= banyak peserta kelompok bawah
BA
= banyaknya peserta kelompok atas yang menjawab soal
itu dengan benar
BB
= banyak peserta kelompok bawah yang menjawab
soal dengan benar
PA
= proporsi peserta kelompok atas yang menjawab benar ( ingat P sebagai indeks
kesukaran )
PB
= Proporsi peserta kelompok bawah yang menjawab benar
Contoh
perhitungan
Dari hasil
analisis tes yang trdiri dari sepuluh butir soal yang dikerjakan oleh 20 orang
siswa,terdapat tabel sebagai berikut :
Dari hasil
analisis tes yang terdiri dari 10 butir soal yang dikerjakan oleh 20 orang
siswa, didapat skor sebagai berikut:
A = 5
F = 6
K = 7
P = 3
B = 7
G = 6
L = 5
Q = 8
C = 8
H = 6
M = 3
R = 8
D = 5
I = 8
N = 7
S = 6
E = 10
J = 7
O = 9
T = 6
Dari angka
yang belum teratur tersebut kemudian dibuat urutan penyebaran, dari skor yang
paling tinggi ke skor yang paling rendah.
Uraian
ini menunjukkan adanya kelompok atas ( JA) dan kelompok bawah ( JB).
Pada uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini mempermudah menentukan BA dan BB.
Pada uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini mempermudah menentukan BA dan BB.
Dimana
BA =
Banyaknya siswa yang menjawab benar pada kelompok atas A dan
BB =
banyaknya siswa yang menjawab benar pada kelompok bawah B
Seperti
yang diketahui, soal yang baik adalah soal yang dapat membedakan antara anak
berkemampuan tinggi dengan anak berkemampuan rendah, dilihat dari dapat atau
tidaknya ia mengerjakan soal tes.
Bila
diperhatikan tabel diatas, dilihat khusus untuk butir soal no satu, dari
kelompok atas yang menjawab benar adalah 8 orang, dari kelompok bawah yang
menjawab betul adalah 3 orang. Dan diterapkan rumus daya pembeda maka :
JA
= 10
JB
= 10
PA
= 0,8
PB
= 0,9
BA
= 8
BB
= 9
Maka D
= PA – P B
=
0,8 – 0,9
D =
0,1
Dengan
demikian maka daya pembeda untuk soal no 1 adalah 0,1 dan ini berarti butir
soal no satu ini jelek.
Klasifikasi
daya pembeda yaitu ;
D = 0,00 –
0,20 : jelek
D = 0,21 –
0,40 : cukup
D = 0,41 –
0,70 : baik
D = 0,71 –
1,00 : baik sekali
D =
negatif, semuanya tidak baik, jadi semua butir soal yang mempunyai nilai D
negatif sebaiknya dibuang saja.
BAB III
PENUTUP
A. Kesimpulan
Analisis tes adalah salah satu kegiatan dalam rangka
mengkonstruksi tes untuk mendapatkan gambaran tentang mutu tes, baik mutu
keseluruhan tes maupun mutu tiap butir soal/tugas.
Kegiatan analisis tes meliputi empat hal yakni :
1.Analisis validitas tes
2.Analisis reliabilitas tes
3.Analisis butir soal
4.Analisis teknik kegunaan tes
Validitas tes adalah tingkat keabsahan atau ketepatan
suatu tes. Tes yang valid (absah = sah) adalah tes benar-benar mengukur apa
yang hendak diukur.
Reliabilitas tes adalah tingkat keajegan (konsistensi)
suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor
yang ajeg/konsisten (tidak berubah-ubah).
Dengan
membuat analisis soal, sedikitnya kita dapat mengetahui tiga hal penting yang
dapat di peroleh dari tiap soal,yaitu:
1. Sampai dimana tingkat atau taraf
kesukaran soal itu (difficulty levelof an
item).
2. Apakah soal itu mempunyai daya
pembeda (discriminating power)
3. Apakah semua alternatif jawaban (options) menarik jawaban-jawaban ataukah
ada yang demikian tidak menarik tidak menarik sehingga tidak tidak perlu
dimasukkan ke dalam soal.
Langganan:
Postingan (Atom)
Rabu, 24 Desember 2014
ANALISIS TES
BAB
1
PENDAHULUAN
A. Latar
Belakang Masalah
Usaha yang lebih baik yaitu untuk selalu meningkatkan
mutu tes yang disusun oleh seorang tenaga pendidik, namun hal ini tidak
dilaksanakan karena kecenderungan seseorang untuk beranggapan bahwa hasil
karyanya adalah yang terbaik atau setidak – tidaknya sudah cukup baik.
Tenaga pendidik yang sudah banyak berpengalaman
mengajar dan menyusun soal – soal tes, juga masih sukar menyadari bahwa tesnya
masih belum sempurna. Oleh karena itu, cara yang paling baik adalah secara
jujur melihat hasil yang diperoleh oleh siswa, masalah inilah yang
melatarbelakangi penulisan makalah ini yang berjudul Analisis Tes.
B. Rumusan
Masalah
Dari latar belakang
diatas, dapat dirumuskan sebagai berikut :
1.
Apa pengertian Analisis Tes?
2.
Bagaimana cara mengetahui Validitas Tes?
3.
Bagaimana cara mengetahui Reliabitas Tes?
4.
Bagaimana cara mengetahui Analisis Butir Soal?
C. Tujuan Penulisan
Dari rumusan masalah diatas akan
didapatkan sebagai berikut :
1.
Untuk mengetahui pengertian analisis tes;
2.
Untuk mengetahui cara validitas tes;
3.
Untuk mengetahui cara reliabitas tes;
4.
Untuk mengetahui analisis butir soal (item analysis).
BAB II
PEMBAHASAN
A. Pengertian Analisis Tes
Analisis tes adalah salah satu
kegiatan dalam rangka mengkonstruksi tes untuk mendapatkan gambaran tentang
mutu tes, baik mutu keseluruhan tes maupun mutu tiap butir soal/tugas. Analisis
dilakukan setelah tes disusun dan dicobakan kepada sejumlah subyek dan hasilnya
menjadi umpan balik untuk perbaikan/peningkatan mutu tes bersangkutan. Oleh
karena itu kegiatan analisis tes merupakan keharusan dalam keseluruhan proses
mengkonstruksi tes. Dalam analisis tes juga ada beberapa yang harus kita
perhatikan, diantaranya:
1.
Menilai tes yang dibuat sendiri
Secara teoritis, siswa dalam satu
kelas merupakan populasi atau kelompok yang keadaannya heterogen. Dengan
demikian, maka apabila dikenai sebuah tes akan tercermin hasilnya dalam suatu
kurva normal. Sebagai besar siswa berada di daerah sedang, sebagian kecil
berada di ekor kiri, dan sebagaian kecil yang lain berada di ekor kanan kurva.
Apabila keadaan setelah hasil
dianalisis tidak seperti yang diharapkan dalam kurva normal, maka tentu ada
“apa-apa” dengan soal tesnya.
Apabila hampir seluruh siswa
memperoleh skor jelek, berarti bahwa tes yang disusun mungkin terlalu sukar.
Sebaliknya jka seluruh siswa memperoleh skor baik, dapat diartikan bahwa tesnya
terlalu mudah. Tentu saja interpretasi terhadap soal tes akan lain seandainya
tes itu sudah disusun sebaik-baiknya sehingga memenuhi persyaratan sebagai tes.
Dengan demikian maka apabila kita
memperoleh keterangan tentang hasil tes, akan membantu kita dalam mengadakan
penilaian secara objektif terhadap tes yang kita susun.
Ada 4
(empat) cara untuk menilai tes, yaitu:
a.
Cara pertama meneliti secara jujur soal-soal yang
sudah disusun, kadang-kadang dapat diperoleh jawaban tentang ketidakjelasan
perintah atau bahasa, taraf kesukaran, dan lain-lain keadaan soal tersebut.
Pertanyaan-pertanyaan tersebut,
antara lain:
1. Apakah
banyaknya soal untuk tiap topik sudah seimbang?
2 . Apakah semua soal
menanyakan bahan yang telah diajarkan?
b.
Cara kedua adalah mengadakan analisis soal (item
analysis). Analisis soal adalah suatu prosedur yang sistematis, yang akan
memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita
susun.
c.
Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting
dari tes buatan guru adalah validitas kurikuler (content validity). Untuk mengadakan checking validitas kurikuler,
kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas
sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.
d. Cara ke empat adalah dengan mengadakan checking reliabilita,
salah satu indikator untuk tes yang mempunyai reliabilitas tes yang tinngi
adalah bahwa kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang
tinggi.
2.
Cakupan kegiatan analisis tes
Kegiatan
analisis tes meliputi empat hal yakni :
a.
Analisis validitas tes
b.
Analisis reliabilitas tes
c.
Analisis butir soal yang meliputi :
1. Analisis
daya pembeda tiap butir soal,
2. Analisis
tingkat kesukaran tiap butir soal,
3. Analisis
pengecoh (distraktor) pada setiap butir soal,
4. Analisis
homogenitas tiap butir soal.
d.
Analisis teknis kegunaan tes.
Dengan melakukan analisis tes, guru
dapat “menabung-soal” atau membuat “bank-soal” yakni kumpulan soal-soal yang
sudah teruji kebaikannya. Manfaat terbesar dari kegiatan analisis tes ialah
guru makin memahami bagaimana wujud tes yang baik, bagaimana butir soal yang
baik. Sehingga pada akhirnya guru makin terampil menyusun tes dengan baik dan
efisien
Kritik terhadap tes bentuk pilihan ganda yang dianggap
lebih buruk dari tes bentuk uraian karena “makin membodohkan siswa”, sebenarnya
bersumber pada tes pilihan ganda yang buruk. Tes pilihan ganda (tes obyektif)
yang baik, yang dianalisis dari berbagai segi dan digunakan sesuai tujuan
pendidikan, akan lebih baik dibanding tes bentuk uraian yang tidak dianalisis.
Oleh sebab itu tes bentuk apapun perlu dianalisis agar dapat terjamin
obyektifitas dan keakuratannya.
Pembahasan analisis tes di sini akan
terbatas pada tes buatan guru/dosen, dan bukan psikotes yang dibuat para ahli
atau THB yang dibakukan.
B. Validitas
Validitas tes adalah tingkat
keabsahan atau ketepatan suatu tes. Tes yang valid (absah = sah) adalah tes
benar-benar mengukur apa yang hendak diukur. Dengan kata lain, validitas tes
menunjukkan tingkat ketepatan tes dalam mengukur sasaran yang hendak diukur.
1. Macam-macam
validitas
a. Validitas
logis
Logis yang berati penalaran, validitas logis bearti
sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang
memenuhi persysratan valid berdasarkan hasi penalaran.Validitas logis dapat
dicapai apabila instrumen disusun mengikuti ketentuan yang ada, Dapat
disimpukan bahwa validitas logis tidak perlu diuji kondisi nya tetapi langsung
diperoleh sesudah instrumen tersebut selesai disusun.
Ada dua macam validitas logis yang dapat dicapai oleh
sebuah instrumen yaitu validitas isi dan validitas konstrak.
1. Validitas isi bagi sebuah instrumen
menunjuk suatu kondisi sebuah instrument yang disusun berdasarkan isi materi
pelajaran yang dievaluasi. Sebuah tes dikatakan memiliki validitas isi apabila
mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran
yang di berikan.
2. Validitas konstruk sebuah instrumen
menunjukkan suatu kondisi sebuah instrumen yang disusun berdasarkan
konstruk-konstruk aspek kejiwaan yang seharusnya dievaluasi. Sebuah tes
dikatakan memiliki validitas konstruk apabila butir-butir soal yang membangun
tes tersebut mengukur setiap aspek berfikir seperti yang disebutkan dalam
tujuan instruksional khusus.
b. Validitas Empiris
Mengandung
arti kata pengalaman. Sebuah instrument dikatakan memiliki validitas empiris
apabila sudah di uji dengan pengalaman. Sebagai contoh, seseorang dapat diakui
jujur oleh masyarakat lain apabila dalam pengalaman dia diakui memang jujur.
Pada Validitas empiris terdiri dari dua cara yang dilakukan untuk mengujinya
sehingga dia menjadi valid. Pengujian itu dilakuakn dengan membandingkan
kondisi instrumen yang bersangkutan dengan suatu ukuran. Kriteria yang
digunakan adalah
1. Validitas Konkuren
Disebut
juga dengan validitas “yang ada sekarang ‘tetapi lebih dikenal dengan validitas
empiris. Sebuah instrument dikatakan memiliki validitas empiris jika hasilnya
sesuai dengan pengalaman. Jika ada istilah :sesuai” tentu ada dua hal yang
dipasangkan, dimana dalam hal ini hasil tes dipasangkan dengan hasil
pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data
pengalaman tersebut sekarang sudah ada. Dalam membandingkan hasil sebuah tes
maka diperlukan suatu alat pembanding. Maka hasil tes merupakan sesuatu yang
dibandingkan.
2. Validitas prediksi
Prediksi artinya meramal, dengan
meramal selalu mengenai hal yang akan datang jadi sekarang belum terjadi.
Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai kemampuan
untuk meramalkan apa yang terjadi pada masa yang akan datang. Misalnya
tes masuk perguruan tinggi adalah sebuah tes yang diperkirakan dapat meramalkan
keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Sebagai alat pembanding validitas prediksi
adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran
diperguruan tinggi.
2 . cara mengukur validitas alat
ukur
Sebuah tes dikatakan valid apabila
memilki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang
digunakan untuk mengetahui jesejajaran adalah teknuk korelasi produk moment,
Rumusnya yaitu:
a. Korelasi produk momen dengan simpangan
Dimana :
rxy = koefisien korelasi antara variabel X dan variabel Y
∑xy =jumlah perkalian x dengan y
x2 = kuadrat dari x
y2
= kuadrat dari Y
contoh
perhitungan :
misalnya
akan menghitung validitas tes prestasi belajar matematika. Sebagai kriteria
diambil rata-rata ulangan yang akan di cari validitas nya diberi kode X dan
rata-rata nilai harian diberi kode Y. Kemudian dibuat tabel persiapan sebagai
berikut :
No
|
Nama
|
X
|
Y
|
x
|
y
|
x2
|
y2
|
xy
|
1
|
Ucha
|
6,5
|
6,3
|
0
|
-0,1
|
0,0
|
0,01
|
0,0
|
2
|
Eva
|
7
|
6,8
|
+0,5
|
+0,4
|
0,25
|
0,16
|
+0,2
|
3
|
Iref
|
7,5
|
7,2
|
+1,0
|
+0,8
|
1,0
|
0,64
|
+0,8
|
4
|
Ice
|
7
|
6,8
|
+0,5
|
+0,4
|
0,25
|
0,16
|
+02
|
5
|
Rusdi
|
6
|
7
|
-0,5
|
+0,6
|
0,25
|
0,36
|
-0,3
|
6
|
Iceh
|
6
|
6,2
|
-0,5
|
-0,2
|
0,25
|
0,04
|
+0,1
|
7
|
Eki
|
5,5
|
5,1
|
-1,0
|
-1,3
|
1,0
|
1,69
|
+1,3
|
8
|
Oma
|
6,5
|
6
|
0
|
-0,4
|
0,0
|
0,16
|
0,0
|
9
|
Harti
|
7
|
6,5
|
+
0,5
|
+0,1
|
0,25
|
0,01
|
+0,05
|
10
|
Rina
|
6
|
5,9
|
-
0,5
|
-0,6
|
0,25
|
0,36
|
+0,3
|
Jumlah
|
65,0
|
63,8
|
|
|
3,5
|
3,59
|
2,65
|
X=
∑X / N =6,5
Ȳ=∑Y
/ N =6,38 dibulatkan 6,4
x=
X-X
y=Y-Y
dimasukan
kedalam rumus
=
=
=0,748
b. Rumus
korelasi produk momen dengan angka kasar
rXY
=
dimana
:
rxy
= koefisien korelasi antara variabel Xdan variabel Y
No
|
Nama
|
X
|
Y
|
X2
|
Y2
|
XY
|
1
|
Ucha
|
6,5
|
6,3
|
42,25
|
39,69
|
40,95
|
2
|
Eva
|
7
|
6,8
|
49
|
46,24
|
47,6
|
3
|
Iref
|
7,5
|
7,2
|
56,25
|
51,84
|
54
|
4
|
Ice
|
7
|
6,8
|
49
|
46,24
|
47,6
|
5
|
Rusdi
|
6
|
7
|
36
|
49
|
42
|
6
|
Iceh
|
6
|
6,2
|
36
|
38,44
|
37,2
|
7
|
Eki
|
5,5
|
5,1
|
30,25
|
26,01
|
28,05
|
8
|
Oma
|
6,5
|
6
|
42,25
|
45,5
|
39
|
9
|
Harti
|
7
|
6,5
|
49
|
36
|
045,5
|
10
|
Rina
|
6
|
5,9
|
36
|
34,81
|
35,4
|
Jumlah
|
65,0
|
63,8
|
426,0
|
410,52
|
417,3
|
Dimasukan
kedalam rumus:
rXY =
rXY =
C.
Reliabilitas
Reliabilitas tes adalah tingkat keajegan (konsistensi)
suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor
yang ajeg/konsisten (tidak berubah-ubah). Tes yang reliabel atau dapat
dipercaya adalah tes yang menghasilkan skor secara ajeg, relatif tidak berubah
walaupun diteskan pada situasi dan waktu yang berbeda-beda. Sebaiknya, tes yang
tidak reliabel seperti karet untuk mengukur panjang, hasil pengukuran dengan
karet dapat berubah-ubah ( tidak konsisten ).
Beberapa
hal yang sedikit banyak mempengaruhi hasi tes banyak sekali.
a. Hal yang berhubungan dengan tes itu
sendiri ,yaitu panjang tes dan kualitas butir-burtir soalnya.dalam menghitung
besar nya realibilitas berhubung dengan penambahan banyak nya butir soal dalam
tes ini ada sebuah rumus yang diberikan oleh spearman dan brown
b. Hal yang berhubungan dengan tercoba,
tes yang dicobakan kepada bukan kelompok terpilih, akan menunjukan reliabilitas
yang lebih besar dari pada yang dicobakan pada kelompok tertentu yang di ambil
secara dipilih.
c. Hal yang berhubungan dengan
penyenggaraan tes, Sudah disebutkan bahwa faktor penyenggaraan tes yang
bersifat administrasif sangat menentukan hasil tes.
Cara-cara mencari besar nya
reliabilitas :
1.
Tes-retest method (metoda tes ulang)
Suatu tes (yakni tes yang akan dihitung reliabilitasnya), diteskan terhadap
kelompok siswa tertentu dua kali dengan jangka waktu tertentu (misalnya satu
semester atau satu catur wulan).
Skor hasil pengetesan pertama dikorelasikan dengan skor hasil pengetesan
kedua. Koefisien korelasi yang diperoleh menunjukkan koefisien reliabilitas tes
tersebut.
Contoh:
Siswa
|
Tes
Pertama
|
Tes Kedua
|
||
Skor
|
Ranking
|
Skor
|
Ranking
|
|
A
|
15
|
3
|
20
|
3
|
B
|
20
|
1
|
25
|
1
|
C
|
9
|
5
|
15
|
5
|
D
|
18
|
2
|
23
|
2
|
E
|
12
|
4
|
18
|
4
|
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua
siswa.
Metode ini disebut self-correlation
method (korelasi diri sendiri) karena mengkorelasikan hasil dari tes yang
sama.
2.
Paralel test method (metoda tes parallel)
Cara ini mengharuskan adanya dua tes yang parallel, yakni dua tes yang
disusun dengan tujuan yang sama (hanya sedikit perbedaan redaksi, isi atau
susunan kalimatnya). Dua tes tersebut diadministrasikan pada satu kelompok
siswa dengan perbedaan waktu beberapa hari saja. Skor dari kedua macam tes
tersebut dikorelasikan dengan teknik yang sama seperti pada metode tes-retest.
Koefisien korelasi yang diperoleh menunjukkan tingkat reliabilitas tes.
3.
Split-half method (metode belah dua)
Kelemahan penggunaan metode dua-tes kali percobaan dan satu-tes dua kali
percobaan diatasi dengan metode ketiga ini yaitu metode belah dua. Dalam
menggunakan metode ini pengetes hanya
menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial-method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien
dan korelasi langsung ditafsirkan itulah koefisien reliabitas maka dengan
metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan
mengkorelasikan dua belahan, baru diketahui reliabitas separo tes.
D. Cara Mengetahui
Analisis Butir Soal (Item Analysis)
Analisis butir soal atau analisis item adalah
pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang
memiliki kualitas yang memadai. Ada dua jenis analisis butir soal, yakni
analisis tingkat kesukaran soal dan analisis daya pembeda disamping validitas
dab reliabitas. Menganalisis tingkat kesukaran soal artinya mengkaji soal-soal
mana yang termasuk mudah, sedang dan sukar. Sedangkan menganalisis daya pembeda
artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam
membedakan siswa yang termasuk ke dalam kategori lemah atau rendah dan kategori
kuat atau tinggi prestasinya. Sedangkan validitas dan reliabitas mengkaji
kesulitan dan keajegan pertanyaan tes.
Salah
satu cara untuk memperbaiki proses belajar-mengajar yang paling efektif ialah
dengan jalan mengevaluasi test hasil belajar yang diperoleh hasil belajar dari
proses belajar-mengajar itu sendiri. Dengan kata lain, hasil test itu kita oleh
sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui kompenan-kompenan
manakakah dari proses belajar-mengajar itu yang masih lemah.
a. Taraf kesukaran
Asumsi yang
digunakan untuk memperoleh kualitas soal yang baik, disamping memenuhi
validitas dan reliabitas, adalah adanya keseimbangan dari tingkat kesulitan soal
tersebut. Keseimbangan yang dimaksudkan adalah adanya soal-soal yang termasuk
mudah, sedang, sukar secara proporsional. Tingkat kesukaran soal dipandang dari
kesanggupan atau kemampuan siswa dalam menjawabnya, bukan dilihat dari sudut
guru sebagai pembuat soal. Persoalan yanng penting dalam melakukan analisis
tingkat kesukaran soal adalah penentuan proporsi dan kriteria soal yang
termasuk mudah, sedang, dan sukar.
Soal yang
baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang
terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya.
Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjadi putus asa dan
tidak mempunyai semangat untuk mencoba lagi karena di luar jangkauannya.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal tersebut indeks
kesukaran (difficulty index).
Besarnya indeks kesukaran antara 0,00 sampai dengan 1,0. Indeks kesukaran ini
menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukan
bahwa soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan bahwa soalnya
terlalu mudah.
Rumus
mencari P (indeks kesukaran ) :
P=
P = Indeks kesukaran
B = Banyaknya siswa yang menjawab soal itu dengan
betul
JS = Jumlah seluruh siswa peserta tes
Menurut
Ketentuan Yang Sering Diikuti, Indeks Kesukaran Sering diklasifikasikan sebagai
berikut, soal dengan P1,00 sampai 0,30 adalah soal sukar, soal dengan P0,30
sampai 0,70 adlah soal sedang dan soal dengan P 0,70 sampai 1,00 adalah soal
mudah.
Contoh
penggunaan
Misalnya
jumlah siswa peserta tes dalam suatu kelas ada 40 orang. Dari 40 orang siswa
tersebut yang dapat mengerjekan soal no 1 dengan betul.maka indeks kesukarannya
adalah :
P=
=
=0,30
Dari tabel yang disajikan tersebut,dapat ditafsirkan bahwa:
ü
Soal
nomor 1 mempunyai taraf kesukaran
= 0,5
ü
Soal
nomor 9 adalah soal yang tersuukar karena hanya dapat dijawab betul oleh 2
orang P=
=0,1
ü
Soal
nomor13 adalah yang paling mudah karena siswa perserta tes,dapat menjawab.
Indeks kesukaranya=
=1,0
Menurut ketentuan yang sering
diikuti, indeks kesukaran serta diklasifikasikan sebagai berikut:
-
Soal
dengan P 1,00 sampai 0,30 adalah sukar
-
Soal
dengan P 0,30 sampai 0,70 adalah soal sedang
-
Soal
dengan P 0,70 sampai 1,00 adalha soal
muadh
b. Daya Pembeda
Daya pembeda soal adalah kemampuan sesuatu soal untuk
membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang
bodoh (berkemampuan rendah).
Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi,
disingkat D (d besar). Seperti hanya indeks kesukaran, indeks diskriminasi
(daya pembeda) ini berkisar antara 0,00 sampai 1,00. Hanya bedanya, indeks
kesukaran tidak mengenal tanda negatif (-), tetapi pada indeks diskriminasi
digunakan jika sesuatu soal “terbalik” menunjukan kualitas testee. Yaitu anak
pandai disebut bodoh dan anak bodoh disebut pandai. Dengan demikian ada tiga
titik pada daya pembeda, yaitu:
.daya
pembeda daya pembeda daya pembeda
negatif rendah tinggi (positif)
Bagi soal yang dapat dijawab benar oleh siswa pandai
maupun siswa bodoh, maka soal itu tidak baik karena tidak mempunyai daya
pembeda. Demikian pula jika semua siswa baik pandai maupun bodoh tidak dapat
menjawab dengan benar. Soal tersebut tidak baik juga karena tidak mempunyai
daya pembeda. Soal yang baik adalah soal yang dapat dijawab benar oleh
siswa-siswa pandai saja.
Analisis daya pembeda mengkaji butir-butir soal dengan
tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa yang tergolong
mampu (tinggi prestasinya) dengan siswa yang tergolong kurang atau lemah
prestasinya. Artinya, bila soal tersebut diberikan kepada anak yang mampu,
hasilnya menunjukan prestasi yang tinggi; dan bila diberikan kepada siswa yang
lemah, hasilnya rendah. Tes dikatakan tidak memiliki daya pembeda apabila tes
tersebut, jika diujikan kepada anak berprestasi, hasilnya rendah, tetapi bila
diberikan kepada anak yang lemah hasilnya lebih tinggi. Atau bila diiberikan
kepada kedua kategori siswa tersebut, hasilnya sama aja. Dengan demikian, tes
yang tiidak memiliki daya pembeda, tidak akan menghasilkan gambaran hasil yang
sesuai dengan kemampuan siswa yang sebenarnya. Sungguh aneh bila anak pandai
tidak lulus, tetapi anak bodoh lulus dengan baik tanpa dilakukan manipulasi
oleh si penilai atau di luar faktor kebetulan.
Cara
menentukan daya pembeda(nilai D)
Untuk ini
perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100
ke atas )
a. Untuk kelompok kecil
Seluruh
kelompok teste dibagi dua sama besar, 50% kelompok atas dan 50% kelompok bawah.
Contoh :Siswa Skor
A 9
B 8
C 7
D 7
E 6
F 5
G 5
H 4
I 4
J 3
Seluruh
pengikut tes,dideretkan mulai dari skor teratas sama terbawah,lalu dibagi 2.
b. Untuk kelompok besar
c. Mengingat biaya dan waktu untuk
menganalisis,maka untuk kelompok besar biasnya hanya diambil kedua kutubnya saja,ya 27%skor teratas sebagaibkelompok atas (JA)
dan 27%
d. Untuk kelompokbesar
e. Mengingat biaya dan waktu untuk
menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutub saja
yaitu 27% teratas sebagai kelompok atas
(JA)dan 27%skor terbawah sebagai kelompk bawah(JB)
Rumus
mencari D
D=
=
PA-PB
Dimana :
D
= Daya pembeda
J
= jumlah peserta tes
JA
= banyak peserta kelompok atas
JB
= banyak peserta kelompok bawah
BA
= banyaknya peserta kelompok atas yang menjawab soal
itu dengan benar
BB
= banyak peserta kelompok bawah yang menjawab
soal dengan benar
PA
= proporsi peserta kelompok atas yang menjawab benar ( ingat P sebagai indeks
kesukaran )
PB
= Proporsi peserta kelompok bawah yang menjawab benar
Contoh
perhitungan
Dari hasil
analisis tes yang trdiri dari sepuluh butir soal yang dikerjakan oleh 20 orang
siswa,terdapat tabel sebagai berikut :
Dari hasil
analisis tes yang terdiri dari 10 butir soal yang dikerjakan oleh 20 orang
siswa, didapat skor sebagai berikut:
A = 5
F = 6
K = 7
P = 3
B = 7
G = 6
L = 5
Q = 8
C = 8
H = 6
M = 3
R = 8
D = 5
I = 8
N = 7
S = 6
E = 10
J = 7
O = 9
T = 6
Dari angka
yang belum teratur tersebut kemudian dibuat urutan penyebaran, dari skor yang
paling tinggi ke skor yang paling rendah.
Uraian
ini menunjukkan adanya kelompok atas ( JA) dan kelompok bawah ( JB).
Pada uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini mempermudah menentukan BA dan BB.
Pada uraian di atas dapat ditunjukkan kelompok A dan B. Dan hal ini mempermudah menentukan BA dan BB.
Dimana
BA =
Banyaknya siswa yang menjawab benar pada kelompok atas A dan
BB =
banyaknya siswa yang menjawab benar pada kelompok bawah B
Seperti
yang diketahui, soal yang baik adalah soal yang dapat membedakan antara anak
berkemampuan tinggi dengan anak berkemampuan rendah, dilihat dari dapat atau
tidaknya ia mengerjakan soal tes.
Bila
diperhatikan tabel diatas, dilihat khusus untuk butir soal no satu, dari
kelompok atas yang menjawab benar adalah 8 orang, dari kelompok bawah yang
menjawab betul adalah 3 orang. Dan diterapkan rumus daya pembeda maka :
JA
= 10
JB
= 10
PA
= 0,8
PB
= 0,9
BA
= 8
BB
= 9
Maka D
= PA – P B
=
0,8 – 0,9
D =
0,1
Dengan
demikian maka daya pembeda untuk soal no 1 adalah 0,1 dan ini berarti butir
soal no satu ini jelek.
Klasifikasi
daya pembeda yaitu ;
D = 0,00 –
0,20 : jelek
D = 0,21 –
0,40 : cukup
D = 0,41 –
0,70 : baik
D = 0,71 –
1,00 : baik sekali
D =
negatif, semuanya tidak baik, jadi semua butir soal yang mempunyai nilai D
negatif sebaiknya dibuang saja.
BAB III
PENUTUP
A. Kesimpulan
Analisis tes adalah salah satu kegiatan dalam rangka
mengkonstruksi tes untuk mendapatkan gambaran tentang mutu tes, baik mutu
keseluruhan tes maupun mutu tiap butir soal/tugas.
Kegiatan analisis tes meliputi empat hal yakni :
1.Analisis validitas tes
2.Analisis reliabilitas tes
3.Analisis butir soal
4.Analisis teknik kegunaan tes
Validitas tes adalah tingkat keabsahan atau ketepatan
suatu tes. Tes yang valid (absah = sah) adalah tes benar-benar mengukur apa
yang hendak diukur.
Reliabilitas tes adalah tingkat keajegan (konsistensi)
suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor
yang ajeg/konsisten (tidak berubah-ubah).
Dengan
membuat analisis soal, sedikitnya kita dapat mengetahui tiga hal penting yang
dapat di peroleh dari tiap soal,yaitu:
1. Sampai dimana tingkat atau taraf
kesukaran soal itu (difficulty levelof an
item).
2. Apakah soal itu mempunyai daya
pembeda (discriminating power)
3. Apakah semua alternatif jawaban (options) menarik jawaban-jawaban ataukah
ada yang demikian tidak menarik tidak menarik sehingga tidak tidak perlu
dimasukkan ke dalam soal.
Langganan:
Postingan (Atom)