TINGKAT KESUKARAN ITEM TES DAN
DAYA PEMBEDA SEBUAH ITEM TES
MAKALAH
DiajukanuntukMemenuhiTugasTerstruktur
DosenPengampu:
NaeilaRifatilMuna,S.Psi,M.Pd.I
Disusunoleh:
Kelompok
9
DidinJaenudin
(59430500)
PBI-A/VI
INSTITUT AGAMA ISLAM NEGERI
(IAIN) SYEKH NURJATI CIREBON
2012
BAB I
PENDAHULUAN
A.
LatarBelakang
Proses
evaluasisangatdiperlukandalampendidikan formal, dalamhalinisekolah. Khususnyaevaluasidalampembelajaran,
untukmengetahuisejauhmanahasilbelajarseorangsisiwa.Selainitujuga,
halinidimaksudkanintukmelihattingkatkemampuandankeberhasilansiswadalam proses
pembelajaran.
Evaluasihasilbelajarsiswamerupakansalahsatukegiatan
yang merupakankewajibanbagisetiap guru.Karena,
setiappengajarpadaakhirnyaharusmampumemberikaninformasikepadalembagaataupunsiswanyasendiritentangbagaimanadansampaidimanapenguasaandankemampuan
yang
telahdicapaisiswatentangmateripembelajarandanketerampilan-keterampilanmengenaimatapelajaran
yang telahdiberikanolehpengajartersebut.
Dalam
proses evaluasi, adasalahsatutugas yang cukuppenting yang seringkalidanbahkanpadaumumnyamemangdilupakanolehstafpengajar
(guru, dosen, dan lain-lain)adalahtugasmelakukanevaluasiterhadapalatpengukur
yang telahdigunakanuntukmengukurkeberhasilanbelajarparapesertadidiknya
(murid/siswa, mahasiswadan lain-lain). Alatpengukur yang dimaksudadalahteshasilbelajar,
yang sebagaimanatelahkitaketahuibersamaterdiridaributir-butirsoal.
Terkadanghasildarisuatutesmenunjukkanbahwahampirseluruhdaripesertatesmendapatkanhasiltes
yang terbilangrendah.Denganhasiltersebutparapengajarcenderungmenasumsikanbahwaparapesertatesterdiridari
“anak-anak yang bodoh”.Namunasumsitersebutbelumtentukepastiannya,
karenamungkinsajasoal-soaltesterlalusulituntukdijawab.
Sebaliknya,
terkadangterjadidalamsuatutesdimanahampirseluruhpesertatesmendapatkanhasil yang
tinggi, kemudian tester mengasumsikanbahwamerekatelahmenguasaiseluruhmateri
yang telahdiberikandanberanggapanbahwamerekaadalah “anak-anak yang
hebat”.Seperti yang telahdisebutkansebelumnya,
asumsiinijugabelumtentubenarkepastiannya,
karenamungkinsajabutir-butirsoaltesterlalumudahbagiparapesertates.
Untukmengantisipasikemungkinantersebut,
stafpengajarperlumelakukanpenganalisisanterhadapteshasilbelajar yang
dijadikanalatukurkeberhasilanpesertadidikdalampembelajaran.Kegiatantersebutseringdikenaldenganistilahanalisis
item (item analysis). Olehkarenaitu,
makalahinisedikitbanyaknyaakanmenjelaskanbagaimanakitaakanmenganalisissetiap
item soaltes yang kitaberikandalam proses pembelajaran di kelas.
B.
RumusanMasalah
1.
Analisisderajat/tingkatkesukaran item tes.
2.
Analisisdayapembeda item.
C.
TujuanPenulisan
1.
Untukmengetahuibagaimanacaramenganalisistingkatkesukaransetiapbutirsoaltes.
BAB II
PEMBAHASAN
Penganalisisan terhadap butir soal
teshasil belajar guna memperoleh item tes yang mampu menjalankan fungsinya
sebagai alat ukur hasil belajar, dapat dilakukan dengan beberapa cara, yaitu: dengan
analisis tingkat kesukaran butir soal tesnya, dan dengan menganalisis daya
pembeda butir soalnya.
A.
Analisis
Derajat/Tingkat Kesukaran Item
Bermutu
atau tidaknya butir-butir item tes hasil belajar dapat diketahui melalui
analisis terhadap tingkat kesukaran atau taraf kesukaran yang dimiliki oleh
masing-masing butir item tes tersebut.Tingkat kesukaran setiap item tes adalah
pernyataan tentang seberapa mudah atau seberapa sukar sebuah butir tes itu bagi
testee atau siswa terkait yang menjawab soal tes tersebut.
Tingkat
kesukaran merupakan salah satu ciri tes yang perlu diperhatikan, karena tingkat
kesukaran tes menunjukkan seberapa sukar atau mudahnya butir-butir tes atau tes
secara keseluruhan yang telah diselenggarakan. Butir-butir item tes hasil
belajar dapat dikatakan sebagai butir-butir item yang baik apabila butir-butir
item tersebut tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain
derajat/tingkat kesukaran item tes tersebut itu adalah sedang atau cukup.
Butir tes
yang memiliki tingkat kesukaran yang sedangadalah butir-butir item tes yang
dapat dijawab dengan benar oleh sekitar 40% sampai 80% peserta tes. Sebab butir
tes yang hanya dijawab oleh 10 % atau bahkan 90 %, akan sulit dibedakan,
manakah kelompok yang benar-benar mampu dan kelompok yang benar-benar kurang
mampu dalam menjawab soal.Butir tes harus diketahui tingkat kesukarannya,
karena setiap pembuat butir soal tes perlu mengetahui apakah soal itu sukar,
sedang atau mudah.Tingkat kesukaran itu dapat dilihat dari jawaban
siswa.Semakin sedikit jumlah siswa yang dapat menjawab soal itu dengan benar,
berarti soal itu termasuk sukar dan sebaliknya semakin banyak siswa yang dapat
menjawab soal itu dengan benar, berarti itu mengindikasikan soal itu tidak
sukar atau soal itu mudah.
Dalam hal
ini Witherington dalam bukunya yang berjudul Psychological Education (hlm. 87) menyatakan bahwa sudah atau belum
memadainya tingkat kesukaran item tes hasil belajar dapat dilihat dan diketahui
dari besar kecilnya angka yang melambangkan tingkat kesulitan dari item tes
tersebut yang sering dikenal dengan istilah difficulty
index (=angka indek kesukaran item), yang dalam dunia evaluasi pembelajaran
umumnya dilambangkan dengan huruf P, yaitu singkatan dari kata Proportion (proporsi=proporsa).
Angka indek
kesukaran item tersebut besarnya berkisar amtara 0,00 sampai dengan 1,00. Yang
berarti bahwa angka terrendah dari indek kesukaran item tes adalah 0,00 dan
angka tertinggi dari indek kesukaran tes adalah 1,00. Jika angka indeks 0,00 (P
= 0,00) berarti butir soal sangat sukar karena tidak seorangpun dapat menjawab
dengan benar butir tes tersebut. Sebaliknya jika indeksnya 1,00 berarti butir
soal tersebut sangat mudah karena semua siswa dapat menjawabnya dengan benar.
P : 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
Terlalu sukar Terlalu
mudah
Angka indek
kesukaran tersebut dapat diperoleh dengan menggunakan rumus yang dikemukakan Dubois dalam Sudijono (2011: 371),
yaitu:
P =
di
mana:
P = Proportion = proporsi = proporsa = difficulty
index = angka indek kesukaran item.
Np = Banyaknya testee/peserta tes yang
mampu menjawab dengan benar terhadap
butir item yang bersangkutan.
N = Jumlah
testee/peserta tes yang mengikuti hasil belajar.
Rumus lainnya adalah:
P =
di mana:
P = Proportion = proporsi = proporsa = difficulty
index = angka indek kesukaran item.
B = Banyaknya testee/peserta tes yang mampu menjawab dengan benar terhadap butir item
yang bersangkutan.
JS = Jumlah
testee/peserta tes yang mengikuti hasil belajar.
Ada
beberapa pendapat tentang cara menginterpretasikan (menafsirkan) angka indek
kesukaran item tes. Menurut Robert L. Thorndike dan Elizabeth Hagen (1961)
mengemukakan pendapatnya sebagai berikut:
Besarnya
P
|
Interpretasi
|
Kurang dari 0,30
|
Terlalu Sukar
|
0,30 - 0,70
|
Cukup (Sedang)
|
Lebih dari 0,70
|
Terlalu
Mudah
|
Sedangkan menurut Witherington adalah
sebagai berikut:
Besarnya
P
|
Interpretasi
|
Kurang dari 0,25
|
Terlalu Sukar
|
0,25 - 0,75
|
Cukup (Sedang)
|
Lebih dari 0,75
|
Terlalu
Mudah
|
Sebagai contoh, lihat tabel dibawah
ini:
TABEL 2.1. Penyebaran
skor jawaban 10 orang testee terhadap 10 butir item yang diajukan dalam tes
hasil belajar tahap akhir bidang studi Bahasa Inggris.
Testee
|
Skor yang dicapai oleh testee untuk setiap butir
item nomor
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|
A
|
0
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
B
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
C
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
D
|
0
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
E
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
1
|
0
|
F
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
1
|
G
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
H
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
I
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
J
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
10=
|
6=
|
2=
|
9=
|
5=
|
6=
|
3=
|
8=
|
3=
|
9=
|
7=
|
N=JS
|
NP=B
|
NP=B
|
NP=B
|
NP=B
|
NP=B
|
NP=B
|
NP=B
|
NP=B
|
NP=B
|
NP=B
|
Setiap butir item yang mampu dijawab
dengan benar diberikan bobot 1 dan untuk setiap item soal yang dijawab salah
diberikan bobot 0.Dari tabel tersebut, kita memperoleh data bahwa jumlah testee
(N atau JS) adalah 10. Dari butir soal nomor satu diperoleh testee yang
menjawab benar ada 6 orang sehingga dapat dihitung angka indek kesukarannya
adalah 6/10 = 0,60. Dengan demikian dapat ditarik kesimpulan bahwa butir soal
nomor 1 termasuk kriteria butir soal yang tingkat kesukarannya sedang.Untuk
butir soal nomor 2 dan nomor 3 dengan Np atau B masing-masing
sebesar 2 dan 9 akan didapat angka indek kesukaran item untuk masing-masing
adalah sebesar 2/10 = 0,20 (nomor 2) dan 9/10 = 0,90 (nomor 3). Diantara kedua
pendapat yang telah disebutkan, pendapat yang pertama adalah yang lebih banyak
digunakan, oleh karenanya, kita dapat menginterpretasikan bahwa soal nomor 2
termasuk kedalam kategori butir soal yang terlalu sulit; sedangkan butir soal
nomor 3 termasuk ke dalam kategori butir soal yang terlalu mudah.
Untuk memperjelas
dan mempermudahkan perhitungan keseluruhan angka indek kesukaran ataupun
tingkat kesukaran butir tes untuk setiap nomornya, perhatikan tabel berikut
ini:
Butir Soal Nomor
|
Angka Indek Kesukaran Item (P)
|
Interpretasi
|
1
|
P = 6/10
= 0,60
|
Cukup (Sedang)
|
2
|
P = 2/10
= 0,20
|
Terlalu
Sukar
|
3
|
P = 9/10
= 0,90
|
Terlalu
Mudah
|
4
|
P = 5/10
= 0,50
|
Cukup
(Sedang)
|
5
|
P = 6/10
= 0,60
|
Cukup
(Sedang)
|
6
|
P = 3/10
= 0,30
|
Cukup
(Sedang)
|
7
|
P = 8/10
= 0,80
|
Terlalu
Mudah
|
8
|
P = 3/10
= 0,30
|
Cukup
(Sedang)
|
9
|
P = 9/10
= 0,90
|
Terlalu
Mudah
|
10
|
P = 7/10
= 0,70
|
Cukup
(Sedang)
|
Tabel 2.2.Perhitungan angka indek kesukaran item tes dan interpretasinya.
Dari tabel
tersebut dapat diketahui bahwa butir soal yang tergolong baik; tingkat
kesukarannya sedang adalah butir soal nomor 1,4,5,6,8 dan 10. Butir soal yang
tergolong sulit adalah butir soal nomor 2. Sedangkan butir soal yang tergolong
terlalu mudah adalah butir soal nomor 3,7 dan 9.
Setelah
identifikasi tentang tingkat kesukaran butir soal tes telah dilakukan, perlu
adanya penindaklanjutan terhadap soal-soal tersebut. Tindak lanjut tersebut
diantaranya adalah:
Pertama, untuk butir soal yang telah
memenuhi kategori yang baik (tingkat kesukarannya sedang atau cukup), hendaknya
disimpan ke dalam bank soal agar tester dapat mempergunakanya kembali untuk
waktu yang akan datang.
Kedua,untuk item
soal yang tergolong terlalu sulit ada 3 kemungkinan tindak lanjut, yaitu:
1)
Dibuang atau didrop dan tidak akan digunakan
lagi,
2)
Diperbaiki, diteliti ulang dan dicari tahu apa
faktor penyebab dari sulitnya soal tersebut dijawab oleh testee,
3)
Disimpan dan digunakan untuk tujuan khusus,
seperti tes penyeleksian siswa yang bersifat lebih ketat yang hanya sebagian
kecil yang akan diterima.
Ketiga, untuk item
soal yang tergolong terlalu mudah juga ada 3 kemungkinan tindak lanjut, ini
hampir sama dengan tindak lanjut untuk butir-butir soal yang tergolong sulit,
yaitu:
1)
Dibuang atau didrop dan tidak akan digunakan
lagi,
2)
Diperbaiki, diteliti ulang dan dicari tahu apa
faktor penyebab dari mudahnya soal tersebut untuk dijawab oleh testee,
3)
Disimpan dan digunakan untuk tujuan khusus,
seperti tes penyeleksian siswa yang bersifat lebih longgar, yang sebagian besar
yang akan diterima yang bisa dikatakan sebagai tes formalitas.
Cara yang
lain yang dapat digunakan untuk mencari atau menghitung angka indek kesukaran
item adalah dengan menggunakan skala kesukaran linear. Skala linear ini
digunakan untuk mencari P bersih, karena sesungguhnya P yang kita hitung
sebelumnya tidak memperhatikan atau memperhitungkan option atau alternative
jawaban yang dipasang disetiap butir soal tes.
Skala kesukaran ini disusun dengan cara mentransformasikan
nilai P menjadi nilai z yang ada di dalam tabel nilai z yang umumnya
dilampirkan disetiap buku statistik. Dengan cara kedua ini ada beberapa langkah
yang harus ditempuh.
Langkah pertama, Mengubah nilai P kotor
(Pk) menjadi nilai P bersih (Pb) dengan menggunakan rumus:
Pb
=
di
mana:
Pb = P bersih.
Pk = P kotor
a = Alternatif atau option yang disediakan di
butir soal yang bersangkutan.
1 = Bilangan
konstan.
Contoh: Pk no. 7 = 0,80, jumlah option = 5 butir, maka:
Pb = = = 0,75
Untuk lebih
menghemat waktu, untuk pengoreksian atau pengubahan P kotor menjadi P bersih
kita bisa langsung melihat tabel nilai P bersih yang telah tersedia, termasuk
dengan pilihan alternatif dari 2 sampai 5 butir.
Langkah kedua, Mentransformasikan nilai
P bersih (Pb) menjadi nilai z dengan melihat tabel kurva normal yang telah
tesedia. Sebagai contoh, kita ambil nilai P bersih dari butir nomor soal 7
yaitu 0,75. Kita cari angka 0,75 di tabel kurva normal, sehingga diperoleh
sebagai berikut:
B
Larger Area
|
z
|
C
Smaller Area
|
0,750
|
0,6745
|
0,250
|
Dengan demikian nilai z untuk butir
nomor 7 sebesar 0,6745. Dengan berpegang terhadap pendapat Thorndike dan Hagen
maka butir soal nomor 7 tergolong butir soal yang memiliki tingkat kesukaran
yang sedang (cukup).
Selain itu
ada rumus lain yang bisa digunakan untuk mencari P bersih (Pb) dengan hasil
yang sama, yaitu:
Pb =
|
B -
|
S
|
a - 1
|
||
B + S
|
di mana:
Pb = P bersih.
B = Jumlah testee yang jawabannya benar.
S = Jumlah testee yang jawabannya salah
a = Alternatif atau option yang disediakan di
butir soal yang bersangkutan.
Contoh: Butir soal nomor 7 yang menjawab benar ada 8
orang, dan yang menjawab salah 2 orang dengan jumlah option/alternative 5
butir, maka:
Pb =
|
8 -
|
2
|
5 - 1
|
||
8 + 2
|
Pb =
|
8 – 0,50
|
|
10
|
Pb=
|
7,50
|
=
|
0,75 (hasilnya sama)
|
10
|
Langkah
ketiga, Mencari atau menghitung angka indek kesukaran
item dengan menggunakan angka indek Davis yang sering disingkat dengan indeks
Davis saja dan dilambangkan dengan huruf D dengan rumus:
D = 21,063
z + 50
Dengan menggunakan rumus ini kita dapat menghindari hasil
perolehan nilai P bersih (Pb) yang negatif, perhatikan contoh
berikut:
Diketahui: P kotor = 0,20,
dengan jumlah alternative/option = 4, maka:
Pb = = =
-0,667
Dalam
indeks Davis tingkat kesukaran berkisar antara 0 sampai dengan 100, maka tidak
mungkin akan menghasilkan tanda minus. Sebagai contohnya, misalkan sebutir item
soal memiliki P bersih sebesar 0,755. Dengan berkonsultasi dengan tabel kurva
normal diperoleh z sebesar 0,6905, maka:
D =
21,063 z + 50
=
(21,063) (0,6905) + 50
=
64,5440015
= 64,54 (dibulatkan 2 angka
dibelakang koma/tanda desimal)
B.
Analisis
Daya Pembeda Item
Daya
pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat
membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi (pandai)
dengan testee yang berkemampuan rendah (tidak pandai) sehingga sebagian testee
yang berkemampuan tinggi untuk menjawab butir item tersebut lebih banyak yang
menjawab benar, sementara testee yang berkemempuan rendah untuk menjawab item
tes terrsebut sebagian besar tidak dapat menjawab item soal dengan benar.
Dengan kata
lain, bahwa analisis daya beda item adalahanalisis yang mengungkapkan seberapa
besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa
kelompok rendah. Salah satu ciri butir yang baik adalah yang mampu membedakan
antara kelompok atas (yang mampu) dan kelompok bawah (kurang mampu).Ini
dianggap sangat penting karena ada anggapan bahwa kemampuan setiap testee akan
berbeda dengan testee yang lainnya.
Daya
pembeda (discriminatory power) item
itu dapat diketahui melalui atau dengan melihat besar kecilnya angka indeks
diskriminasi item.Pada dasarnya, daya pembeda ini dihitung atas dasar pembagian
testee ke dalam dua kelompok, yaitu kelompok atas (the higher group) – kelompok yang tergolong pandai – dankelompok
bawah (the lower group) – kelompok
yang tergolong kurang pandai. Ada beberapa cara untuk mengelompokkan testee,
dapat menggunakan median, dapat juga menggunakan hanya 20% dari testee yang
temasuk kelompok atas dan 20% yang termasuk kelompok bawah. Namun pada umumnya,
para pakar di bidang evaluasi menggunakan persentase 27% dari testee yang
termasuk kelompok atas dan 27% dari testee yang termasuk kelompok bawah karena
dianggap cukup mampu diandalkan.
Indeks
dikriminasi item umumnya diberi lambang D (singkatan ari Discriminatory Power) yang besarnya berkisar antara 0 sampai dengan
1,00. Akan tetapi indeks diskriminasi ini dapat bertanda minus (-). Jika
sebutir item angka indeks diskriminasinya = 0,00, maka item tersebut tidak
memiliki daya pembeda sama sekali. Jika indeks diiskriminasi itemnya bertanda
negative (minus) maka butir item tersebut lebih banyak dijawab benar oleh
testee dari kelompok bawah daripada testee kelompok atas atau testee yang
sebenarnya termasuk dalam kelompok atas lebih banyak yang menjawab salah
sedangkan testee yang termasuk kelompok bawah lebih banyak yang menjawab benar.
Perhatikan bagan berikut ini:
D = D
= D
=
-1,00 0,00 +1,00
Daya pembeda item bersifat negative
Item yang bersangkutan tidak memiliki daya pembeda
sama sekali
Daya pembeda item bersifat positif
Dalam hubungan ini pada umumnya
besaran indeks diskriminasi yang dapat diinterpretasikan adalah sebagai
berikut:
Basarnya Angka Indeks
Diskriminasi Item (D)
|
Klasifikasi
|
Interpretasi
|
Kurang dari 0,20
|
Poor
|
Butir item yang
bersangkutan daya pembedanya lemah sekali (jelek), dianggap tidak memiliki
daya pembeda yang baik.
|
0,20 – 0,40
|
Satisfactory
|
Butir item yang
bersangkutan telah memiliki daya pembeda yang cukup (sedang).
|
0,40 – 0,70
|
Good
|
Butir item yang
bersangkutan telah memiliki daya pembeda yang baik.
|
0,70 – 1,00
|
Excellent
|
Butir item yang
bersangkutan telah memiliki daya pembeda yang baik sekali.
|
Bertanda negatif
|
-
|
Butir item yang
bersangkutan daya penbedanya negative (jelek sekali).
|
Untuk menghitung besar kecilnyaangka
indeks diskriminasi item dapat dipergunakan dua rumus.
Rumus pertama:
D = PA
- pB atau D = PH – pL
di mana:
D = Discriminatory power (angka indeks
diskriminasi item)
PA atau PH = Proporsi
testee kelompok atas yang dapat menjawab dengan benar butir item yang
bersangkutan.
(PHadalah singkatan dari Proportion of Higher Group)
PA
atau PH dapat diperoleh dengan rumus:
PA
atau PH =
dimana:
BA = Banyaknya
testee kelompok atas yang dapat menjawab benar butir item yang bersangkutan.
JA = Jumlah
testee yang termasuk dalam kelompok atas.
pB atau pL = Proporsi testee
kelompok bawah yang dapat menjawab dengan benar butir item yang bersangkutan.
(pL
adalah singkatan dari Proportion of Lower Group).
pB
atau pL dapat diperoleh dengan rumus:
pB
atau pL =
dimana:
BB = Banyaknya
testee kelompok bawah yang dapat menjawab benar butir item yang bersangkutan.
JB = Jumlah
testee yang termasuk dalam kelompok bawah.
Rumus kedua:
Indeks diskriminasi item pada rumus kedua ini didapatkan
dengan menggunakan teknik korelasi Phi (Ø)
dengan rumus sebagai berikut:
Ø =
di mana:
Ø =
Angka Indeks Korelasi Phi (Indeks
Diskriminasi Item).
PH = Proportion of Higher Group.
PL = Proportion of Lower Group.
2 = Bilangan konstan.
p = Proporsi seluruh testee yang jawabannya
Benar.
q = Proporsi seluruh testee yang jawabannya
Salah, dimana q = (1 - p).
Contoh 1: Menggunakan
rumus pertama (rumus D)
Misalkan 10
orang mengikuti tes hasil belajar bidang studi Matematika yang berbentuk
pilihan ganda.Ada 10 butir item soal dalam tes tersebut dengan catatn yang
menjawab benar diberi bobot 1 dan yang menjawab salah 0, sebagaimana tertera pada
Tabel 2.3.
Ada
beberapa langkah yang harus dilakukan untuk mencari besarnya angka indeks
diskriminasi item (D), yaitu:
Langkah pertama:Mengelompokkan (membagi)
testee menjadi 2 kelompok, yaitu kelompok atas (yang mendapatkan skor yang
tinggi) dan kelompok bawah (yang mendapatkan skor rendah).
Tabel 2.3.Distribusi
skor hasil tes Matematika
Testee
|
Skor yang dicapai oleh testee untuk setiap butir
item nomor
|
Total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
0
|
(1)
|
(1)
|
0
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
(1)
|
7
|
B
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
(1)
|
0
|
0
|
(1)
|
(1)
|
7
|
C
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
4
|
D
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
(1)
|
8
|
E
|
(1)
|
0
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
0
|
(1)
|
(1)
|
7
|
F
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
5
|
G
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
3
|
H
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
4
|
I
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
6
|
J
|
(1)
|
(1)
|
(1)
|
(1)
|
(1)
|
(1)
|
(1)
|
0
|
(1)
|
(1)
|
9
|
N=10
|
7
|
2
|
9
|
5
|
6
|
3
|
8
|
4
|
9
|
7
|
60
|
Kelompok Atas
|
Kelompok Bawah
|
|||
Testee
|
Skor
|
Testee
|
Skor
|
|
J
|
9
|
I
|
6
|
|
D
|
8
|
F
|
5
|
|
A
|
7
|
C
|
4
|
|
B
|
7
|
H
|
4
|
|
E
|
7
|
G
|
3
|
|
JA
= 5
|
-
|
JB
= 5
|
-
|
Langkah
kedua:menuliskan atau memberikan tanda atau kode terhadap hasil
pengelompokan testee atas dua kategori tersebut. (Menggunakan tanda kurung bagi
jawaban yang benar untuk kelompok atas).
Langkah ketiga:Mencari (menghitung) BA,
BB, PA, PBdan D. (Lihat Tabel 2.4)
Tabel 2.4.Hasil
perhitungan BA, BB, PA, PB dan D
Nomor Butir Item
|
BA
|
BB
|
JA
|
JB
|
PA
|
PB
|
D=PA-PB
|
1
|
4
|
3
|
5
|
5
|
0,80
|
0,60
|
0,20
|
2
|
2
|
0
|
5
|
5
|
0,40
|
0,00
|
0,40
|
3
|
5
|
4
|
5
|
5
|
1,00
|
0,80
|
0,20
|
4
|
3
|
2
|
5
|
5
|
0,60
|
0,40
|
0,20
|
5
|
5
|
1
|
5
|
5
|
1,00
|
0,20
|
0,80
|
6
|
3
|
0
|
5
|
5
|
0,60
|
0,00
|
0,60
|
7
|
4
|
4
|
5
|
5
|
0,80
|
0,80
|
0,00
|
8
|
2
|
2
|
5
|
5
|
0,40
|
0,40
|
0,00
|
9
|
5
|
4
|
5
|
5
|
1,00
|
0,80
|
0,20
|
10
|
5
|
2
|
5
|
5
|
1,00
|
0,40
|
0,60
|
Langkah keempat: Memberikan interpretasi
mengenai kualitas daya pembeda item yang dimiliki oleh 10 item soal tes hasil
belajar seperti yang terlihat pada Tabel 2.5
Tabel 2.5.Pemberian
Interpretasi terhadap D
Nomor Butir Item
|
Besarnya D
|
Klasifikasi
|
Interpretasi
|
5
|
0,80
|
Excellent
|
Daya pembeda itemnya
sangat baik sekali.
|
6 dan 10
|
0,60
|
Good
|
Daya pembeda itemnya baik.
|
2
|
0,40
|
Satisfactory
|
Daya pembeda itemnya cukup
(sedang).
|
1, 3, 4
dan 9
|
0,20
|
Poor
|
Daya pembeda itemnya lemah
sekali.
|
7 dan 8
|
0,00
|
Poor
|
Tidak memiliki daya pembeda
sama sekali.
|
Dengan demikian, jelas terlihat bahwa
4 dari 10 item soal diatas sudah termasuk memiliki daya pembeda yang memadai
dan sisanya, yaitu 6 masih tergolong kelompok item soal yang tidak/belum memiliki
daya pembeda yang diharapkan.
Contoh 2: Menggunakan
rumus yang kedua
Karena pada
hakikatnya PA = PH dan PB= PL maka
kita hanya perlu mengganti simbolnya saja. Setelah itu kita cari nilai p
(proporsi testee yang jawabannya benar) dan q (proporsi testee yang jawabannya
salah).Setelah selesai didapatkan, nilai PH, PL, p dan q
kita substitusikan kedalam rumus korelasi Phi. Hasilnya adalah sebagai berikut:
Tabel 2.6.Perhitungan besarnya korelasi koefisien Phi
(Ø)
Butir Item Nomor
|
PH
|
PL
|
p
|
q
|
Ø
=
|
Ø
|
Ø
|
Klasifikasi
|
1
|
0,80
|
0,60
|
0,7
|
0,3
|
0,22
|
Satisfactory
|
||
2
|
0,40
|
0,00
|
0,2
|
0,8
|
0,50
|
Good
|
||
3
|
1,00
|
0,80
|
0,9
|
0,1
|
0,33
|
Satisfactory
|
||
4
|
0,60
|
0,40
|
0,5
|
0,5
|
0,40
|
Good
|
||
5
|
1,00
|
0,20
|
0,6
|
0,4
|
0,81
|
Excellent
|
||
6
|
0,60
|
0,00
|
0,3
|
0,7
|
0,65
|
Good
|
||
7
|
0,80
|
0,80
|
0,8
|
0,2
|
0,00
|
Poor
|
||
8
|
0,40
|
0,40
|
0,4
|
0,6
|
0.00
|
Poor
|
||
9
|
1,00
|
0,80
|
0,9
|
0,1
|
0,33
|
Satisfactory
|
||
10
|
1,00
|
0,40
|
0,7
|
0,3
|
0,65
|
Good
|
Dengan menggunakan teknik/rumus
korelasi Phi ternyata angka indeks diskriminasi itemnya (Ø) sedikit berbeda
besarnya dengan angka indeks diskriminasi item yang dihitung dengan menggunakan
rumus pertama (rumus D).Hal ini memang dapat dipahami, sebab menurut para ahli
di bidang evaluasi pendidikan angka indeks diskriminasi item yang diperoleh
dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.
pB atau pL = Proporsi testee
kelompok bawah yang dapat menjawab dengan benar butir item yang bersangkutan.
(pL
adalah singkatan dari Proportion of Lower Group).
pB
atau pL dapat diperoleh dengan rumus:
pB
atau pL =
dimana:
BB = Banyaknya
testee kelompok bawah yang dapat menjawab benar butir item yang bersangkutan.
JB = Jumlah
testee yang termasuk dalam kelompok bawah.
Rumus kedua:
Indeks diskriminasi item pada rumus kedua ini didapatkan
dengan menggunakan teknik korelasi Phi (Ø)
dengan rumus sebagai berikut:
Ø =
di mana:
Ø =
Angka Indeks Korelasi Phi (Indeks
Diskriminasi Item).
PH = Proportion of Higher Group.
PL = Proportion of Lower Group.
2 = Bilangan konstan.
p = Proporsi seluruh testee yang jawabannya
Benar.
q = Proporsi seluruh testee yang jawabannya
Salah, dimana q = (1 - p).
Contoh 1: Menggunakan
rumus pertama (rumus D)
Misalkan 10
orang mengikuti tes hasil belajar bidang studi Matematika yang berbentuk
pilihan ganda. Ada 10 butir item soal dalam tes tersebut dengan catatan yang menjawab benar diberi bobot 1 dan yang menjawab salah
0, sebagaimana tertera pada Tabel 2.3.
Ada
beberapa langkah yang harus dilakukan untuk mencari besarnya angka indeks
diskriminasi item (D), yaitu:
Langkah pertama: Mengelompokkan (membagi)
testee menjadi 2 kelompok, yaitu kelompok atas (yang mendapatkan skor yang
tinggi) dan kelompok bawah (yang mendapatkan skor rendah).
Tabel 2.3. Distribusi
skor hasil tes Matematika
Testee
|
Skor yang dicapai oleh testee untuk setiap butir
item nomor
|
Total
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
A
|
0
|
(1)
|
(1)
|
0
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
(1)
|
7
|
B
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
(1)
|
0
|
0
|
(1)
|
(1)
|
7
|
C
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
4
|
D
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
(1)
|
8
|
E
|
(1)
|
0
|
(1)
|
0
|
(1)
|
(1)
|
(1)
|
0
|
(1)
|
(1)
|
7
|
F
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
5
|
G
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
1
|
3
|
H
|
0
|
0
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
0
|
4
|
I
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
1
|
1
|
6
|
J
|
(1)
|
(1)
|
(1)
|
(1)
|
(1)
|
(1)
|
(1)
|
0
|
(1)
|
(1)
|
9
|
N=10
|
7
|
2
|
9
|
5
|
6
|
3
|
8
|
4
|
9
|
7
|
60
|
Kelompok Atas
|
Kelompok Bawah
|
|||
Testee
|
Skor
|
Testee
|
Skor
|
|
J
|
9
|
I
|
6
|
|
D
|
8
|
F
|
5
|
|
A
|
7
|
C
|
4
|
|
B
|
7
|
H
|
4
|
|
E
|
7
|
G
|
3
|
|
JA
= 5
|
-
|
JB
= 5
|
-
|
Langkah
kedua: menuliskan atau memberikan tanda atau kode terhadap hasil
pengelompokan testee atas dua kategori tersebut. (Menggunakan tanda kurung bagi
jawaban yang benar untuk kelompok atas).
Langkah ketiga: Mencari (menghitung) BA,
BB, PA, PBdan D. (Lihat Tabel 2.4)
Tabel 2.4. Hasil
perhitungan BA, BB, PA, PB dan D
Nomor Butir Item
|
BA
|
BB
|
JA
|
JB
|
PA
|
PB
|
D=PA-PB
|
1
|
4
|
3
|
5
|
5
|
0,80
|
0,60
|
0,20
|
2
|
2
|
0
|
5
|
5
|
0,40
|
0,00
|
0,40
|
3
|
5
|
4
|
5
|
5
|
1,00
|
0,80
|
0,20
|
4
|
3
|
2
|
5
|
5
|
0,60
|
0,40
|
0,20
|
5
|
5
|
1
|
5
|
5
|
1,00
|
0,20
|
0,80
|
6
|
3
|
0
|
5
|
5
|
0,60
|
0,00
|
0,60
|
7
|
4
|
4
|
5
|
5
|
0,80
|
0,80
|
0,00
|
8
|
2
|
2
|
5
|
5
|
0,40
|
0,40
|
0,00
|
9
|
5
|
4
|
5
|
5
|
1,00
|
0,80
|
0,20
|
10
|
5
|
2
|
5
|
5
|
1,00
|
0,40
|
0,60
|
Langkah keempat: Memberikan interpretasi
mengenai kualitas daya pembeda item yang dimiliki oleh 10 item soal tes hasil
belajar seperti yang terlihat pada Tabel 2.5
Tabel 2.5. Pemberian
Interpretasi terhadap D
Nomor Butir Item
|
Besarnya D
|
Klasifikasi
|
Interpretasi
|
5
|
0,80
|
Excellent
|
Daya pembeda itemnya
sangat baik sekali.
|
6 dan 10
|
0,60
|
Good
|
Daya pembeda itemnya baik.
|
2
|
0,40
|
Satisfactory
|
Daya pembeda itemnya cukup
(sedang).
|
1, 3, 4
dan 9
|
0,20
|
Poor
|
Daya pembeda itemnya lemah
sekali.
|
7 dan 8
|
0,00
|
Poor
|
Tidak memiliki daya pembeda
sama sekali.
|
Dengan demikian, jelas terlihat bahwa
4 dari 10 item soal diatas sudah termasuk memiliki daya pembeda yang memadai
dan sisanya, yaitu 6 masih tergolong kelompok item soal yang tidak/belum
memiliki daya pembeda yang diharapkan.
Contoh 2: Menggunakan
rumus yang kedua
Karena pada
hakikatnya PA = PH dan PB= PL maka
kita hanya perlu mengganti simbolnya saja. Setelah itu kita cari nilai p
(proporsi testee yang jawabannya benar) dan q (proporsi testee yang jawabannya
salah). Setelah selesai didapatkan, nilai PH, PL, p dan q
kita substitusikan kedalam rumus korelasi Phi. Hasilnya adalah sebagai berikut:
Tabel 2.6. Perhitungan besarnya korelasi koefisien Phi
(Ø)
Butir Item Nomor
|
PH
|
PL
|
p
|
q
|
Ø
=
|
Ø
|
Ø
|
Klasifikasi
|
1
|
0,80
|
0,60
|
0,7
|
0,3
|
0,22
|
Satisfactory
|
||
2
|
0,40
|
0,00
|
0,2
|
0,8
|
0,50
|
Good
|
||
3
|
1,00
|
0,80
|
0,9
|
0,1
|
0,33
|
Satisfactory
|
||
4
|
0,60
|
0,40
|
0,5
|
0,5
|
0,40
|
Good
|
||
5
|
1,00
|
0,20
|
0,6
|
0,4
|
0,81
|
Excellent
|
||
6
|
0,60
|
0,00
|
0,3
|
0,7
|
0,65
|
Good
|
||
7
|
0,80
|
0,80
|
0,8
|
0,2
|
0,00
|
Poor
|
||
8
|
0,40
|
0,40
|
0,4
|
0,6
|
0.00
|
Poor
|
||
9
|
1,00
|
0,80
|
0,9
|
0,1
|
0,33
|
Satisfactory
|
||
10
|
1,00
|
0,40
|
0,7
|
0,3
|
0,65
|
Good
|
Dengan menggunakan teknik/rumus
korelasi Phi ternyata angka indeks diskriminasi itemnya (Ø) sedikit berbeda
besarnya dengan angka indeks diskriminasi item yang dihitung dengan menggunakan
rumus pertama (rumus D). Hal ini memang dapat dipahami, sebab menurut para ahli
di bidang evaluasi pendidikan angka indeks diskriminasi item yang diperoleh
dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.
BAB III
PENUTUP
A.
Kesimpulan
Evaluasi
hasil belajar siswa merupakan salah satu kegiatan yang merupakan kewajiban bagi
setiap guru.Penganalisisan terhadap butir soal tes hasil belajar dilakukan guna
memperoleh dan mengetahui apakah item tes sudah mampu menjalankan fungsinya
sebagai alat ukur hasil belajar.
Penganalisisan
terhadap butir soal tes hasil belajar dapat dilakukan dengan beberapa cara,
yaitu: dengan analisis tingkat kesukaran butir soal tesnya, dan dengan
menganalisis daya pembeda butir soalnya.Analisis tingkat kesukaran butir item
tes dimaksudkan untuk mengetahui seberapa mudah dan seberapa sulit tingkat
kesukaran sebuah item soal tes bagi testee atau siswa yang terkait.
Analisis
daya beda butir item tes dimaksudkan untuk mengungkapkan seberapa besar butir
tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah.Salah
satu ciri butir yang baik adalah yang mampu membedakan antara kelompok atas
(yang mampu) dan kelompok bawah (kurang mampu).
B.
Saran
Tidak
sedikit dari para staf pengajar yang hanya membuat soal tes, lalu
memberikannya, setelah itu maka selesailah proses evaluasi belajar. Mereka
cenderung tidak memperhatikan bagaimana setiap butir soal tes mampu menjalankan
tugasnya sebagai alat ukur kemampuan testee.
Dalam
proses evaluasi hasil belajar, hendaknya kita memperhatikan setiap butir soal
yang akan diberikan dalam rangka mengukur kemampuan seorang testee atau seorang
siswa. Soal yang akan diberikan harus mampu menjalankan tugasnya sebagai alat
ukur atas sejauh mana seorang testee atau siswa menguasai atau memehami hasil
pembelajarannya.
Oleh karena
itu, analisis terhadap tingkat kesukaran setiap item tes dan daya pembeda item
perlu dilakukan untuk menunjang fungsi dan tujuan pemberian tes hasil belajar
tadi yang telah disebutkan agar mendapatkan tes hasil belajar yang berkualitas.
DAFTAR PUSTAKA
Masmud.
(2009). Tingkat Kesukaran dan Daya Beda, tersedia
dalam http://masmud09.blogspot.com/,
diunduh pada tanggal 10 April 2012.
Purwanto, M.
Ngalim. (2010). Prinsip-Prinsip dan
Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya.
Sudijono,
Anas. (2011). Pengantar Evaluasi
Pendidikan. Jakarta: Rajawali Pers.
Sumanto.
(2009). Analisis Butir Soal, tersedia
dalam http://sumantomantos.files.wordpress.com/,diunduh
pada tanggal 10 April 2012.
Thorndike,
Robert L. and Elizabeth Hagen. (1961). Measurement
and Evaluation in Psychology and Education. New York: John Willey and Sons
Inc.
Witherington.
(1967). Psychological Education(Terjemahan
M. Buchori, M.ED.) Bandung:Keluarga Bapemsi.
http://www.4shared.com/file/H9lq4L-i/TKI__Daya_Beda.html