Selasa, 15 Mei 2012

Kelompok 9- TINGKAT KESUKARAN ITEM TES DAN DAYA PEMBEDA SEBUAH ITEM TES


TINGKAT KESUKARAN ITEM TES DAN
DAYA PEMBEDA SEBUAH ITEM TES
MAKALAH
DiajukanuntukMemenuhiTugasTerstruktur
Mata Kuliah: EvaluasiPembelajaran
DosenPengampu: NaeilaRifatilMuna,S.Psi,M.Pd.I

Disusunoleh:
Kelompok 9
DidinJaenudin
(59430500)
PBI-A/VI


INSTITUT AGAMA ISLAM NEGERI
(IAIN) SYEKH NURJATI CIREBON
2012

BAB I

PENDAHULUAN

A.      LatarBelakang
Proses evaluasisangatdiperlukandalampendidikan formal, dalamhalinisekolah. Khususnyaevaluasidalampembelajaran, untukmengetahuisejauhmanahasilbelajarseorangsisiwa.Selainitujuga, halinidimaksudkanintukmelihattingkatkemampuandankeberhasilansiswadalam proses pembelajaran.
Evaluasihasilbelajarsiswamerupakansalahsatukegiatan yang merupakankewajibanbagisetiap guru.Karena, setiappengajarpadaakhirnyaharusmampumemberikaninformasikepadalembagaataupunsiswanyasendiritentangbagaimanadansampaidimanapenguasaandankemampuan yang telahdicapaisiswatentangmateripembelajarandanketerampilan-keterampilanmengenaimatapelajaran yang telahdiberikanolehpengajartersebut.
Dalam proses evaluasi, adasalahsatutugas yang cukuppenting yang seringkalidanbahkanpadaumumnyamemangdilupakanolehstafpengajar (guru, dosen, dan lain-lain)adalahtugasmelakukanevaluasiterhadapalatpengukur yang telahdigunakanuntukmengukurkeberhasilanbelajarparapesertadidiknya (murid/siswa, mahasiswadan lain-lain). Alatpengukur yang dimaksudadalahteshasilbelajar, yang sebagaimanatelahkitaketahuibersamaterdiridaributir-butirsoal.
Terkadanghasildarisuatutesmenunjukkanbahwahampirseluruhdaripesertatesmendapatkanhasiltes yang terbilangrendah.Denganhasiltersebutparapengajarcenderungmenasumsikanbahwaparapesertatesterdiridari “anak-anak yang bodoh”.Namunasumsitersebutbelumtentukepastiannya, karenamungkinsajasoal-soaltesterlalusulituntukdijawab.
Sebaliknya, terkadangterjadidalamsuatutesdimanahampirseluruhpesertatesmendapatkanhasil yang tinggi, kemudian tester mengasumsikanbahwamerekatelahmenguasaiseluruhmateri yang telahdiberikandanberanggapanbahwamerekaadalah “anak-anak yang hebat”.Seperti yang telahdisebutkansebelumnya, asumsiinijugabelumtentubenarkepastiannya, karenamungkinsajabutir-butirsoaltesterlalumudahbagiparapesertates.
Untukmengantisipasikemungkinantersebut, stafpengajarperlumelakukanpenganalisisanterhadapteshasilbelajar yang dijadikanalatukurkeberhasilanpesertadidikdalampembelajaran.Kegiatantersebutseringdikenaldenganistilahanalisis item (item analysis). Olehkarenaitu, makalahinisedikitbanyaknyaakanmenjelaskanbagaimanakitaakanmenganalisissetiap item soaltes yang kitaberikandalam proses pembelajaran di kelas.

B.      RumusanMasalah
1.   Analisisderajat/tingkatkesukaran item tes.
2.   Analisisdayapembeda item.

C.      TujuanPenulisan
1.   Untukmengetahuibagaimanacaramenganalisistingkatkesukaransetiapbutirsoaltes.
2.   Untukmengetahuifungsidayapembeda item danbagaimanacaramenganalisisdayapembedasetiapbutirsoaltes.


BAB II
PEMBAHASAN

Penganalisisan terhadap butir soal teshasil belajar guna memperoleh item tes yang mampu menjalankan fungsinya sebagai alat ukur hasil belajar, dapat dilakukan dengan beberapa cara, yaitu: dengan analisis tingkat kesukaran butir soal tesnya, dan dengan menganalisis daya pembeda butir soalnya.
A.      Analisis Derajat/Tingkat Kesukaran Item
Bermutu atau tidaknya butir-butir item tes hasil belajar dapat diketahui melalui analisis terhadap tingkat kesukaran atau taraf kesukaran yang dimiliki oleh masing-masing butir item tes tersebut.Tingkat kesukaran setiap item tes adalah pernyataan tentang seberapa mudah atau seberapa sukar sebuah butir tes itu bagi testee atau siswa terkait yang menjawab soal tes tersebut.
Tingkat kesukaran merupakan salah satu ciri tes yang perlu diperhatikan, karena tingkat kesukaran tes menunjukkan seberapa sukar atau mudahnya butir-butir tes atau tes secara keseluruhan yang telah diselenggarakan. Butir-butir item tes hasil belajar dapat dikatakan sebagai butir-butir item yang baik apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain derajat/tingkat kesukaran item tes tersebut itu adalah sedang atau cukup.
Butir tes yang memiliki tingkat kesukaran yang sedangadalah butir-butir item tes yang dapat dijawab dengan benar oleh sekitar 40% sampai 80% peserta tes. Sebab butir tes yang hanya dijawab oleh 10 % atau bahkan 90 %, akan sulit dibedakan, manakah kelompok yang benar-benar mampu dan kelompok yang benar-benar kurang mampu dalam menjawab soal.Butir tes harus diketahui tingkat kesukarannya, karena setiap pembuat butir soal tes perlu mengetahui apakah soal itu sukar, sedang atau mudah.Tingkat kesukaran itu dapat dilihat dari jawaban siswa.Semakin sedikit jumlah siswa yang dapat menjawab soal itu dengan benar, berarti soal itu termasuk sukar dan sebaliknya semakin banyak siswa yang dapat menjawab soal itu dengan benar, berarti itu mengindikasikan soal itu tidak sukar atau soal itu mudah.
Dalam hal ini Witherington dalam bukunya yang berjudul Psychological Education (hlm. 87) menyatakan bahwa sudah atau belum memadainya tingkat kesukaran item tes hasil belajar dapat dilihat dan diketahui dari besar kecilnya angka yang melambangkan tingkat kesulitan dari item tes tersebut yang sering dikenal dengan istilah difficulty index (=angka indek kesukaran item), yang dalam dunia evaluasi pembelajaran umumnya dilambangkan dengan huruf P, yaitu singkatan dari kata Proportion (proporsi=proporsa).
Angka indek kesukaran item tersebut besarnya berkisar amtara 0,00 sampai dengan 1,00. Yang berarti bahwa angka terrendah dari indek kesukaran item tes adalah 0,00 dan angka tertinggi dari indek kesukaran tes adalah 1,00. Jika angka indeks 0,00 (P = 0,00) berarti butir soal sangat sukar karena tidak seorangpun dapat menjawab dengan benar butir tes tersebut. Sebaliknya jika indeksnya 1,00 berarti butir soal tersebut sangat mudah karena semua siswa dapat menjawabnya dengan benar.











P :       0,0              0,1              0,2              0,3          0,4          0,5          0,6          0,7              0,8          0,9              1,0

Terlalu sukar                                                                                                              Terlalu mudah
Angka indek kesukaran tersebut dapat diperoleh dengan menggunakan rumus yang dikemukakan Dubois dalam Sudijono (2011: 371), yaitu:
P =
di mana:
P        =   Proportion = proporsi = proporsa = difficulty index = angka indek kesukaran item.
Np          =     Banyaknya testee/peserta tes yang mampu  menjawab dengan benar terhadap butir item yang bersangkutan.
N       =   Jumlah testee/peserta tes yang mengikuti hasil belajar.
Rumus lainnya adalah:
P =
di mana:
P        =   Proportion = proporsi = proporsa = difficulty index = angka indek kesukaran item.
B       =   Banyaknya testee/peserta tes yang mampu  menjawab dengan benar terhadap butir item yang bersangkutan.
JS      =   Jumlah testee/peserta tes yang mengikuti hasil belajar.
Ada beberapa pendapat tentang cara menginterpretasikan (menafsirkan) angka indek kesukaran item tes. Menurut Robert L. Thorndike dan Elizabeth Hagen (1961) mengemukakan pendapatnya sebagai berikut:
Besarnya P
Interpretasi
Kurang dari 0,30
Terlalu Sukar
0,30 - 0,70
Cukup (Sedang)
Lebih dari 0,70
Terlalu Mudah
Sedangkan menurut Witherington adalah sebagai berikut:
Besarnya P
Interpretasi
Kurang dari 0,25
Terlalu Sukar
0,25 - 0,75
Cukup (Sedang)
Lebih dari 0,75
Terlalu Mudah
Sebagai contoh, lihat tabel dibawah ini:
TABEL 2.1.   Penyebaran skor jawaban 10 orang testee terhadap 10 butir item yang diajukan dalam tes hasil belajar tahap akhir bidang studi Bahasa Inggris.
Testee
Skor yang dicapai oleh testee untuk setiap butir item nomor
1
2
3
4
5
6
7
8
9
10
A
0
1
1
0
1
0
1
1
1
0
B
1
0
1
1
1
1
0
0
1
1
C
1
0
0
0
0
0
1
1
1
0
D
0
0
1
1
1
0
1
0
1
1
E
1
0
1
0
1
1
1
0
1
0
F
0
0
1
1
0
0
1
1
1
1
G
1
0
1
0
0
0
0
0
0
1
H
0
0
1
1
0
0
1
0
1
1
I
1
0
1
0
1
0
1
0
1
1
J
1
1
1
1
1
1
1
0
1
1
10=
6=
2=
9=
5=
6=
3=
8=
3=
9=
7=
N=JS
NP=B
NP=B
NP=B
NP=B
NP=B
NP=B
NP=B
NP=B
NP=B
NP=B
Setiap butir item yang mampu dijawab dengan benar diberikan bobot 1 dan untuk setiap item soal yang dijawab salah diberikan bobot 0.Dari tabel tersebut, kita memperoleh data bahwa jumlah testee (N atau JS) adalah 10. Dari butir soal nomor satu diperoleh testee yang menjawab benar ada 6 orang sehingga dapat dihitung angka indek kesukarannya adalah 6/10 = 0,60. Dengan demikian dapat ditarik kesimpulan bahwa butir soal nomor 1 termasuk kriteria butir soal yang tingkat kesukarannya sedang.Untuk butir soal nomor 2 dan nomor 3 dengan Np atau B masing-masing sebesar 2 dan 9 akan didapat angka indek kesukaran item untuk masing-masing adalah sebesar 2/10 = 0,20 (nomor 2) dan 9/10 = 0,90 (nomor 3). Diantara kedua pendapat yang telah disebutkan, pendapat yang pertama adalah yang lebih banyak digunakan, oleh karenanya, kita dapat menginterpretasikan bahwa soal nomor 2 termasuk kedalam kategori butir soal yang terlalu sulit; sedangkan butir soal nomor 3 termasuk ke dalam kategori butir soal yang terlalu mudah.
Untuk memperjelas dan mempermudahkan perhitungan keseluruhan angka indek kesukaran ataupun tingkat kesukaran butir tes untuk setiap nomornya, perhatikan tabel berikut ini:
Butir Soal Nomor
Angka Indek Kesukaran Item (P)
Interpretasi
1
P = 6/10 = 0,60
Cukup (Sedang)
2
P = 2/10 = 0,20
Terlalu Sukar
3
P = 9/10 = 0,90
Terlalu Mudah
4
P = 5/10 = 0,50
Cukup (Sedang)
5
P = 6/10 = 0,60
Cukup (Sedang)
6
P = 3/10 = 0,30
Cukup (Sedang)
7
P = 8/10 = 0,80
Terlalu Mudah
8
P = 3/10 = 0,30
Cukup (Sedang)
9
P = 9/10 = 0,90
Terlalu Mudah
10
P = 7/10 = 0,70
Cukup (Sedang)
Tabel 2.2.Perhitungan angka indek kesukaran item tes dan interpretasinya.
Dari tabel tersebut dapat diketahui bahwa butir soal yang tergolong baik; tingkat kesukarannya sedang adalah butir soal nomor 1,4,5,6,8 dan 10. Butir soal yang tergolong sulit adalah butir soal nomor 2. Sedangkan butir soal yang tergolong terlalu mudah adalah butir soal nomor 3,7 dan 9.
Setelah identifikasi tentang tingkat kesukaran butir soal tes telah dilakukan, perlu adanya penindaklanjutan terhadap soal-soal tersebut. Tindak lanjut tersebut diantaranya adalah:
Pertama, untuk butir soal yang telah memenuhi kategori yang baik (tingkat kesukarannya sedang atau cukup), hendaknya disimpan ke dalam bank soal agar tester dapat mempergunakanya kembali untuk waktu yang akan datang.
Kedua,untuk item soal yang tergolong terlalu sulit ada 3 kemungkinan tindak lanjut, yaitu:
1)       Dibuang atau didrop dan tidak akan digunakan lagi,
2)       Diperbaiki, diteliti ulang dan dicari tahu apa faktor penyebab dari sulitnya soal tersebut dijawab oleh testee,
3)       Disimpan dan digunakan untuk tujuan khusus, seperti tes penyeleksian siswa yang bersifat lebih ketat yang hanya sebagian kecil yang akan diterima.
Ketiga, untuk item soal yang tergolong terlalu mudah juga ada 3 kemungkinan tindak lanjut, ini hampir sama dengan tindak lanjut untuk butir-butir soal yang tergolong sulit, yaitu:
1)       Dibuang atau didrop dan tidak akan digunakan lagi,
2)       Diperbaiki, diteliti ulang dan dicari tahu apa faktor penyebab dari mudahnya soal tersebut untuk dijawab oleh testee,
3)       Disimpan dan digunakan untuk tujuan khusus, seperti tes penyeleksian siswa yang bersifat lebih longgar, yang sebagian besar yang akan diterima yang bisa dikatakan sebagai tes formalitas.
Cara yang lain yang dapat digunakan untuk mencari atau menghitung angka indek kesukaran item adalah dengan menggunakan skala kesukaran linear. Skala linear ini digunakan untuk mencari P bersih, karena sesungguhnya P yang kita hitung sebelumnya tidak memperhatikan atau memperhitungkan option atau alternative jawaban yang dipasang disetiap butir soal tes.
Skala kesukaran ini disusun dengan cara mentransformasikan nilai P menjadi nilai z yang ada di dalam tabel nilai z yang umumnya dilampirkan disetiap buku statistik. Dengan cara kedua ini ada beberapa langkah yang harus ditempuh.
Langkah pertama, Mengubah nilai P kotor (Pk) menjadi nilai P bersih (Pb) dengan menggunakan rumus:
Pb =
di mana:
Pb      =   P bersih.
Pk      =   P kotor
a        =   Alternatif atau option yang disediakan di butir soal yang bersangkutan.
1        =   Bilangan konstan.
Contoh: Pk no. 7 = 0,80, jumlah option = 5 butir, maka:
Pb = =  = 0,75
Untuk lebih menghemat waktu, untuk pengoreksian atau pengubahan P kotor menjadi P bersih kita bisa langsung melihat tabel nilai P bersih yang telah tersedia, termasuk dengan pilihan alternatif dari 2 sampai 5 butir.
Langkah kedua, Mentransformasikan nilai P bersih (Pb) menjadi nilai z dengan melihat tabel kurva normal yang telah tesedia. Sebagai contoh, kita ambil nilai P bersih dari butir nomor soal 7 yaitu 0,75. Kita cari angka 0,75 di tabel kurva normal, sehingga diperoleh sebagai berikut:
B
Larger Area
z
C
Smaller Area
0,750
0,6745
0,250
Dengan demikian nilai z untuk butir nomor 7 sebesar 0,6745. Dengan berpegang terhadap pendapat Thorndike dan Hagen maka butir soal nomor 7 tergolong butir soal yang memiliki tingkat kesukaran yang sedang (cukup).
Selain itu ada rumus lain yang bisa digunakan untuk mencari P bersih (Pb) dengan hasil yang sama, yaitu:
Pb =
B -
S
a - 1
B + S
di mana:
Pb      =   P bersih.
B       =   Jumlah testee yang jawabannya benar.
S        =   Jumlah testee yang jawabannya salah
a        =   Alternatif atau option yang disediakan di butir soal yang bersangkutan.
Contoh:   Butir soal nomor 7 yang menjawab benar ada 8 orang, dan yang menjawab salah 2 orang dengan jumlah option/alternative 5 butir, maka:
Pb =
8 -
2
5 - 1
8 + 2


Pb =
8 – 0,50
10

Pb=
7,50
=
0,75 (hasilnya sama)
10
Langkah ketiga, Mencari atau menghitung angka indek kesukaran item dengan menggunakan angka indek Davis yang sering disingkat dengan indeks Davis saja dan dilambangkan dengan huruf D dengan rumus:
D = 21,063 z + 50
Dengan menggunakan rumus ini kita dapat menghindari hasil perolehan nilai P bersih (Pb) yang negatif, perhatikan contoh berikut:
Diketahui: P kotor = 0,20, dengan jumlah alternative/option = 4, maka:
Pb = =  = -0,667
Dalam indeks Davis tingkat kesukaran berkisar antara 0 sampai dengan 100, maka tidak mungkin akan menghasilkan tanda minus. Sebagai contohnya, misalkan sebutir item soal memiliki P bersih sebesar 0,755. Dengan berkonsultasi dengan tabel kurva normal diperoleh z sebesar 0,6905, maka:
D = 21,063 z + 50
     = (21,063) (0,6905) + 50
     = 64,5440015
     = 64,54 (dibulatkan 2 angka dibelakang koma/tanda desimal)


B.      Analisis Daya Pembeda Item
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi (pandai) dengan testee yang berkemampuan rendah (tidak pandai) sehingga sebagian testee yang berkemampuan tinggi untuk menjawab butir item tersebut lebih banyak yang menjawab benar, sementara testee yang berkemempuan rendah untuk menjawab item tes terrsebut sebagian besar tidak dapat menjawab item soal dengan benar.
Dengan kata lain, bahwa analisis daya beda item adalahanalisis yang mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah. Salah satu ciri butir yang baik adalah yang mampu membedakan antara kelompok atas (yang mampu) dan kelompok bawah (kurang mampu).Ini dianggap sangat penting karena ada anggapan bahwa kemampuan setiap testee akan berbeda dengan testee yang lainnya.
Daya pembeda (discriminatory power) item itu dapat diketahui melalui atau dengan melihat besar kecilnya angka indeks diskriminasi item.Pada dasarnya, daya pembeda ini dihitung atas dasar pembagian testee ke dalam dua kelompok, yaitu kelompok atas (the higher group) – kelompok yang tergolong pandai – dankelompok bawah (the lower group) – kelompok yang tergolong kurang pandai. Ada beberapa cara untuk mengelompokkan testee, dapat menggunakan median, dapat juga menggunakan hanya 20% dari testee yang temasuk kelompok atas dan 20% yang termasuk kelompok bawah. Namun pada umumnya, para pakar di bidang evaluasi menggunakan persentase 27% dari testee yang termasuk kelompok atas dan 27% dari testee yang termasuk kelompok bawah karena dianggap cukup mampu diandalkan.
Indeks dikriminasi item umumnya diberi lambang D (singkatan ari Discriminatory Power) yang besarnya berkisar antara 0 sampai dengan 1,00. Akan tetapi indeks diskriminasi ini dapat bertanda minus (-). Jika sebutir item angka indeks diskriminasinya = 0,00, maka item tersebut tidak memiliki daya pembeda sama sekali. Jika indeks diiskriminasi itemnya bertanda negative (minus) maka butir item tersebut lebih banyak dijawab benar oleh testee dari kelompok bawah daripada testee kelompok atas atau testee yang sebenarnya termasuk dalam kelompok atas lebih banyak yang menjawab salah sedangkan testee yang termasuk kelompok bawah lebih banyak yang menjawab benar. Perhatikan bagan berikut ini:
D =                                                            D =                                                        D =

-1,00                                                         0,00                                                      +1,00


Daya pembeda item bersifat negative
Item yang bersangkutan tidak memiliki daya pembeda sama sekali
Daya pembeda item bersifat positif

Dalam hubungan ini pada umumnya besaran indeks diskriminasi yang dapat diinterpretasikan adalah sebagai berikut:
Basarnya Angka Indeks Diskriminasi Item (D)
Klasifikasi
Interpretasi
Kurang dari 0,20
Poor
Butir item yang bersangkutan daya pembedanya lemah sekali (jelek), dianggap tidak memiliki daya pembeda yang baik.
0,20 – 0,40
Satisfactory
Butir item yang bersangkutan telah memiliki daya pembeda yang cukup (sedang).
0,40 – 0,70
Good
Butir item yang bersangkutan telah memiliki daya pembeda yang baik.
0,70 – 1,00
Excellent
Butir item yang bersangkutan telah memiliki daya pembeda yang baik sekali.
Bertanda negatif
-
Butir item yang bersangkutan daya penbedanya negative (jelek sekali).
Untuk menghitung besar kecilnyaangka indeks diskriminasi item dapat dipergunakan dua rumus.
Rumus pertama:
D = PA - pB      atau          D = PH – pL
di mana:
D       =   Discriminatory power (angka indeks diskriminasi item)
PA atau PH    =   Proporsi testee kelompok atas yang dapat menjawab dengan benar butir item yang bersangkutan.
                        (PHadalah singkatan dari Proportion of Higher Group)
                        PA atau PH dapat diperoleh dengan rumus:
                        PA atau PH =
                        dimana:
                   BA   =   Banyaknya testee kelompok atas yang dapat menjawab benar butir item yang bersangkutan.
                   JA    =   Jumlah testee yang termasuk dalam kelompok atas.
pB atau pL       =   Proporsi testee kelompok bawah yang dapat menjawab dengan benar butir item yang bersangkutan.
                        (pL adalah singkatan dari Proportion of Lower Group).
                        pB atau pL dapat diperoleh dengan rumus:
                        pB atau pL =
                        dimana:
                   BB   =   Banyaknya testee kelompok bawah yang dapat menjawab benar butir item yang bersangkutan.
                        JB    =   Jumlah testee yang termasuk dalam kelompok bawah.
Rumus kedua:
Indeks diskriminasi item pada rumus kedua ini didapatkan dengan menggunakan teknik korelasi Phi (Ø) dengan rumus sebagai berikut:
Ø =
di mana:
Ø       =   Angka Indeks Korelasi Phi (Indeks Diskriminasi Item).
PH          =   Proportion of Higher Group.
PL      =   Proportion of Lower Group.
2        =   Bilangan konstan.
p        =   Proporsi seluruh testee yang jawabannya Benar.
q        =   Proporsi seluruh testee yang jawabannya Salah, dimana q = (1 - p).
Contoh 1: Menggunakan rumus pertama (rumus D)
Misalkan 10 orang mengikuti tes hasil belajar bidang studi Matematika yang berbentuk pilihan ganda.Ada 10 butir item soal dalam tes tersebut dengan catatn yang menjawab benar diberi bobot 1 dan yang menjawab salah 0, sebagaimana tertera pada Tabel 2.3.
Ada beberapa langkah yang harus dilakukan untuk mencari besarnya angka indeks diskriminasi item (D), yaitu:
Langkah pertama:Mengelompokkan (membagi) testee menjadi 2 kelompok, yaitu kelompok atas (yang mendapatkan skor yang tinggi) dan kelompok bawah (yang mendapatkan skor rendah).

Tabel 2.3.Distribusi skor hasil tes Matematika
Testee
Skor yang dicapai oleh testee untuk setiap butir item nomor
Total
1
2
3
4
5
6
7
8
9
10
A
0
(1)
(1)
0
(1)
0
(1)
(1)
(1)
(1)
7
B
(1)
0
(1)
(1)
(1)
(1)
0
0
(1)
(1)
7
C
1
0
0
0
0
0
1
1
1
0
4
D
(1)
0
(1)
(1)
(1)
0
(1)
(1)
(1)
(1)
8
E
(1)
0
(1)
0
(1)
(1)
(1)
0
(1)
(1)
7
F
0
0
1
1
0
0
1
1
1
0
5
G
1
0
1
0
0
0
0
0
0
1
3
H
0
0
1
1
0
0
1
0
1
0
4
I
1
0
1
0
1
0
1
0
1
1
6
J
(1)
(1)
(1)
(1)
(1)
(1)
(1)
0
(1)
(1)
9
N=10
7
2
9
5
6
3
8
4
9
7
60

Kelompok Atas

Kelompok Bawah
Testee
Skor

Testee
Skor
J
9

I
6
D
8

F
5
A
7

C
4
B
7

H
4
E
7

G
3
JA = 5
-

JB = 5
-
Langkah kedua:menuliskan atau memberikan tanda atau kode terhadap hasil pengelompokan testee atas dua kategori tersebut. (Menggunakan tanda kurung bagi jawaban yang benar untuk kelompok atas).
Langkah ketiga:Mencari (menghitung) BA, BB, PA, PBdan D. (Lihat Tabel 2.4)
Tabel 2.4.Hasil perhitungan BA, BB, PA, PB dan D
Nomor Butir Item
BA
BB
JA
JB
PA
PB
D=PA-PB
1
4
3
5
5
0,80
0,60
0,20
2
2
0
5
5
0,40
0,00
0,40
3
5
4
5
5
1,00
0,80
0,20
4
3
2
5
5
0,60
0,40
0,20
5
5
1
5
5
1,00
0,20
0,80
6
3
0
5
5
0,60
0,00
0,60
7
4
4
5
5
0,80
0,80
0,00
8
2
2
5
5
0,40
0,40
0,00
9
5
4
5
5
1,00
0,80
0,20
10
5
2
5
5
1,00
0,40
0,60
Langkah keempat: Memberikan interpretasi mengenai kualitas daya pembeda item yang dimiliki oleh 10 item soal tes hasil belajar seperti yang terlihat pada Tabel 2.5
Tabel 2.5.Pemberian Interpretasi terhadap D
Nomor Butir Item
Besarnya D
Klasifikasi
Interpretasi
5
0,80
Excellent
Daya pembeda itemnya sangat baik sekali.
6 dan 10
0,60
Good
Daya pembeda itemnya baik.
2
0,40
Satisfactory
Daya pembeda itemnya cukup (sedang).
1, 3, 4 dan 9
0,20
Poor
Daya pembeda itemnya lemah sekali.
7 dan 8
0,00
Poor
Tidak memiliki daya pembeda sama sekali.
Dengan demikian, jelas terlihat bahwa 4 dari 10 item soal diatas sudah termasuk memiliki daya pembeda yang memadai dan sisanya, yaitu 6 masih tergolong kelompok item soal yang tidak/belum memiliki daya pembeda yang diharapkan.
Contoh 2: Menggunakan rumus yang kedua
Karena pada hakikatnya PA = PH dan PB= PL maka kita hanya perlu mengganti simbolnya saja. Setelah itu kita cari nilai p (proporsi testee yang jawabannya benar) dan q (proporsi testee yang jawabannya salah).Setelah selesai didapatkan, nilai PH, PL, p dan q kita substitusikan kedalam rumus korelasi Phi. Hasilnya adalah sebagai berikut:
Tabel 2.6.Perhitungan besarnya korelasi koefisien Phi (Ø)
Butir Item Nomor
PH
PL
p
q
Ø =
Ø
Ø
Klasifikasi
1
0,80
0,60
0,7
0,3
0,22
Satisfactory
2
0,40
0,00
0,2
0,8
0,50
Good
3
1,00
0,80
0,9
0,1
0,33
Satisfactory
4
0,60
0,40
0,5
0,5
0,40
Good
5
1,00
0,20
0,6
0,4
0,81
Excellent
6
0,60
0,00
0,3
0,7
0,65
Good
7
0,80
0,80
0,8
0,2
0,00
Poor
8
0,40
0,40
0,4
0,6
0.00
Poor
9
1,00
0,80
0,9
0,1
0,33
Satisfactory
10
1,00
0,40
0,7
0,3
0,65
Good
Dengan menggunakan teknik/rumus korelasi Phi ternyata angka indeks diskriminasi itemnya (Ø) sedikit berbeda besarnya dengan angka indeks diskriminasi item yang dihitung dengan menggunakan rumus pertama (rumus D).Hal ini memang dapat dipahami, sebab menurut para ahli di bidang evaluasi pendidikan angka indeks diskriminasi item yang diperoleh dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.
pB atau pL       =   Proporsi testee kelompok bawah yang dapat menjawab dengan benar butir item yang bersangkutan.
                        (pL adalah singkatan dari Proportion of Lower Group).
                        pB atau pL dapat diperoleh dengan rumus:
                        pB atau pL =
                        dimana:
                   BB   =   Banyaknya testee kelompok bawah yang dapat menjawab benar butir item yang bersangkutan.
                        JB    =   Jumlah testee yang termasuk dalam kelompok bawah.
Rumus kedua:
Indeks diskriminasi item pada rumus kedua ini didapatkan dengan menggunakan teknik korelasi Phi (Ø) dengan rumus sebagai berikut:
Ø =
di mana:
Ø       =   Angka Indeks Korelasi Phi (Indeks Diskriminasi Item).
PH          =   Proportion of Higher Group.
PL      =   Proportion of Lower Group.
2        =   Bilangan konstan.
p        =   Proporsi seluruh testee yang jawabannya Benar.
q        =   Proporsi seluruh testee yang jawabannya Salah, dimana q = (1 - p).
Contoh 1: Menggunakan rumus pertama (rumus D)
Misalkan 10 orang mengikuti tes hasil belajar bidang studi Matematika yang berbentuk pilihan ganda. Ada 10 butir item soal dalam tes tersebut dengan catatan yang menjawab benar diberi bobot 1 dan yang menjawab salah 0, sebagaimana tertera pada Tabel 2.3.
Ada beberapa langkah yang harus dilakukan untuk mencari besarnya angka indeks diskriminasi item (D), yaitu:
Langkah pertama: Mengelompokkan (membagi) testee menjadi 2 kelompok, yaitu kelompok atas (yang mendapatkan skor yang tinggi) dan kelompok bawah (yang mendapatkan skor rendah).

Tabel 2.3. Distribusi skor hasil tes Matematika
Testee
Skor yang dicapai oleh testee untuk setiap butir item nomor
Total
1
2
3
4
5
6
7
8
9
10
A
0
(1)
(1)
0
(1)
0
(1)
(1)
(1)
(1)
7
B
(1)
0
(1)
(1)
(1)
(1)
0
0
(1)
(1)
7
C
1
0
0
0
0
0
1
1
1
0
4
D
(1)
0
(1)
(1)
(1)
0
(1)
(1)
(1)
(1)
8
E
(1)
0
(1)
0
(1)
(1)
(1)
0
(1)
(1)
7
F
0
0
1
1
0
0
1
1
1
0
5
G
1
0
1
0
0
0
0
0
0
1
3
H
0
0
1
1
0
0
1
0
1
0
4
I
1
0
1
0
1
0
1
0
1
1
6
J
(1)
(1)
(1)
(1)
(1)
(1)
(1)
0
(1)
(1)
9
N=10
7
2
9
5
6
3
8
4
9
7
60

Kelompok Atas

Kelompok Bawah
Testee
Skor

Testee
Skor
J
9

I
6
D
8

F
5
A
7

C
4
B
7

H
4
E
7

G
3
JA = 5
-

JB = 5
-
Langkah kedua: menuliskan atau memberikan tanda atau kode terhadap hasil pengelompokan testee atas dua kategori tersebut. (Menggunakan tanda kurung bagi jawaban yang benar untuk kelompok atas).
Langkah ketiga: Mencari (menghitung) BA, BB, PA, PBdan D. (Lihat Tabel 2.4)
Tabel 2.4. Hasil perhitungan BA, BB, PA, PB dan D
Nomor Butir Item
BA
BB
JA
JB
PA
PB
D=PA-PB
1
4
3
5
5
0,80
0,60
0,20
2
2
0
5
5
0,40
0,00
0,40
3
5
4
5
5
1,00
0,80
0,20
4
3
2
5
5
0,60
0,40
0,20
5
5
1
5
5
1,00
0,20
0,80
6
3
0
5
5
0,60
0,00
0,60
7
4
4
5
5
0,80
0,80
0,00
8
2
2
5
5
0,40
0,40
0,00
9
5
4
5
5
1,00
0,80
0,20
10
5
2
5
5
1,00
0,40
0,60
Langkah keempat: Memberikan interpretasi mengenai kualitas daya pembeda item yang dimiliki oleh 10 item soal tes hasil belajar seperti yang terlihat pada Tabel 2.5
Tabel 2.5. Pemberian Interpretasi terhadap D
Nomor Butir Item
Besarnya D
Klasifikasi
Interpretasi
5
0,80
Excellent
Daya pembeda itemnya sangat baik sekali.
6 dan 10
0,60
Good
Daya pembeda itemnya baik.
2
0,40
Satisfactory
Daya pembeda itemnya cukup (sedang).
1, 3, 4 dan 9
0,20
Poor
Daya pembeda itemnya lemah sekali.
7 dan 8
0,00
Poor
Tidak memiliki daya pembeda sama sekali.
Dengan demikian, jelas terlihat bahwa 4 dari 10 item soal diatas sudah termasuk memiliki daya pembeda yang memadai dan sisanya, yaitu 6 masih tergolong kelompok item soal yang tidak/belum memiliki daya pembeda yang diharapkan.
Contoh 2: Menggunakan rumus yang kedua
Karena pada hakikatnya PA = PH dan PB= PL maka kita hanya perlu mengganti simbolnya saja. Setelah itu kita cari nilai p (proporsi testee yang jawabannya benar) dan q (proporsi testee yang jawabannya salah). Setelah selesai didapatkan, nilai PH, PL, p dan q kita substitusikan kedalam rumus korelasi Phi. Hasilnya adalah sebagai berikut:
Tabel 2.6. Perhitungan besarnya korelasi koefisien Phi (Ø)
Butir Item Nomor
PH
PL
p
q
Ø =
Ø
Ø
Klasifikasi
1
0,80
0,60
0,7
0,3
0,22
Satisfactory
2
0,40
0,00
0,2
0,8
0,50
Good
3
1,00
0,80
0,9
0,1
0,33
Satisfactory
4
0,60
0,40
0,5
0,5
0,40
Good
5
1,00
0,20
0,6
0,4
0,81
Excellent
6
0,60
0,00
0,3
0,7
0,65
Good
7
0,80
0,80
0,8
0,2
0,00
Poor
8
0,40
0,40
0,4
0,6
0.00
Poor
9
1,00
0,80
0,9
0,1
0,33
Satisfactory
10
1,00
0,40
0,7
0,3
0,65
Good
Dengan menggunakan teknik/rumus korelasi Phi ternyata angka indeks diskriminasi itemnya (Ø) sedikit berbeda besarnya dengan angka indeks diskriminasi item yang dihitung dengan menggunakan rumus pertama (rumus D). Hal ini memang dapat dipahami, sebab menurut para ahli di bidang evaluasi pendidikan angka indeks diskriminasi item yang diperoleh dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.


BAB III
PENUTUP

A.      Kesimpulan
Evaluasi hasil belajar siswa merupakan salah satu kegiatan yang merupakan kewajiban bagi setiap guru.Penganalisisan terhadap butir soal tes hasil belajar dilakukan guna memperoleh dan mengetahui apakah item tes sudah mampu menjalankan fungsinya sebagai alat ukur hasil belajar.
Penganalisisan terhadap butir soal tes hasil belajar dapat dilakukan dengan beberapa cara, yaitu: dengan analisis tingkat kesukaran butir soal tesnya, dan dengan menganalisis daya pembeda butir soalnya.Analisis tingkat kesukaran butir item tes dimaksudkan untuk mengetahui seberapa mudah dan seberapa sulit tingkat kesukaran sebuah item soal tes bagi testee atau siswa yang terkait.
Analisis daya beda butir item tes dimaksudkan untuk mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah.Salah satu ciri butir yang baik adalah yang mampu membedakan antara kelompok atas (yang mampu) dan kelompok bawah (kurang mampu).

B.      Saran
Tidak sedikit dari para staf pengajar yang hanya membuat soal tes, lalu memberikannya, setelah itu maka selesailah proses evaluasi belajar. Mereka cenderung tidak memperhatikan bagaimana setiap butir soal tes mampu menjalankan tugasnya sebagai alat ukur kemampuan testee.
Dalam proses evaluasi hasil belajar, hendaknya kita memperhatikan setiap butir soal yang akan diberikan dalam rangka mengukur kemampuan seorang testee atau seorang siswa. Soal yang akan diberikan harus mampu menjalankan tugasnya sebagai alat ukur atas sejauh mana seorang testee atau siswa menguasai atau memehami hasil pembelajarannya.
Oleh karena itu, analisis terhadap tingkat kesukaran setiap item tes dan daya pembeda item perlu dilakukan untuk menunjang fungsi dan tujuan pemberian tes hasil belajar tadi yang telah disebutkan agar mendapatkan tes hasil belajar yang berkualitas.


DAFTAR PUSTAKA

Masmud. (2009). Tingkat Kesukaran dan Daya Beda, tersedia dalam http://masmud09.blogspot.com/, diunduh pada tanggal 10 April 2012.
Purwanto, M. Ngalim. (2010). Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya.
Sudijono, Anas. (2011). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Pers.
Sumanto. (2009). Analisis Butir Soal, tersedia dalam http://sumantomantos.files.wordpress.com/,diunduh pada tanggal 10 April 2012.
Thorndike, Robert L. and Elizabeth Hagen. (1961). Measurement and Evaluation in Psychology and Education. New York: John Willey and Sons Inc.
Witherington. (1967). Psychological Education(Terjemahan M. Buchori, M.ED.) Bandung:Keluarga Bapemsi.

 *Slide presentasi kelompok 9 dapat dilihat di: 
http://www.4shared.com/file/H9lq4L-i/TKI__Daya_Beda.html





.