Evaluasi Pembelajaran (PBI-A 6th Semester): Kelompok 9- TINGKAT KESUKARAN ITEM TES DAN DAYA PEMBEDA SEBUAH ITEM TES

TINGKAT KESUKARAN ITEM TES DAN

DAYA PEMBEDA SEBUAH ITEM TES

MAKALAH

DiajukanuntukMemenuhiTugasTerstruktur

Mata Kuliah: EvaluasiPembelajaran

DosenPengampu: NaeilaRifatilMuna,S.Psi,M.Pd.I

Disusunoleh:

Kelompok 9

DidinJaenudin

(59430500)

PBI-A/VI

INSTITUT AGAMA ISLAM NEGERI

(IAIN) SYEKH NURJATI CIREBON

2012

BAB I

PENDAHULUAN

A.      LatarBelakang

Proses evaluasisangatdiperlukandalampendidikan formal, dalamhalinisekolah. Khususnyaevaluasidalampembelajaran, untukmengetahuisejauhmanahasilbelajarseorangsisiwa.Selainitujuga, halinidimaksudkanintukmelihattingkatkemampuandankeberhasilansiswadalam proses pembelajaran.

Evaluasihasilbelajarsiswamerupakansalahsatukegiatan yang merupakankewajibanbagisetiap guru.Karena, setiappengajarpadaakhirnyaharusmampumemberikaninformasikepadalembagaataupunsiswanyasendiritentangbagaimanadansampaidimanapenguasaandankemampuan yang telahdicapaisiswatentangmateripembelajarandanketerampilan-keterampilanmengenaimatapelajaran yang telahdiberikanolehpengajartersebut.

Dalam proses evaluasi, adasalahsatutugas yang cukuppenting yang seringkalidanbahkanpadaumumnyamemangdilupakanolehstafpengajar (guru, dosen, dan lain-lain)adalahtugasmelakukanevaluasiterhadapalatpengukur yang telahdigunakanuntukmengukurkeberhasilanbelajarparapesertadidiknya (murid/siswa, mahasiswadan lain-lain). Alatpengukur yang dimaksudadalahteshasilbelajar, yang sebagaimanatelahkitaketahuibersamaterdiridaributir-butirsoal.

Terkadanghasildarisuatutesmenunjukkanbahwahampirseluruhdaripesertatesmendapatkanhasiltes yang terbilangrendah.Denganhasiltersebutparapengajarcenderungmenasumsikanbahwaparapesertatesterdiridari “anak-anak yang bodoh”.Namunasumsitersebutbelumtentukepastiannya, karenamungkinsajasoal-soaltesterlalusulituntukdijawab.

Sebaliknya, terkadangterjadidalamsuatutesdimanahampirseluruhpesertatesmendapatkanhasil yang tinggi, kemudian tester mengasumsikanbahwamerekatelahmenguasaiseluruhmateri yang telahdiberikandanberanggapanbahwamerekaadalah “anak-anak yang hebat”.Seperti yang telahdisebutkansebelumnya, asumsiinijugabelumtentubenarkepastiannya, karenamungkinsajabutir-butirsoaltesterlalumudahbagiparapesertates.

Untukmengantisipasikemungkinantersebut, stafpengajarperlumelakukanpenganalisisanterhadapteshasilbelajar yang dijadikanalatukurkeberhasilanpesertadidikdalampembelajaran.Kegiatantersebutseringdikenaldenganistilahanalisis item (item analysis). Olehkarenaitu, makalahinisedikitbanyaknyaakanmenjelaskanbagaimanakitaakanmenganalisissetiap item soaltes yang kitaberikandalam proses pembelajaran di kelas.

B.      RumusanMasalah

1.   Analisisderajat/tingkatkesukaran item tes.

2.   Analisisdayapembeda item.

C.      TujuanPenulisan

1.   Untukmengetahuibagaimanacaramenganalisistingkatkesukaransetiapbutirsoaltes.

2.   Untukmengetahuifungsidayapembeda item danbagaimanacaramenganalisisdayapembedasetiapbutirsoaltes.

BAB II

PEMBAHASAN

Penganalisisan terhadap butir soal teshasil belajar guna memperoleh item tes yang mampu menjalankan fungsinya sebagai alat ukur hasil belajar, dapat dilakukan dengan beberapa cara, yaitu: dengan analisis tingkat kesukaran butir soal tesnya, dan dengan menganalisis daya pembeda butir soalnya.

A.      Analisis Derajat/Tingkat Kesukaran Item

Bermutu atau tidaknya butir-butir item tes hasil belajar dapat diketahui melalui analisis terhadap tingkat kesukaran atau taraf kesukaran yang dimiliki oleh masing-masing butir item tes tersebut.Tingkat kesukaran setiap item tes adalah pernyataan tentang seberapa mudah atau seberapa sukar sebuah butir tes itu bagi testee atau siswa terkait yang menjawab soal tes tersebut.

Tingkat kesukaran merupakan salah satu ciri tes yang perlu diperhatikan, karena tingkat kesukaran tes menunjukkan seberapa sukar atau mudahnya butir-butir tes atau tes secara keseluruhan yang telah diselenggarakan. Butir-butir item tes hasil belajar dapat dikatakan sebagai butir-butir item yang baik apabila butir-butir item tersebut tidak terlalu sukar dan tidak pula terlalu mudah dengan kata lain derajat/tingkat kesukaran item tes tersebut itu adalah sedang atau cukup.

Butir tes yang memiliki tingkat kesukaran yang sedangadalah butir-butir item tes yang dapat dijawab dengan benar oleh sekitar 40% sampai 80% peserta tes. Sebab butir tes yang hanya dijawab oleh 10 % atau bahkan 90 %, akan sulit dibedakan, manakah kelompok yang benar-benar mampu dan kelompok yang benar-benar kurang mampu dalam menjawab soal.Butir tes harus diketahui tingkat kesukarannya, karena setiap pembuat butir soal tes perlu mengetahui apakah soal itu sukar, sedang atau mudah.Tingkat kesukaran itu dapat dilihat dari jawaban siswa.Semakin sedikit jumlah siswa yang dapat menjawab soal itu dengan benar, berarti soal itu termasuk sukar dan sebaliknya semakin banyak siswa yang dapat menjawab soal itu dengan benar, berarti itu mengindikasikan soal itu tidak sukar atau soal itu mudah.

Dalam hal ini Witherington dalam bukunya yang berjudul Psychological Education (hlm. 87) menyatakan bahwa sudah atau belum memadainya tingkat kesukaran item tes hasil belajar dapat dilihat dan diketahui dari besar kecilnya angka yang melambangkan tingkat kesulitan dari item tes tersebut yang sering dikenal dengan istilah difficulty index (=angka indek kesukaran item), yang dalam dunia evaluasi pembelajaran umumnya dilambangkan dengan huruf P, yaitu singkatan dari kata Proportion (proporsi=proporsa).

Angka indek kesukaran item tersebut besarnya berkisar amtara 0,00 sampai dengan 1,00. Yang berarti bahwa angka terrendah dari indek kesukaran item tes adalah 0,00 dan angka tertinggi dari indek kesukaran tes adalah 1,00. Jika angka indeks 0,00 (P = 0,00) berarti butir soal sangat sukar karena tidak seorangpun dapat menjawab dengan benar butir tes tersebut. Sebaliknya jika indeksnya 1,00 berarti butir soal tersebut sangat mudah karena semua siswa dapat menjawabnya dengan benar.

P :       0,0              0,1              0,2              0,3          0,4          0,5          0,6          0,7              0,8          0,9              1,0

Terlalu sukar                                                                                                              Terlalu mudah

Angka indek kesukaran tersebut dapat diperoleh dengan menggunakan rumus yang dikemukakan Dubois dalam Sudijono (2011: 371), yaitu:

P =

di mana:

P        = Proportion = proporsi = proporsa = difficulty index = angka indek kesukaran item.

N_{p          =}Banyaknya testee/peserta tes yang mampu menjawab dengan benar terhadap butir item yang bersangkutan.

N       =   Jumlah testee/peserta tes yang mengikuti hasil belajar.

Rumus lainnya adalah:

P =

di mana:

P        = Proportion = proporsi = proporsa = difficulty index = angka indek kesukaran item.

B       =   Banyaknya testee/peserta tes yang mampu menjawab dengan benar terhadap butir item yang bersangkutan.

JS      =   Jumlah testee/peserta tes yang mengikuti hasil belajar.

Ada beberapa pendapat tentang cara menginterpretasikan (menafsirkan) angka indek kesukaran item tes. Menurut Robert L. Thorndike dan Elizabeth Hagen (1961) mengemukakan pendapatnya sebagai berikut:

Besarnya P

Interpretasi

Kurang dari 0,30

Terlalu Sukar

0,30 - 0,70

Cukup (Sedang)

Lebih dari 0,70

Terlalu Mudah

Sedangkan menurut Witherington adalah sebagai berikut:

Besarnya P

Interpretasi

Kurang dari 0,25

Terlalu Sukar

0,25 - 0,75

Cukup (Sedang)

Lebih dari 0,75

Terlalu Mudah

Sebagai contoh, lihat tabel dibawah ini:

TABEL 2.1.   Penyebaran skor jawaban 10 orang testee terhadap 10 butir item yang diajukan dalam tes hasil belajar tahap akhir bidang studi Bahasa Inggris.

Testee

Skor yang dicapai oleh testee untuk setiap butir item nomor

1

2

3

4

5

6

7

8

9

10

A

0

1

1

0

1

0

1

1

1

0

B

1

0

1

1

1

1

0

0

1

1

C

1

0

0

0

0

0

1

1

1

0

D

0

0

1

1

1

0

1

0

1

1

E

1

0

1

0

1

1

1

0

1

0

F

0

0

1

1

0

0

1

1

1

1

G

1

0

1

0

0

0

0

0

0

1

H

0

0

1

1

0

0

1

0

1

1

I

1

0

1

0

1

0

1

0

1

1

J

1

1

1

1

1

1

1

0

1

1

10=

6=

2=

9=

5=

6=

3=

8=

3=

9=

7=

N=JS

N_P=B

N_P=B

N_P=B

N_P=B

N_P=B

N_P=B

N_P=B

N_P=B

N_P=B

N_P=B

Setiap butir item yang mampu dijawab dengan benar diberikan bobot 1 dan untuk setiap item soal yang dijawab salah diberikan bobot 0.Dari tabel tersebut, kita memperoleh data bahwa jumlah testee (N atau JS) adalah 10. Dari butir soal nomor satu diperoleh testee yang menjawab benar ada 6 orang sehingga dapat dihitung angka indek kesukarannya adalah 6/10 = 0,60. Dengan demikian dapat ditarik kesimpulan bahwa butir soal nomor 1 termasuk kriteria butir soal yang tingkat kesukarannya sedang.Untuk butir soal nomor 2 dan nomor 3 dengan N_p atau B masing-masing sebesar 2 dan 9 akan didapat angka indek kesukaran item untuk masing-masing adalah sebesar 2/10 = 0,20 (nomor 2) dan 9/10 = 0,90 (nomor 3). Diantara kedua pendapat yang telah disebutkan, pendapat yang pertama adalah yang lebih banyak digunakan, oleh karenanya, kita dapat menginterpretasikan bahwa soal nomor 2 termasuk kedalam kategori butir soal yang terlalu sulit; sedangkan butir soal nomor 3 termasuk ke dalam kategori butir soal yang terlalu mudah.

Untuk memperjelas dan mempermudahkan perhitungan keseluruhan angka indek kesukaran ataupun tingkat kesukaran butir tes untuk setiap nomornya, perhatikan tabel berikut ini:

Butir Soal Nomor

Angka Indek Kesukaran Item (P)

Interpretasi

1

P = 6/10 = 0,60

Cukup (Sedang)

2

P = 2/10 = 0,20

Terlalu Sukar

3

P = 9/10 = 0,90

Terlalu Mudah

4

P = 5/10 = 0,50

Cukup (Sedang)

5

P = 6/10 = 0,60

Cukup (Sedang)

6

P = 3/10 = 0,30

Cukup (Sedang)

7

P = 8/10 = 0,80

Terlalu Mudah

8

P = 3/10 = 0,30

Cukup (Sedang)

9

P = 9/10 = 0,90

Terlalu Mudah

10

P = 7/10 = 0,70

Cukup (Sedang)

Tabel 2.2.Perhitungan angka indek kesukaran item tes dan interpretasinya.

Dari tabel tersebut dapat diketahui bahwa butir soal yang tergolong baik; tingkat kesukarannya sedang adalah butir soal nomor 1,4,5,6,8 dan 10. Butir soal yang tergolong sulit adalah butir soal nomor 2. Sedangkan butir soal yang tergolong terlalu mudah adalah butir soal nomor 3,7 dan 9.

Setelah identifikasi tentang tingkat kesukaran butir soal tes telah dilakukan, perlu adanya penindaklanjutan terhadap soal-soal tersebut. Tindak lanjut tersebut diantaranya adalah:

Pertama, untuk butir soal yang telah memenuhi kategori yang baik (tingkat kesukarannya sedang atau cukup), hendaknya disimpan ke dalam bank soal agar tester dapat mempergunakanya kembali untuk waktu yang akan datang.

Kedua,untuk item soal yang tergolong terlalu sulit ada 3 kemungkinan tindak lanjut, yaitu:

1)       Dibuang atau didrop dan tidak akan digunakan lagi,

2)       Diperbaiki, diteliti ulang dan dicari tahu apa faktor penyebab dari sulitnya soal tersebut dijawab oleh testee,

3)       Disimpan dan digunakan untuk tujuan khusus, seperti tes penyeleksian siswa yang bersifat lebih ketat yang hanya sebagian kecil yang akan diterima.

Ketiga, untuk item soal yang tergolong terlalu mudah juga ada 3 kemungkinan tindak lanjut, ini hampir sama dengan tindak lanjut untuk butir-butir soal yang tergolong sulit, yaitu:

1)       Dibuang atau didrop dan tidak akan digunakan lagi,

2)       Diperbaiki, diteliti ulang dan dicari tahu apa faktor penyebab dari mudahnya soal tersebut untuk dijawab oleh testee,

3)       Disimpan dan digunakan untuk tujuan khusus, seperti tes penyeleksian siswa yang bersifat lebih longgar, yang sebagian besar yang akan diterima yang bisa dikatakan sebagai tes formalitas.

Cara yang lain yang dapat digunakan untuk mencari atau menghitung angka indek kesukaran item adalah dengan menggunakan skala kesukaran linear. Skala linear ini digunakan untuk mencari P bersih, karena sesungguhnya P yang kita hitung sebelumnya tidak memperhatikan atau memperhitungkan option atau alternative jawaban yang dipasang disetiap butir soal tes.

Skala kesukaran ini disusun dengan cara mentransformasikan nilai P menjadi nilai z yang ada di dalam tabel nilai z yang umumnya dilampirkan disetiap buku statistik. Dengan cara kedua ini ada beberapa langkah yang harus ditempuh.

Langkah pertama, Mengubah nilai P kotor (Pk) menjadi nilai P bersih (Pb) dengan menggunakan rumus:

P_b =

di mana:

P_b      = P bersih.

P_k      =   P kotor

a        =   Alternatif atau option yang disediakan di butir soal yang bersangkutan.

1        =   Bilangan konstan.

Contoh: Pk no. 7 = 0,80, jumlah option = 5 butir, maka:

P_b = = = 0,75

Untuk lebih menghemat waktu, untuk pengoreksian atau pengubahan P kotor menjadi P bersih kita bisa langsung melihat tabel nilai P bersih yang telah tersedia, termasuk dengan pilihan alternatif dari 2 sampai 5 butir.

Langkah kedua, Mentransformasikan nilai P bersih (Pb) menjadi nilai z dengan melihat tabel kurva normal yang telah tesedia. Sebagai contoh, kita ambil nilai P bersih dari butir nomor soal 7 yaitu 0,75. Kita cari angka 0,75 di tabel kurva normal, sehingga diperoleh sebagai berikut:

B

Larger Area

z

C

Smaller Area

0,750

0,6745

0,250

Dengan demikian nilai z untuk butir nomor 7 sebesar 0,6745. Dengan berpegang terhadap pendapat Thorndike dan Hagen maka butir soal nomor 7 tergolong butir soal yang memiliki tingkat kesukaran yang sedang (cukup).

Selain itu ada rumus lain yang bisa digunakan untuk mencari P bersih (Pb) dengan hasil yang sama, yaitu:

P_b =

B -

S

a - 1

B + S

di mana:

P_b      = P bersih.

B       =   Jumlah testee yang jawabannya benar.

S        =   Jumlah testee yang jawabannya salah

a        =   Alternatif atau option yang disediakan di butir soal yang bersangkutan.

Contoh: Butir soal nomor 7 yang menjawab benar ada 8 orang, dan yang menjawab salah 2 orang dengan jumlah option/alternative 5 butir, maka:

P_b =

8 -

2

5 - 1

8 + 2

P_b =

8 – 0,50

10

P_b=

7,50

=

0,75 (hasilnya sama)

10

Langkah ketiga, Mencari atau menghitung angka indek kesukaran item dengan menggunakan angka indek Davis yang sering disingkat dengan indeks Davis saja dan dilambangkan dengan huruf D dengan rumus:

D = 21,063 z + 50

Dengan menggunakan rumus ini kita dapat menghindari hasil perolehan nilai P bersih (P_b) yang negatif, perhatikan contoh berikut:

Diketahui: P kotor = 0,20, dengan jumlah alternative/option = 4, maka:

P_b = = = -0,667

Dalam indeks Davis tingkat kesukaran berkisar antara 0 sampai dengan 100, maka tidak mungkin akan menghasilkan tanda minus. Sebagai contohnya, misalkan sebutir item soal memiliki P bersih sebesar 0,755. Dengan berkonsultasi dengan tabel kurva normal diperoleh z sebesar 0,6905, maka:

D = 21,063 z + 50

     = (21,063) (0,6905) + 50

     = 64,5440015

     = 64,54 (dibulatkan 2 angka dibelakang koma/tanda desimal)

B.      Analisis Daya Pembeda Item

Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi (pandai) dengan testee yang berkemampuan rendah (tidak pandai) sehingga sebagian testee yang berkemampuan tinggi untuk menjawab butir item tersebut lebih banyak yang menjawab benar, sementara testee yang berkemempuan rendah untuk menjawab item tes terrsebut sebagian besar tidak dapat menjawab item soal dengan benar.

Dengan kata lain, bahwa analisis daya beda item adalahanalisis yang mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah. Salah satu ciri butir yang baik adalah yang mampu membedakan antara kelompok atas (yang mampu) dan kelompok bawah (kurang mampu).Ini dianggap sangat penting karena ada anggapan bahwa kemampuan setiap testee akan berbeda dengan testee yang lainnya.

Daya pembeda (discriminatory power) item itu dapat diketahui melalui atau dengan melihat besar kecilnya angka indeks diskriminasi item.Pada dasarnya, daya pembeda ini dihitung atas dasar pembagian testee ke dalam dua kelompok, yaitu kelompok atas (the higher group) – kelompok yang tergolong pandai – dankelompok bawah (the lower group) – kelompok yang tergolong kurang pandai. Ada beberapa cara untuk mengelompokkan testee, dapat menggunakan median, dapat juga menggunakan hanya 20% dari testee yang temasuk kelompok atas dan 20% yang termasuk kelompok bawah. Namun pada umumnya, para pakar di bidang evaluasi menggunakan persentase 27% dari testee yang termasuk kelompok atas dan 27% dari testee yang termasuk kelompok bawah karena dianggap cukup mampu diandalkan.

Indeks dikriminasi item umumnya diberi lambang D (singkatan ari Discriminatory Power) yang besarnya berkisar antara 0 sampai dengan 1,00. Akan tetapi indeks diskriminasi ini dapat bertanda minus (-). Jika sebutir item angka indeks diskriminasinya = 0,00, maka item tersebut tidak memiliki daya pembeda sama sekali. Jika indeks diiskriminasi itemnya bertanda negative (minus) maka butir item tersebut lebih banyak dijawab benar oleh testee dari kelompok bawah daripada testee kelompok atas atau testee yang sebenarnya termasuk dalam kelompok atas lebih banyak yang menjawab salah sedangkan testee yang termasuk kelompok bawah lebih banyak yang menjawab benar. Perhatikan bagan berikut ini:

D =                                                            D =                                                        D =

-1,00                                                         0,00                                                      +1,00

Daya pembeda item bersifat negative

Item yang bersangkutan tidak memiliki daya pembeda sama sekali

Daya pembeda item bersifat positif

Dalam hubungan ini pada umumnya besaran indeks diskriminasi yang dapat diinterpretasikan adalah sebagai berikut:

Basarnya Angka Indeks Diskriminasi Item (D)

Klasifikasi

Interpretasi

Kurang dari 0,20

Poor

Butir item yang bersangkutan daya pembedanya lemah sekali (jelek), dianggap tidak memiliki daya pembeda yang baik.

0,20 – 0,40

Satisfactory

Butir item yang bersangkutan telah memiliki daya pembeda yang cukup (sedang).

0,40 – 0,70

Good

Butir item yang bersangkutan telah memiliki daya pembeda yang baik.

0,70 – 1,00

Excellent

Butir item yang bersangkutan telah memiliki daya pembeda yang baik sekali.

Bertanda negatif

-

Butir item yang bersangkutan daya penbedanya negative (jelek sekali).

Untuk menghitung besar kecilnyaangka indeks diskriminasi item dapat dipergunakan dua rumus.

Rumus pertama:

D = P_A - p_B      atau          D = P_H – p_L

di mana:

D       = Discriminatory power (angka indeks diskriminasi item)

P_A atau P_H= Proporsi testee kelompok atas yang dapat menjawab dengan benar butir item yang bersangkutan.

                        (P_Hadalah singkatan dari Proportion of Higher Group)

                        P_A atau P_H dapat diperoleh dengan rumus:

                        P_A atau P_H =

                        dimana:

                   B_A   = Banyaknya testee kelompok atas yang dapat menjawab benar butir item yang bersangkutan.

                   J_A    =   Jumlah testee yang termasuk dalam kelompok atas.

p_B atau p_L=   Proporsi testee kelompok bawah yang dapat menjawab dengan benar butir item yang bersangkutan.

                        (p_L adalah singkatan dari Proportion of Lower Group).

                        p_B atau p_L dapat diperoleh dengan rumus:

                        p_B atau p_L =

                        dimana:

                   B_B   = Banyaknya testee kelompok bawah yang dapat menjawab benar butir item yang bersangkutan.

                        J_B    =   Jumlah testee yang termasuk dalam kelompok bawah.

Rumus kedua:

Indeks diskriminasi item pada rumus kedua ini didapatkan dengan menggunakan teknik korelasi Phi (Ø) dengan rumus sebagai berikut:

Ø =

di mana:

Ø       = Angka Indeks Korelasi Phi (Indeks Diskriminasi Item).

P_H=   Proportion of Higher Group.

P_L      =   Proportion of Lower Group.

2        =   Bilangan konstan.

p        =   Proporsi seluruh testee yang jawabannya Benar.

q        =   Proporsi seluruh testee yang jawabannya Salah, dimana q = (1 - p).

Contoh 1: Menggunakan rumus pertama (rumus D)

Misalkan 10 orang mengikuti tes hasil belajar bidang studi Matematika yang berbentuk pilihan ganda.Ada 10 butir item soal dalam tes tersebut dengan catatn yang menjawab benar diberi bobot 1 dan yang menjawab salah 0, sebagaimana tertera pada Tabel 2.3.

Ada beberapa langkah yang harus dilakukan untuk mencari besarnya angka indeks diskriminasi item (D), yaitu:

Langkah pertama:Mengelompokkan (membagi) testee menjadi 2 kelompok, yaitu kelompok atas (yang mendapatkan skor yang tinggi) dan kelompok bawah (yang mendapatkan skor rendah).

Tabel 2.3.Distribusi skor hasil tes Matematika

Testee

Skor yang dicapai oleh testee untuk setiap butir item nomor

Total

1

2

3

4

5

6

7

8

9

10

A

0

(1)

(1)

0

(1)

0

(1)

(1)

(1)

(1)

7

B

(1)

0

(1)

(1)

(1)

(1)

0

0

(1)

(1)

7

C

1

0

0

0

0

0

1

1

1

0

4

D

(1)

0

(1)

(1)

(1)

0

(1)

(1)

(1)

(1)

8

E

(1)

0

(1)

0

(1)

(1)

(1)

0

(1)

(1)

7

F

0

0

1

1

0

0

1

1

1

0

5

G

1

0

1

0

0

0

0

0

0

1

3

H

0

0

1

1

0

0

1

0

1

0

4

I

1

0

1

0

1

0

1

0

1

1

6

J

(1)

(1)

(1)

(1)

(1)

(1)

(1)

0

(1)

(1)

9

N=10

7

2

9

5

6

3

8

4

9

7

60

Kelompok Atas

Kelompok Bawah

Testee

Skor

Testee

Skor

J

9

I

6

D

8

F

5

A

7

C

4

B

7

H

4

E

7

G

3

J_A = 5

-

J_B = 5

-

Langkah kedua:menuliskan atau memberikan tanda atau kode terhadap hasil pengelompokan testee atas dua kategori tersebut. (Menggunakan tanda kurung bagi jawaban yang benar untuk kelompok atas).

Langkah ketiga:Mencari (menghitung) B_A, B_B, P_A, P_Bdan D. (Lihat Tabel 2.4)

Tabel 2.4.Hasil perhitungan B_A, B_B, P_A, P_Bdan D

Nomor Butir Item

B_A

B_B

J_A

J_B

P_A

P_B

D=P_A-P_B

1

4

3

5

5

0,80

0,60

0,20

2

2

0

5

5

0,40

0,00

0,40

3

5

4

5

5

1,00

0,80

0,20

4

3

2

5

5

0,60

0,40

0,20

5

5

1

5

5

1,00

0,20

0,80

6

3

0

5

5

0,60

0,00

0,60

7

4

4

5

5

0,80

0,80

0,00

8

2

2

5

5

0,40

0,40

0,00

9

5

4

5

5

1,00

0,80

0,20

10

5

2

5

5

1,00

0,40

0,60

Langkah keempat: Memberikan interpretasi mengenai kualitas daya pembeda item yang dimiliki oleh 10 item soal tes hasil belajar seperti yang terlihat pada Tabel 2.5

Tabel 2.5.Pemberian Interpretasi terhadap D

Nomor Butir Item

Besarnya D

Klasifikasi

Interpretasi

5

0,80

Excellent

Daya pembeda itemnya sangat baik sekali.

6 dan 10

0,60

Good

Daya pembeda itemnya baik.

2

0,40

Satisfactory

Daya pembeda itemnya cukup (sedang).

1, 3, 4 dan 9

0,20

Poor

Daya pembeda itemnya lemah sekali.

7 dan 8

0,00

Poor

Tidak memiliki daya pembeda sama sekali.

Dengan demikian, jelas terlihat bahwa 4 dari 10 item soal diatas sudah termasuk memiliki daya pembeda yang memadai dan sisanya, yaitu 6 masih tergolong kelompok item soal yang tidak/belum memiliki daya pembeda yang diharapkan.

Contoh 2: Menggunakan rumus yang kedua

Karena pada hakikatnya P_A = P_H dan P_B= P_L maka kita hanya perlu mengganti simbolnya saja. Setelah itu kita cari nilai p (proporsi testee yang jawabannya benar) dan q (proporsi testee yang jawabannya salah).Setelah selesai didapatkan, nilai P_H,P_L, p dan q kita substitusikan kedalam rumus korelasi Phi. Hasilnya adalah sebagai berikut:

Tabel 2.6.Perhitungan besarnya korelasi koefisien Phi (Ø)

Butir Item Nomor

P_H

P_L

p

q

Ø =

Ø

Ø

Klasifikasi

1

0,80

0,60

0,7

0,3

0,22

Satisfactory

2

0,40

0,00

0,2

0,8

0,50

Good

3

1,00

0,80

0,9

0,1

0,33

Satisfactory

4

0,60

0,40

0,5

0,5

0,40

Good

5

1,00

0,20

0,6

0,4

0,81

Excellent

6

0,60

0,00

0,3

0,7

0,65

Good

7

0,80

0,80

0,8

0,2

0,00

Poor

8

0,40

0,40

0,4

0,6

0.00

Poor

9

1,00

0,80

0,9

0,1

0,33

Satisfactory

10

1,00

0,40

0,7

0,3

0,65

Good

Dengan menggunakan teknik/rumus korelasi Phi ternyata angka indeks diskriminasi itemnya (Ø) sedikit berbeda besarnya dengan angka indeks diskriminasi item yang dihitung dengan menggunakan rumus pertama (rumus D).Hal ini memang dapat dipahami, sebab menurut para ahli di bidang evaluasi pendidikan angka indeks diskriminasi item yang diperoleh dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.

p_B atau p_L=   Proporsi testee kelompok bawah yang dapat menjawab dengan benar butir item yang bersangkutan.

                        (p_L adalah singkatan dari Proportion of Lower Group).

                        p_B atau p_L dapat diperoleh dengan rumus:

                        p_B atau p_L =

                        dimana:

                   B_B   = Banyaknya testee kelompok bawah yang dapat menjawab benar butir item yang bersangkutan.

                        J_B    =   Jumlah testee yang termasuk dalam kelompok bawah.

Rumus kedua:

Indeks diskriminasi item pada rumus kedua ini didapatkan dengan menggunakan teknik korelasi Phi (Ø) dengan rumus sebagai berikut:

Ø =

di mana:

Ø       = Angka Indeks Korelasi Phi (Indeks Diskriminasi Item).

P_H=   Proportion of Higher Group.

P_L      =   Proportion of Lower Group.

2        =   Bilangan konstan.

p        =   Proporsi seluruh testee yang jawabannya Benar.

q        =   Proporsi seluruh testee yang jawabannya Salah, dimana q = (1 - p).

Contoh 1: Menggunakan rumus pertama (rumus D)

Misalkan 10 orang mengikuti tes hasil belajar bidang studi Matematika yang berbentuk pilihan ganda. Ada 10 butir item soal dalam tes tersebut dengan catatan yang menjawab benar diberi bobot 1 dan yang menjawab salah 0, sebagaimana tertera pada Tabel 2.3.

Ada beberapa langkah yang harus dilakukan untuk mencari besarnya angka indeks diskriminasi item (D), yaitu:

Langkah pertama: Mengelompokkan (membagi) testee menjadi 2 kelompok, yaitu kelompok atas (yang mendapatkan skor yang tinggi) dan kelompok bawah (yang mendapatkan skor rendah).

Tabel 2.3. Distribusi skor hasil tes Matematika

Testee

Skor yang dicapai oleh testee untuk setiap butir item nomor

Total

1

2

3

4

5

6

7

8

9

10

A

0

(1)

(1)

0

(1)

0

(1)

(1)

(1)

(1)

7

B

(1)

0

(1)

(1)

(1)

(1)

0

0

(1)

(1)

7

C

1

0

0

0

0

0

1

1

1

0

4

D

(1)

0

(1)

(1)

(1)

0

(1)

(1)

(1)

(1)

8

E

(1)

0

(1)

0

(1)

(1)

(1)

0

(1)

(1)

7

F

0

0

1

1

0

0

1

1

1

0

5

G

1

0

1

0

0

0

0

0

0

1

3

H

0

0

1

1

0

0

1

0

1

0

4

I

1

0

1

0

1

0

1

0

1

1

6

J

(1)

(1)

(1)

(1)

(1)

(1)

(1)

0

(1)

(1)

9

N=10

7

2

9

5

6

3

8

4

9

7

60

Kelompok Atas

Kelompok Bawah

Testee

Skor

Testee

Skor

J

9

I

6

D

8

F

5

A

7

C

4

B

7

H

4

E

7

G

3

J_A = 5

-

J_B = 5

-

Langkah kedua: menuliskan atau memberikan tanda atau kode terhadap hasil pengelompokan testee atas dua kategori tersebut. (Menggunakan tanda kurung bagi jawaban yang benar untuk kelompok atas).

Langkah ketiga: Mencari (menghitung) B_A, B_B, P_A, P_Bdan D. (Lihat Tabel 2.4)

Tabel 2.4. Hasil perhitungan B_A, B_B, P_A, P_Bdan D

Nomor Butir Item

B_A

B_B

J_A

J_B

P_A

P_B

D=P_A-P_B

1

4

3

5

5

0,80

0,60

0,20

2

2

0

5

5

0,40

0,00

0,40

3

5

4

5

5

1,00

0,80

0,20

4

3

2

5

5

0,60

0,40

0,20

5

5

1

5

5

1,00

0,20

0,80

6

3

0

5

5

0,60

0,00

0,60

7

4

4

5

5

0,80

0,80

0,00

8

2

2

5

5

0,40

0,40

0,00

9

5

4

5

5

1,00

0,80

0,20

10

5

2

5

5

1,00

0,40

0,60

Langkah keempat: Memberikan interpretasi mengenai kualitas daya pembeda item yang dimiliki oleh 10 item soal tes hasil belajar seperti yang terlihat pada Tabel 2.5

Tabel 2.5. Pemberian Interpretasi terhadap D

Nomor Butir Item

Besarnya D

Klasifikasi

Interpretasi

5

0,80

Excellent

Daya pembeda itemnya sangat baik sekali.

6 dan 10

0,60

Good

Daya pembeda itemnya baik.

2

0,40

Satisfactory

Daya pembeda itemnya cukup (sedang).

1, 3, 4 dan 9

0,20

Poor

Daya pembeda itemnya lemah sekali.

7 dan 8

0,00

Poor

Tidak memiliki daya pembeda sama sekali.

Dengan demikian, jelas terlihat bahwa 4 dari 10 item soal diatas sudah termasuk memiliki daya pembeda yang memadai dan sisanya, yaitu 6 masih tergolong kelompok item soal yang tidak/belum memiliki daya pembeda yang diharapkan.

Contoh 2: Menggunakan rumus yang kedua

Karena pada hakikatnya P_A = P_H dan P_B= P_L maka kita hanya perlu mengganti simbolnya saja. Setelah itu kita cari nilai p (proporsi testee yang jawabannya benar) dan q (proporsi testee yang jawabannya salah). Setelah selesai didapatkan, nilai P_H,P_L, p dan q kita substitusikan kedalam rumus korelasi Phi. Hasilnya adalah sebagai berikut:

Tabel 2.6. Perhitungan besarnya korelasi koefisien Phi (Ø)

Butir Item Nomor

P_H

P_L

p

q

Ø =

Ø

Ø

Klasifikasi

1

0,80

0,60

0,7

0,3

0,22

Satisfactory

2

0,40

0,00

0,2

0,8

0,50

Good

3

1,00

0,80

0,9

0,1

0,33

Satisfactory

4

0,60

0,40

0,5

0,5

0,40

Good

5

1,00

0,20

0,6

0,4

0,81

Excellent

6

0,60

0,00

0,3

0,7

0,65

Good

7

0,80

0,80

0,8

0,2

0,00

Poor

8

0,40

0,40

0,4

0,6

0.00

Poor

9

1,00

0,80

0,9

0,1

0,33

Satisfactory

10

1,00

0,40

0,7

0,3

0,65

Good

Dengan menggunakan teknik/rumus korelasi Phi ternyata angka indeks diskriminasi itemnya (Ø) sedikit berbeda besarnya dengan angka indeks diskriminasi item yang dihitung dengan menggunakan rumus pertama (rumus D). Hal ini memang dapat dipahami, sebab menurut para ahli di bidang evaluasi pendidikan angka indeks diskriminasi item yang diperoleh dengan menggunakan teknik korelasi Phi itu sifatnya lebih teliti.

BAB III

PENUTUP

A.      Kesimpulan

Evaluasi hasil belajar siswa merupakan salah satu kegiatan yang merupakan kewajiban bagi setiap guru.Penganalisisan terhadap butir soal tes hasil belajar dilakukan guna memperoleh dan mengetahui apakah item tes sudah mampu menjalankan fungsinya sebagai alat ukur hasil belajar.

Penganalisisan terhadap butir soal tes hasil belajar dapat dilakukan dengan beberapa cara, yaitu: dengan analisis tingkat kesukaran butir soal tesnya, dan dengan menganalisis daya pembeda butir soalnya.Analisis tingkat kesukaran butir item tes dimaksudkan untuk mengetahui seberapa mudah dan seberapa sulit tingkat kesukaran sebuah item soal tes bagi testee atau siswa yang terkait.

Analisis daya beda butir item tes dimaksudkan untuk mengungkapkan seberapa besar butir tes dapat membedakan antara siswa kelompok tinggi dengan siswa kelompok rendah.Salah satu ciri butir yang baik adalah yang mampu membedakan antara kelompok atas (yang mampu) dan kelompok bawah (kurang mampu).

B.      Saran

Tidak sedikit dari para staf pengajar yang hanya membuat soal tes, lalu memberikannya, setelah itu maka selesailah proses evaluasi belajar. Mereka cenderung tidak memperhatikan bagaimana setiap butir soal tes mampu menjalankan tugasnya sebagai alat ukur kemampuan testee.

Dalam proses evaluasi hasil belajar, hendaknya kita memperhatikan setiap butir soal yang akan diberikan dalam rangka mengukur kemampuan seorang testee atau seorang siswa. Soal yang akan diberikan harus mampu menjalankan tugasnya sebagai alat ukur atas sejauh mana seorang testee atau siswa menguasai atau memehami hasil pembelajarannya.

Oleh karena itu, analisis terhadap tingkat kesukaran setiap item tes dan daya pembeda item perlu dilakukan untuk menunjang fungsi dan tujuan pemberian tes hasil belajar tadi yang telah disebutkan agar mendapatkan tes hasil belajar yang berkualitas.

DAFTAR PUSTAKA

Masmud. (2009). Tingkat Kesukaran dan Daya Beda, tersedia dalam http://masmud09.blogspot.com/, diunduh pada tanggal 10 April 2012.

Purwanto, M. Ngalim. (2010). Prinsip-Prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya.

Sudijono, Anas. (2011). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Pers.

Sumanto. (2009). Analisis Butir Soal, tersedia dalam http://sumantomantos.files.wordpress.com/,diunduh pada tanggal 10 April 2012.

Thorndike, Robert L. and Elizabeth Hagen. (1961). Measurement and Evaluation in Psychology and Education. New York: John Willey and Sons Inc.

Witherington. (1967). Psychological Education(Terjemahan M. Buchori, M.ED.) Bandung:Keluarga Bapemsi.

*Slide presentasi kelompok 9 dapat dilihat di:

http://www.4shared.com/file/H9lq4L-i/TKI__Daya_Beda.html

.

Evaluasi Pembelajaran (PBI-A 6th Semester)

Selasa, 15 Mei 2012

Kelompok 9- TINGKAT KESUKARAN ITEM TES DAN DAYA PEMBEDA SEBUAH ITEM TES

1 komentar:

Followers

WHAT TIME IS IT?

Besarnya P	Interpretasi
Kurang dari 0,30	Terlalu Sukar
0,30 - 0,70	Cukup (Sedang)
Lebih dari 0,70	Terlalu Mudah

Besarnya P	Interpretasi
Kurang dari 0,25	Terlalu Sukar
0,25 - 0,75	Cukup (Sedang)
Lebih dari 0,75	Terlalu Mudah

Testee	Skor yang dicapai oleh testee untuk setiap butir item nomor
Testee	1	2	3	4	5	6	7	8	9	10
A	0	1	1	0	1	0	1	1	1	0
B	1	0	1	1	1	1	0	0	1	1
C	1	0	0	0	0	0	1	1	1	0
D	0	0	1	1	1	0	1	0	1	1
E	1	0	1	0	1	1	1	0	1	0
F	0	0	1	1	0	0	1	1	1	1
G	1	0	1	0	0	0	0	0	0	1
H	0	0	1	1	0	0	1	0	1	1
I	1	0	1	0	1	0	1	0	1	1
J	1	1	1	1	1	1	1	0	1	1
10=	6=	2=	9=	5=	6=	3=	8=	3=	9=	7=
N=JS	N_P=B	N_P=B	N_P=B	N_P=B	N_P=B	N_P=B	N_P=B	N_P=B	N_P=B	N_P=B

Butir Soal Nomor	Angka Indek Kesukaran Item (P)	Interpretasi
1	P = 6/10 = 0,60	Cukup (Sedang)
2	P = 2/10 = 0,20	Terlalu Sukar
3	P = 9/10 = 0,90	Terlalu Mudah
4	P = 5/10 = 0,50	Cukup (Sedang)
5	P = 6/10 = 0,60	Cukup (Sedang)
6	P = 3/10 = 0,30	Cukup (Sedang)
7	P = 8/10 = 0,80	Terlalu Mudah
8	P = 3/10 = 0,30	Cukup (Sedang)
9	P = 9/10 = 0,90	Terlalu Mudah
10	P = 7/10 = 0,70	Cukup (Sedang)

Basarnya Angka Indeks Diskriminasi Item (D)	Klasifikasi	Interpretasi
Kurang dari 0,20	Poor	Butir item yang bersangkutan daya pembedanya lemah sekali (jelek), dianggap tidak memiliki daya pembeda yang baik.
0,20 – 0,40	Satisfactory	Butir item yang bersangkutan telah memiliki daya pembeda yang cukup (sedang).
0,40 – 0,70	Good	Butir item yang bersangkutan telah memiliki daya pembeda yang baik.
0,70 – 1,00	Excellent	Butir item yang bersangkutan telah memiliki daya pembeda yang baik sekali.
Bertanda negatif	-	Butir item yang bersangkutan daya penbedanya negative (jelek sekali).

Testee	Skor yang dicapai oleh testee untuk setiap butir item nomor										Total
Testee	1	2	3	4	5	6	7	8	9	10	Total
A	0	(1)	(1)	0	(1)	0	(1)	(1)	(1)	(1)	7
B	(1)	0	(1)	(1)	(1)	(1)	0	0	(1)	(1)	7
C	1	0	0	0	0	0	1	1	1	0	4
D	(1)	0	(1)	(1)	(1)	0	(1)	(1)	(1)	(1)	8
E	(1)	0	(1)	0	(1)	(1)	(1)	0	(1)	(1)	7
F	0	0	1	1	0	0	1	1	1	0	5
G	1	0	1	0	0	0	0	0	0	1	3
H	0	0	1	1	0	0	1	0	1	0	4
I	1	0	1	0	1	0	1	0	1	1	6
J	(1)	(1)	(1)	(1)	(1)	(1)	(1)	0	(1)	(1)	9
N=10	7	2	9	5	6	3	8	4	9	7	60

Kelompok Atas		Kelompok Bawah
Testee	Skor	Testee	Skor
J	9	I	6
D	8	F	5
A	7	C	4
B	7	H	4
E	7	G	3
J_A = 5	-	J_B = 5	-

Nomor Butir Item	B_A	B_B	J_A	J_B	P_A	P_B	D=P_A-P_B
1	4	3	5	5	0,80	0,60	0,20
2	2	0	5	5	0,40	0,00	0,40
3	5	4	5	5	1,00	0,80	0,20
4	3	2	5	5	0,60	0,40	0,20
5	5	1	5	5	1,00	0,20	0,80
6	3	0	5	5	0,60	0,00	0,60
7	4	4	5	5	0,80	0,80	0,00
8	2	2	5	5	0,40	0,40	0,00
9	5	4	5	5	1,00	0,80	0,20
10	5	2	5	5	1,00	0,40	0,60

Nomor Butir Item	Besarnya D	Klasifikasi	Interpretasi
5	0,80	Excellent	Daya pembeda itemnya sangat baik sekali.
6 dan 10	0,60	Good	Daya pembeda itemnya baik.
2	0,40	Satisfactory	Daya pembeda itemnya cukup (sedang).
1, 3, 4 dan 9	0,20	Poor	Daya pembeda itemnya lemah sekali.
7 dan 8	0,00	Poor	Tidak memiliki daya pembeda sama sekali.

Butir Item Nomor	P_H	P_L	p	q	Ø =	Ø	Ø	Klasifikasi
1	0,80	0,60	0,7	0,3			0,22	Satisfactory
2	0,40	0,00	0,2	0,8			0,50	Good
3	1,00	0,80	0,9	0,1			0,33	Satisfactory
4	0,60	0,40	0,5	0,5			0,40	Good
5	1,00	0,20	0,6	0,4			0,81	Excellent
6	0,60	0,00	0,3	0,7			0,65	Good
7	0,80	0,80	0,8	0,2			0,00	Poor
8	0,40	0,40	0,4	0,6			0.00	Poor
9	1,00	0,80	0,9	0,1			0,33	Satisfactory
10	1,00	0,40	0,7	0,3			0,65	Good