VALIDITAS TES,
REALIBILITAS TES, TES STANDAR
dan TES BUATAN GURU
Makalah
Dipresentasikan pada 24
April 2012 di jurusan Bahasa Inggris semester 6
Dalam rangka melengkapi perkuliahan
Evaluasi pembelajaran
Dosen : Drs. Naeila
Rifatil Muna, s.psi. M. pd
Disusun oleh :
Kasudin ( 59430504 )
Nunung nurul inayah ( 59430513
)
INSTITUT AGAMA
ISLAM NEGERI ( IAIN )
SYEKH NURJATI CIREBON
Jalan Perjuangan By Pass Sunyaragi Cirrebon
2012
BAB I
PENDAHULUAN
A.
Latar Belakang
Tes kemampuan pada dasarnya terbagi
menjadi dua macam, yaitu :
1. Aptitude test
2. Achievement tes
Perbedaan antara dua tes ini
sebenearnya tidak tegas, soal – soal mengenai kedua tes tersebut sering kali
saling melingkupi ( overlap ). Untuk kedua macam tes ini biasanya menggunakan
hitung – hitungan dan perbendaharaan kata – kata dan sekelompok tes dari kedua
macam tes ini biasanya juga menguji tentang keterampilan membaca. Kesamaan yang
lain adalah bahwa keduanya telah digunakan untuk meramalkan hasil untuk yang
masa akan dating, walaupun pada umumnya jika kita menggunakan tes prestasi
penilai melihat apa yang telah diperoleh setelah siswa ( tercoba ) itu diberi
suatu pelajaran.
Tes adalah salah
satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan siswa
dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada
yang dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes
yang sudah memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan
yang kemudian disebut tes terstandar.
Dalam menilai,
baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu
diperhatikan yang berkaitan dengan analisis hasil tes tersebut. Dalam makalah
ini akan diuraikan tentang banyak hal yang berkaitan dengan tes standar dan tes
buatan guru. Serta dijelaskan juga tentang analisis hasil tes.
Reliabilitas berhubungan dengan maslah
kepercayaan. Suatu tes dapat mempunyai
taraf kepercayaan tinggi jika tes tersebut dapat memberika hasil yang
tetap. Maka pengertian realibilitas tes,
berhubungan dengan masalah ketetapan hasil tes. Atau hasilnya berubah – ubah, perubahan yang terjadi dapat dikatakan tidak
berarti.
Konsep tentang realibilitas ini tidak
akan sulit dipahamai apabila pembaca memahami konsep validitas. Tuntutan bahawa
ninstrumen evaluasi harus valid menyangkut harapan diperolehnya data yang
valid, sesuai dengan kenyataan. Dalam hal reliebilitas ini tuntutannya tidak
jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain
adalah tidak menyimpangnya data dari kenyataan. Artinya, bahwa data tersebut
benar, maka konsep reliabilitas terkait dengan pemotretan berkali – kali.
Instrument yang baik dalah instrument yang dapat dengan konsisten memberikan
data yang sesuai dengan kenyataan.
B.
Pembatasan
dan perumusan masalah
1. Pembatasan masalah
Dari latar belakang yang telah dipaparkan, pembahasan yang ada
dalam makalah ini dibatasi pada:
a. Pengertian validitas, realibilitas, soal
standard dan soal buatan guru.
b. Macam – macam validitas dan Cara mengetahui
validitas alat ukur
c. Arti realibilitas bagi sebuah tes serta
menentukan besaran koefisiennya.
d. Kelengkapan dan Kegunaan
Tes Standar dan tes buatan guru.
e. Perbandingan
antara tes standar dengan tes nonstandard.
2. Perumusan masalah
Dalam
makalah ini masalah yang akan
dirumuskan yaitu
a. Apa Pengertian validitas, realibilitas, soal
standard dan soal buatan guru?
b. Apa saja Macam – macam validitas dan bagaimana
cara mengetahui validitas alat ukur?
c. Apa Arti realibilitas bagi sebuah tes dan
bagaimana menentukan besaran koefisiennya?
d. Seperti apa Kelengkapan dan Kegunaan Tes Standar dan tes buatan guru?
e. Apa
Perbandingan antara tes standar dengan tes nonstandard?
C.
Tujuan
Pembuatan Makalah
Sesuai masalah yang dirumuskan, tujuan dari
pembuatan makalah ini adalah sebagai berikut :
a. Untuk
mengetahui pengertian validitas, realibilitas, soal standard dan soal buatan
guru.
b. Untuk mengetahui macam – macam validitas dan
Cara mengetahui validitas alat ukur
c. Untuk mengetahui arti realibilitas bagi sebuah
tes serta menentukan besaran koefisiennya.
d. Untuk mengetahui kelengkapan dan Kegunaan Tes Standar dan tes buatan guru.
e. Untuk mengetahui Perbandingan antara tes standar dengan tes
nonstandard.
BAB
II
VALIDITAS DAN RELIABILITAS
A. VALIDITAS
1.Pengertian validitas
Dalam kehidupan sehari-hari, manusia
senantiasa dihadapkan pada masalah keakuratan sebuah informasi. Informasi yang
diterima manusia setiap hari sangat banyak dengan sumber yang semakin beragam.
Koran dan televisi adalah dua sumber informasi utama saat ini. Dengan semakin
banyaknya sumber-sumber informasi yang senantiasa berkembang, maka muncul
sebuah pertanyaan mendasar tentang sejauhmana informasi yang diperoleh tersebut
dapat dipercaya?
Dalam penelitian-penelitian sosial, keakuratan
informasi yang diperoleh sangat mempengaruhi keputusan yang akan diambil.
Sayangnya, akurasi informasi dalam penelitian-penelitian sosial tersebut tidak
mudah diperoleh disebabkan sulitnya mendapatkan operasionalisasi konsep
mengenai variabel yang hendak diukur. Untuk mengungkap aspek-aspek yang hendak
diteliti, maka diperlukan alat ukur yang baik dan berkualitas. Alat ukur
tersebut dapat berupa skala atau tes. Sebuah tes yang baik sebagaimana
disampaikan oleh Syaifuddin Azwar (2006 : 2) harus memiliki beberapa kriteria
antara lain valid, reliable, standar, ekonomis dan praktis.
Menurut Azwar (1986) validitas berasal dari
kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Menurut Arikunto
(1999) validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu
tes. Menurut Nursalam (2003) validitas adalah suatu ukuran yang menunjukkan
tingkat kevalidan atau kesahihan suatu instrumen.
Dalam Standards for Educational and
Psychological Testing validitas adalah "... the degree to which evidence
and theory support the interpretation of test scores entailed by proposed uses
of tests " (1999: 9). Sebuah tes dikatakan valid jika ia memang mengukur
apa yang seharusnya diukur (Allen & Yen, 1979: 95). Dalam bahasa yang hampir
sama Djemari Mardapi (2004: 25) menyatakan bahwa validitas adalah ukuran
seberapa cermat suatu tes melakukan fungsi ukurnya. Menurut Nitko &
Brookhart (2007: 38) kevalidan sebuah alat ukur tergantung pada bagaimana hasil
tes tersebut diinterpretasikan dan digunakan. Dalam pandangan Samuel Messick
(1989: 13) validitas merupakan penilaian menyeluruh dimana bukti empiris dan
logika teori mendukung pengambilan keputusan serta tindakan berdasarkan skor
tes atau model-model penilaian yang lain
Berdasarkan beberapa pendapat tentang
pengertian validitas di atas, maka dapat diambil kesimpulan bahwa validitas
adalah suatu standar ukuran yang menunjukkan ketepatan dan kesahihan suatu
instrumen.
Menurut
Arikunto (1999) suatu tes dikatakan valid apabila tes tersebut mengukur apa
yang hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai
dengan kriteria, dalam arti memiliki kesejajaran antara tes dan kriteria.
Sisi
lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu
alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi
juga harus memberikan gambaran yang cermat mengenai data tersebut.
Cermat
berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang
sekecil- kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh,
dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat
sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar
hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan
memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat
cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak
akan terlihat pada alat ukur berat badan.
Demikian
pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari
satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan
karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan
yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu
yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter
dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan
satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.
Menggunakan
alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi
tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan
kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang
kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang
sebenarnya atau angka yang mendekati keadaan sebenarnya.
Jika dikaitkan dengan bidang psikologi,
penggunaan validitas dapat dijumpai dalam tiga konteks yaitu validitas
penelitian, validitas soal dan validitas alat ukur. Validitas penelitian
merupakan derajad kesesuaian hasil penelitian dengan keadaan sebenarnya.
Validitas soal berkaitan dengan kesesuaian antara suatu soal dengan soal lain.
Sedangkan validitas alat ukur merujuk pada kecermatan ukurnya suatu tes (Sumadi
Suryabrata, 2004: 40).
Menurut
Allen & Yen (1979: 95) validitas tes dapat dibagi kedalam tiga kelompok
utama yaitu : (1) validitas isi (content validity), (2) validitas konstruk
(construct validity) dan (3) validitas kriteria (criterion related validity).
Meskipun idealnya validasi dapat dilakukan dengan memakai semua bentuk
validitas tes tersebut, tetapi pengembang tes dapat memilih bentuk validasi
dengan melihat tujuan pengembangan tes (Kumaidi, 1994: 58). Suatu tes dikatakan valid jika tes tersebut dapat mengukur
apa yang hendak diukur.
2. Macam-macam validitas
Secara garis besar, ada dua macam validitas, yaitu validitas
logis dan validitas empisris ( kriteria ).
a. Validitas Logis: validitas
instrumen berdasarkan logika (hasil penalaan).
Validitas logis adalah validitas yang
diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir
secara logis. Sebuah instrumen dikatakan memiliki
validitas logis jika instrument tersebut sudah dirancang secara baik, mengikuti
teori dan ketentuan yang ada. validitas logis menunjukkan sejauhmana isi
tes mengungkapkan representasi dari ciri-ciri atribut yang hendak diukur Validitas logis 2 yaitu:
1)
Validitas
Isi (Content Validity)
Validitas isi dari suatu tes hasil
belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan,
penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil
belajar tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu
sendiri sebagai alat pengukur hasil belajar yaitu: sejauh mana tes hasil
belajar sebagai alat pengukur hasil belajar peserta didik, isisnya telah dapat
mewakili secara representatif terhadap keseluruhan materi atau bahkan pelajaran
yang seharusnya diteskan (diujikan).
Validitas isi menunjuk pada sejauhmana
isi perangkat soal tersebut mengukur apa yang seharusnya diukur. Dalam
kaitannya dengan kegiatan pembelajaran menurut Djemari Mardapi (1996: 22)
validitas ini adalah kesesuaian antara materi ujian dan materi yang telah
dipelajari. Pengujian validitas isi tidak melalui analisis statistik melainkan
analisis rasional yaitu dengan melihat apakah butir-butirnya telah sesuai
dengan batasan domain ukur yang telah ditetapkan sebelumnya.
Allen & Yen (1979: 95) membagi
validitas isi kedalam dua kelompok yaitu face validity (validitas muka) dan
logical validity (validitas logis). Validitas muka dapat dicapai jika tampilan
tes tersebut telah meyakinkan untuk mengungkap atribut yang hendak diukur. Sebuah tes dikatakan memiliki validitas isi jika butir tes
yang diujikan mencerminkan isi kurikulum yang seharusnya diukur.
2) Validitas Konstruksi (Construct
Validity)
Validitas
konstruksi dapat diartikan sebagai validitas yang ditilik dari segi susunan,
kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar
dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi, apabila
tes hasil belajar tersebut telalh dapat dengan secara tepat mencerminkan suatu
konstruksi dalam teori psikologis.
Validitas
konstruk merujuk pada sejauhmana suatu tes mengukur suatu konstruk teoretik
atau trait yang hendak diukurnya (Allen & Yen, 1979: 108) konstruk dalam
pengertian ini adalah berkaitan dengan aspek-aspek psikologi seseorang
khususnya aspek kognitif, afektif dan psikomotor.
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir
soal yang membangun tes tersebut mengukur setiap asfek berfikir seperti yang
disebutkan dalam tujuan instruksional khusus atau indikator pencapaian
kopetensi.
Ada
beberapa cara yang bisa digunakan untuk menguji validitas konstruk. Misalnya
dengan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam
tes hasil belajar dengan aspek-aspek berpikir yang hendak diungkap oleh tujuan
instruksional khusus. Pengujian yang lebih sederhana tentang validitas konstruk
adalah malalui pendekatan multi trait multi-method (Saifuddin Azwar 2003: 176).
Pendekatan ini akan menghasilkan bukti validitas diskriminan yang ditunjukkan
dengan rendahnya korelasi antar skor yang mengukur trait yang berbeda bila
digunakan metode yang sama dan validitas konvergen yang ditunjukkan oleh
tingginya korelasi skor-skor tes yang mengukur trait yang sama dengan
menggunakan metode yang berbeda.
Contoh
mengenai estimasi koefisien validitas berdasarkan metode multitrait multimethod
adalah sebagaimana disampaikan Fred N. Kerlinger (1973:742) tentang matriks
hubungan antara sikap sosial. Ada dua instrument berbeda yang digunakan untuk
mengukur liberalisme (L) dan konservatisme (C) dalam hubungannya dengan sikap
sosial seseorang yaitu dengan pernyataan sikap biasa (metode 1) dan referen
(metode 2) menggunakan referensi-referensi sikap seperti sepatah kata atau
frase singkat. Korelasi antara kedua instrument tersebut disajikan dalam bentuk
matriks multitrait-multimethod berikut :

Dalam
contoh tersebut secara teoritis dituntut adanya korelasi negative atau
mendekati nol antara L dan C. korelasi antara L1 dengan C1 adalah -0,07 serta
antara L2 dengan C2 adalah -0,09 yang berarti bahwa keduanya hampir selaras
dengan teorinya. Korelasi silang antara L dan C yakni korelasi antara L pada
metode 1 dan C pada metode 2 atau antara L1 dan C2 adalah -0,37 dan ini lebih
tinggi daripada yang diprediksikan oleh teorinya (-0,30). Maka, dengan
perkecualian korelasi silang yang besarnya -0,37 antara L1 dan C2 validitas
konstruk dalam skala sikap itu terdukung.
b. Validitas Empiris: Validitas
instrumen berdasarkan berdasarkan hasil uji pengalaman.
Validitas
empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang
bersifat empiris. Dengan kata lain, validitas empiris adalah validitas yang
bersumber pada atau diperoleh atas dasar pengamatan di lapangan.
Validitas
Empiris dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu dapat
dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas
konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang
disebut validitas prediktif (predictive validity).
Untuk
memperoleh validitas empiris, diperlukan pengujian dengan menggunakan korelasi.
Validitas empiris ditunjukkan dengan angka korelasi antara skor pada alat yang
dipergunakan dengan skor yang dihasilkan dari alat yang dijadikan kriteria.
Tetapi dalam ujian masuk perguruan tinggi misalnya, koefisien validitas
ditunjukkan dengan skor pada saat ujian masuk dengan skor yang diperoleh pada
saat seseorang telah belajar selama beberapa waktu tertentu.
Menurut
Sumadi Suryabrata, (2004: 46) dalam menafsirkan koefisien validitas yang
didapat dari mengkorelasikan skor alat ukur dengan kriterianya sebaiknya
dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi
jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya
adalah sebesar 0,25. semakin tinggi angka koefisien determinasi, maka semakin
tinggi pula kecermatan prediksinya.
Ada 2
macam validitas empiris:
1) Validitas ada sekarang (concurrent
validity)
Tes sebagai alat pengukur dapat
dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun
waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan yang
searah, antara tes pertama dengan tes berikutnya.
Dalam kata lain, sebuah
tes dikatakan memiliki validitas ada sekarang jika hasil tes tersebut memiliki
kesetaraan dengan sejumlah hasil tes yang sudah ada. Menguji validitas ini
dilakukan dengan membandingkan kondisi instument yang bersangkutan dengan yang
sudah ada.
2) Validitas Prediksi (Predictive
Validity)
Validitas ramalan adalah suatu kondisi
yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan secara tepat
menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa
mendatang.
Sebuah tes dikatakan
memiliki validitas prediksi jika mempunyai kemampuan untuk meramalkan apa yang
akan terjadi dimasa yang akan datang. Misalnya tes yang digunakan untuk
melakukan seleksi penerimaan siswa baru SMP dikatakan memiliki validitas
prediksi jika terdapat kesejajaran antara nilai tes calon siswa dengan nilai
yang diperolehnya setelah menjadi siswa pada sekolah yang bersangkutan. Untuk
uji validitas ini dapat dilakukan dengan menggunakan rumus korelasi product
moment.
3.
Cara mengetahui validitas alat ukur
Sekali lagi diulangi bahwa sebuah tes
dikatakan memiliki validitas jikam hasilnya sesuai dengan kriterium dalam arti
memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang
digunakan untuk mengetahui kesejajaran dalah teknik korelasi product moment
yang dikemukakan oleh pearson.
Rumus korelasi product moment ada dua
macam, ysitu :
a.
Korelasi product
moment dengan simpangan, dan
b.
Korelasi product
moment dengan angka kasar.
Rumus korelasi product momen dengan simpangan
![]() |
Dimana :


∑ xy =
jumlah perkalian x dengan y
x2 =
kuadrat dari x
y2 =
kuadrat dari y
contoh
perhitungan :
Misalnya
akan menghitung validitas tes prestasi belajar bahasa Inggris sebagai kriterium
sebagai rata – rata ulangan yang akan
dicari validitasnya diberi kode X danrata – rata nilai harian diberi kode Y.
kemudian dibuat table persiapan sebagai berikut
No
|
Nama
|
X
|
Y
|
x
|
y
|
X2
|
y2
|
xy
|
1
2
3
4
5
6
7
8
9
10
|
Ahhmad zaed
Amiruddinnus
Didin
Faisol
Mahadir
Sandy
Zaenal
Wawan
Yunus
Umar
|
6.5
7
7.5
7
6
6
5.5
6.5
7
6
|
6.3
6.8
7.2
6.8
7
6.2
5.1
6
6.5
5.9
|
0
+0.5
+1.0
+0.5
- 0.5
- 0.5
- 1.0
0
+0.5
- 0.5
|
- 0.1
+0.4
+0.8 +0.4 +0.6
- 0.2
- 1.3
- 0.4
+1.0
-0.6
|
0.0
0.25
1.0
0.25
0.25
0.25
1.0
0.0
0.25
0.25
|
0.01
0.16
1.64
0.16
0.36
0.04
1.69
0.16
0.01
0.36
|
0.0
+ 0.2
+ 0.8
+ 0.2
-0.3
+1.0
+1.3
0.0
+0.05
+ 0.3
|
|
Jumlah
|
65.0
|
63.8
|
|
|
3.5
|
3.59
|
2.64
|
X =
= 6.5

Y =
= 6.38 di bulatkan 6.4

X =
X – X
Y =
Y – Y



=
= 0.748

Indeks
korelasi X dan Y inilah indeks validitas soal yang dicari.
Rumus korelasi product moment dengan
angka kasar :

Dimana :
rXY = koefisien korelasi antara
variable X dan variable Y, dua variable yang dikorelasikan
Dengan
menggunakan data hasil teas bahasa
Inggris di ats, kini dihitung dengan korelasi product moment dengan angka kasar yang table
persiapannya sebagai berikut.
No
|
Nama
|
X
|
Y
|
X2
|
y2
|
xy
|
1
2
3
4
5
6
7
8
9
10
|
Ahhmad zaed
Amiruddinnus
Didin
Faisol
Mahadir
Sandy
Zaenal
Wawan
Yunus
Umar
|
6.5
7
7.5
7
6
6
5.5
6.5
7
6
|
6.3
6.8
7.2
6.8
7
6.2
5.1
6
6.5
5.9
|
42. 25
49
56.25
48
36
36
30.25
42.5
49
36
|
39.69
46.24
51.84
46.24
49
38.44
26.01
36
42.5
34.81
|
40.95
47.6
54.0
47.6
42
37.2
28.05
39
45.5
35.4
|
|
Jumlah
|
65.0
|
63.8
|
426.0
|
410.52
|
2.64
|
Dimasukkan
kedalam rumus :






Jika
dibandingkan validitas soal yang dihitung dengan rumus simpangan, ternyata
terdapat perbedaan sebesar 0.003, lebih besar yang dihitung dengan rumus
simpangan. Hal ini wajar karena dalam
mengerjakan perkalian atau penjumlahan, jika diperoleh 3 atau angka di
belakang koma, dilakukan pembulatan keatas. Perbedaan ini sangat kecil sehingga
dapat di abaikan.
Untuk
memperjelas pengertian tersebut dapat disampaikan keterangan sebgai berikut.
-
Korelasi positif
menunjukan aadanya hubungan sejajar antara dua hal. Misalnya hal pertama
nilainya naik, hal kedua ikut naik. Sena;liknya jika hal pertama turun, yang
kedua juga ikut turun.
Contoh korelasi positif antara nilai bahasa Inggris dan Bahasa
Indonesia
Bahasa Inggris : 2 3 5 7 4 3 2
Bahasa Indonesia : 4 5 6 8 5 4 3
Kondisi nilai Bahasa Inggris sejalan dengan bahasa Indonesia
karena naik dan turunnya nilai Bahasa Indonesia mengikuti naik turunnya nilai
Bahasa Inggris.
-
Korelasi negative
menunjukan adanya hubungan kebalikan antara dua hal. Misalnya, hal pertama
nilainya naik, justru yang kedua turun. Sebaliknya, jika yang pertama turun,
yang kedua naik.
Contoh korelasi
negative antara nilai bahasa Inggris dan Bahasa Indonesia
Bahasa Inggris : 4 5 6 8 5 4 3
Bahasa Indonesia : 2 3 5 7 4 3 2
Keadaaan huubungan antara dua hal yang kita jumpai dalam kehidupan
sehari – hari tidak selalu positif saja, tetapi mungkin 0. Besarnya korelasi
pun tidak menentu. Coba cermatilah bagaimana hubungan antara dua nilai mata
pelajaran A dan B berikut ini.
Nilai A : 5 6 4 7 3 8 7
Nilai B : 4 4 3 7 4 9 4
Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi,
mungkin positif mungkin negative.
Koefisien korelasi selalu berada antara – 1.00 sampai + 1.00.
namun karena dalam menghitung seriing dilakukan pembulatan angka – angka,
sangat mungkin diperoleh koefisienn lebih dari 1.00. koefisien negatif
menunjukan hubungan kebalikan sedangka koefisisen positif menunjukan adanya
kesejajaran. untuk mengadakan interpretasi mengenai besarnya koefisien korelasi
adlah sebagi berikut:
-
Antara 0.800
sampai dengan 1.00 : sangat tinggi
-
Antara 0.600
sampai dengan 0.80 : tinggi
-
Antara 0.400
sampai dengan 0.60 : cukup
-
Antara 0.200
sampai dengan 0.40 : rendah
-
Antara 0.00
sampai dengan 0.20 : sangat rendah
B. Reliabelitas
1.
Arti realibilitas bagi sebuah tes
Reliabilitas dapat
diartikan sebagai tingkat konsistensi skor yang dicapai oleh orang yang sama
dan tes yang sama pula ketika diuji pada waktu yang berbeda. Atau, konsistensi
skor juga dapat diperoleh dengan soal yang berbeda tetapi memiliki kesamaan
dari berbagai aspek.
Menurut
Sugiono (2005) Reliabilitas adalah serangkaian pengukuran atau serangkaian alat
ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur
itu dilakukan secara berulang. Reabilitas tes adalah tingkat keajegan
(konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk
menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada
situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu tes adalah
seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur.
Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien.
Koefisien tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003)
Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau
kenyataan hidup tadi diukur atau diamati berkali – kali dalam waktu yang
berlainan. Alat dan cara mengukur atau mengamati sama – sama memegang peranan
penting dalam waktu yang bersamaan.
Reliabelitas
sering diartikan kosistensi\ ketetapan, Artinya jika tes tersebut dipake
berulang-ulang pada kelompok siswa yang sama, hasilnya akan relatif sama.
Contoh: Tes biologi bentuk pilihan ganda sebanyak 50 nomor uji coba pada
sekelompok siswa sebanyak tiga kali pada saat yang berlainan maka setiap siswa
akan tetap berada pada ranking yang sama dalam kelompoknya.
Berdasarkan
beberapa pendapat tentang pengertian reliabilitas di atas, maka dapat diambil
kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk mengukur
atau mengamati sesuatu yang menjadi objek ukur.
Dalam
menentukan reliabilitas sebuah alat evaluasi dalam hal ini instrumen tes, dapat
dikelompokkan berdasarkan jenis instrumen tersebut, yaitu: (1) Tes Objektif ,
(2) Tes Uraian, dan (3) Tes Afektif.
2. Menenentukan Besaran Koefisien
Reliabelitas
a. Metode Bentuk Paralel
Tes paralel adalah dua
buah tes yang memiliki kesamaan tujuan, tingkat kesukaran dan susunan, tetapi
butir-butir soalnya berbeda. Misalnya: tes biologi seri A dan tes biologi seri
B. Kedua tes tersebut diuji coba pada kelompok siswa yang sama. Teknik yang
digunakan untuk menentukan koefisien reliabelitas adalah teknik korelasi
product moment.
b. Metode Tes Ulang
Dalam metode tes ulang
guru yang menguji reliabelitas tes hanya menyusun satu tes yang diuji cobakan
sebanyak dua kali. Teknik yang digunakan untuk menentukan koefisien
reliabelitas adalah teknik korelasi product moment.
c. Metode Tes Belah Dua
Teknik belah dua adalah teknik analisis yang digunakan
dengan cara instrumen tes objektif dibelah menjadi dua bagian yang sama,
artinya jumlah soal yang harus dianalisis memiliki jumlah soal yang genap (agar
terbagi rata), Dalam
menentukan reliabelitas menggunakan metode tes belah dua, guru hanya membuat
satu tes. Tes tersebut dibelah dua dengan cara:
NΣX² - (ΣX)²)
NΣY² - (ΣY)²)
1). Belah ganjil genap:
membelah tes berdasarkan nomor ganjil dan nomor genap. Skor tes bernomor ganjil
dianggap sebagai skor, demikian juga tes bernomor genap.
2). Belahan awal akhir:
tes dibelah berdasarkan nomor awal dan akhir. Misalnya tes nomor 1 sampai
dengan 100 juga dianggap sebagai skor satu tes.
berikut ini beberapa
fungsi (formula) yang digunakan dalam menentukan koefisien reliabilitas dari
teknik belah dua, yaitu:
- Formula Spearman-Brown
Langkah
pertama yang dilakukan adalah menghitung reliabilitas bagian (setengah)
instrumen tes objektif tersebut, dengan rumus:
Jika
reliabilitas bagiannya telah ditemukan maka langkah selanjutnya adalah
menghitung nilai koefisien reliabilitasnya dengan rumus:
Keterangan:
n adalah banyaknya subjek
n adalah banyaknya subjek
X1 adalah data belahan pertama
X2 adalah data belahan kedua
- Formula Rulon
Konsep formula Rulon adalah perbedaan antara skor yang diperoleh subjek
pada belahan pertama dengan belahan kedua, perbedaan ini dipandang sebagai
galat (error) dari instrumen tes objektif. Persamaan yang digunakan adalah:
Dengan:
- Formula Flanangan
Koefisien
reliabilitas menurut Flanangan berdasarkan pada varians masing-masing belahan
dan varians totalnya. Dengan formula, sebagai berikut:
d.
Teknik Non Belah Dua
Uji reliabilitas
dengan teknik non belah dua dikembangkan oleh Kuder dan Richardson, hasil
pengembangan ini kemudian disebut dengan rumus KR-20 dan KR-21.
1. Formula KR-20
Rumus yang
digunakan adalah:
Keterangan:
r11 : Reliabilitas tes secara keseluruhan
r11 : Reliabilitas tes secara keseluruhan
p : proporsi
subjek yang menjawab benar butir soal ke-i
q : proporsi
subjek yang menjawab salah butir soal ke-I (q = 1 – p)
Jum.pq :
Jumlah hasil kali p dan q
n : Banyaknya
item
S : Standar
deviasi (akar varians)
- Formula KR-21
Rumus yang
digunakan adalah:
Keterangan:
n : Banyaknya item
n : Banyaknya item
Xt : Rerata
skor total
BAB III
TES STANDAR DAN TES BUATAN GURU
A. Tes
Standar
1. Pengertian
Tes Standar, Tes Prestasi Standar
Pengertian tes standar secara
sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga
yang khusus menyelenggarakan secara professional. Tes tersebut diketahui
memenuhi syarat sebagai tes yang baik; yakni diketahui validitas dan
reliabilitasnya baik validitas rasional maupun validitas empirik, reliabilitas
dalam arti teruji tingkat stabilitas, maupun homoginitasnya.
Tes ini dapat digunakan dalam
waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup wilayah
yang luas. Untuk
mengukur validitas dan reliabilitasnya telah diuji-cobakan beberapa kali
sehingga hasilnya dapat dipertanggungjawabkan.
Di antara tes prestasi yang digunakan di sekolah ada yang
dinamakan tes prestasi standar. Dalam
salah satu kamus, arti kata ”standar” adalah:
A
degree of level of requirement, excellence, or attainment
Yang dituntut dalam tes standar
bukan standar prestasi peserta didik dari penguasaan materi yang diajarkan pada
suatu tingkat, lembaga pendidikan tertentu, melainkan adanya kesamaan performance
pada kelompok peserta didik atau lembaga pendidikan disebabkan adanya
kesamaan tolok ukur. Oleh karena itu dalam tes standar, masalah keseragaman dan
konsistensi skoring penting untuk diperhatikan; sehingga tes tersebut dapat
dipakai untuk membandingkan peserta didik dari berbagai sekolah.
Standar untuk siswa dapat dimaksudkan seagai suatu tingkat
kemampuan yang harus dimiliki bagi suatu program tertentu. Mungkin standar bagi
suatu kursus A berbeda dengan B. jadi standar ini yang dibuat “keras” maupun
“lunak” tergantung dari yang menggunakan keijaksanaan. Suatu tes standar
dengan demikian berbeda dengan tes prestasi biasa.
Prosedur yang digunakan untuk menyusun tes standar untuk tes
prestasi secara langsung yang ditumbuhkan dari tes yang digunakan dikelas.
Sedangkan spesifikasi yang digunakan untuk menentukan isi dalam tes bakat
biasanya didasarkan atas analisis job(jabatan) atau analisis tugas yang
merupakan tuntutan calon pekerjaannya. Disamping itu juga mempertimbangkan
sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang
dilakukan biasanya tidak tidak didasarkan atas satu kurikulum, tetapi diambil
dari masyarakat.
Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab
pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan
dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula.
Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga
diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain
dapat dibandingan dengan penampilan kelompok standar tersebut.
Istilah “standar” tidak mengandung arti bahwa tes tersebut
mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau
tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai
suatu tingkat tertentu. sekali lagi tes standar dipolakan untuk penampilan
prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam
kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan
peseorangan maupun siswa sebagai anggota dari suatu kelompok.
Apabila pendidik bermaksud
menstandarisasikan tes buatannya sendiri, memerlukan perencanaan yang baik,
dilakukan uji coba di lapangan beberapa kali, dan ada beberapa yang perlu
distandarisasikan, yaitu:
Ø Materi yang akan diujikan,
Ø Sistem evaluasi yang digunakan,
Ø Waktu penyelesaian soalan tes,
Ø Tingkat kesukaran tes, dan
Ø Cara pengolahan hasil, termasuk
skoring yang digunakan.
Sesungguhnya tes standar tidak
hanya mecakup achievement test saja tetapi mencangkup personality tes,
seperti tes sikap, tes minat, tes bakat, dan tes integelensi.
2.
Kelengkapan Tes Standar
Sebuah tes yang sudah distandardisasikan dan sudah dapat
disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual. Manual
ini memuat keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama
yang menjelaskan tentang pelaksanaan, menskor, dan mengadakan interpretasi.
Secara garis besar manual tes standar ini memuat:
Ø Tujuan serta keuntungan-keuntungan
dari tes
Misalnya
yang disebutkan untuk siapa tes tersebut diberikan dan untuk tujuan apa.
Ø Proses standarisasi tes
Misalnya
mengenai hal-hal yang berhubungan dengan sampel.
Ø Besarnya sampel,
Ø Teknik sampling,
Ø Kelompok mana yang diambil sebagai
sampel(sifat sampel).
Ø Juga mengenai taraf kepercayaan
yang diambil dan bagaimana kaitannya dengan hasil tes.
Ø Petunjuk-petunjuk tentang cara
melaksanakan tes
Misalnya: dilaksanakan dengan
lisan atau tertulis, watu yang digunakan untuk mengerjakan setiap bagian, boleh
tidaknya tercoba keluar jika sudah selesai mengerjaan soal itu dan sebagainya.
Ø Petunjuk-petunjuk bagaimana cara
menskor
Misalnya: untuk beberapa skor
tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak, bagaimana cara
menghitung nilai akhir dan sebagainya.
Ø Petunjuk-petunjuk untuk
menginterpretasikan hasil
Misalnya:
Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi, Betul nomor
sekian saja, cocok untuk jabatan guru dan sebagainya.
Ø Saran-saran lain
Misalnya:
siapa pun harus menjadi pengawas, bagaimana seandainya tidak ada calon yang
mencapai skor tertentu dan sebagainya.
B. Tes Nonstandar
1. Pengertian
tes tidak standar
Tes nonstandard adalah kebalikan tes standar, yaitu tes yang
disusun oleh seorang pendidik yang belum memiliki keahlian professional dalam
penyusunan tes, atau mereka yang memiliki keahlian tetapi tidak sempat menyusun
tes secara baik, mengujicobakan, melakukan analisis sehingga validitas dan
reliabilitas belum dapat dipertanggungjawabkan. Tes non standar sering
digunakan untuk menyebut tes buatan guru, artinya disusun oleh seorang guru
tanpa bantuan tim ahli. Sebenatnya penggunaan istilah kedua ini tidak tepat,
sebab mendiskripsikan guru seagai orang yang tidak mampu menyusun tes yang
baik, penulis lebih cenderung menggunakan pengertian yang mendasarkan pada
kriteria kualitatif dari pada dilihat dari siapa yang menyusun.
Tes buatan guru memang memiliki beberapa kekhususan, bisa jadi
syarat kualitatif belum terpenuhi, tetapi ia memiliki kelebihan lebih cocok
untuk mengukur hal-hal khusus yang tidak dapat distandarisasikan; seperi
formatif, tes diagnostik, hasilnya lebih realistik. Sebab tes ini dirancang
sesuai dengan keadan peserrta didik, PBM suatu tingkat dan lembaga pendidikan
tertentu.
2. Kegunaan
Tes Standar dan tes tidak standar
Secara singkat dapat dikemukakan
bahwa kegunaan tes standar adalah:
Ø Jika ingin membuat perbandingan,
Ø Jika banyak orang yang akan
memasuki suatu sekolah tetapi tidak tersedia data tentang calon ini.
Secara garis besar kegunaan tes
standar adalah:
Ø Membandingkan prestasi belajar
dengan pembawaan individual atau kelompok.
Ø Membandingkan tingkat prestasi
siswa dalam keterampilan di berbagai bidang studi untuk individual atau
kelompok.
Ø Membandingkan prestasi siswa
berbagai sekolah atau kelas, dan
Ø Mempelajari perkembangan siswa
dalam suatu periode atau waktu tertentu.
Ø Kelengkapan Tes Standar
Sedangkan Kegunaan tes tidak
standar
Ø Untuk menentukan seberapa baik
siswa telah menguasai bahan pelajaran yang diberikan dalam waktu tertentu.
Ø Untuk menentukan apakah sesuatu
tujuan telah tercapai.
Ø Untuk memperoleh suatu nilai.
Selanjutnya baik tes standard dan
tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan untuk:
Ø Mengadaan diagnosis terhadap
ketidakmampuan siswa.
Ø Menentukan tempat siswa dalam
suatu kelas atau kelompok.
Ø Memberikan bimbingan kepada siswa
dalam pendidikan dan pemilihan jurusan.
Ø Memilih siswa untuk
program-program khusus
C.
Perbandingan
antara Tes Standar Dengan Tes Nonstandar
Tes standar disusun dalam
tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang sama banyak
dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Jadi, apakah
perbedaan antara tes standar dengan tes tidak standar (tes buatan guru) atau
apakah keburukan dan keuntungan tes standar.
Pertama, marilah kita tinjau
perbedaan antara tes standar dengan tes buatan guru.
Tes
Standar
|
Tes
Buatan Guru
|
Didasarkan atas bahan dan tujuan
umum dari sekolah-sekolah di seluruh Negara.
Mencakup aspek yang luas dan
pengetahuan dan keterampilan yang hanya sedikit butir tes untuk setiap
keterampilan atau topik.
Disusun dengan kelengkapan staf
professor, pembahas, dan editor butir tes.
Menggunakan butir tes yang sudah
diujicobakan (try out), dianalisa dan direvisi sebelum diujikan.
Mempunyai reliabilitas yang
tinggi.
Dimungkinkan menggunakan norma
untuk seluruh Negara.
|
Didasarkan atas bahan dan tujuan
khusus yang dirumuskan oleh guru untuk kelasnya sendiri.
Dapat terjadi hanya mencakup
pengetahuan dan keterampilan yang sempit.
Biasanya disusun sendiri oleh
guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.
Jarang menggunakan butir tes
yang sudah diujicobakan, dianalisa dan direvisi.
Mempunyai reliabilitas sedang
atau rendah.
Norma kelompok terbatas kelas
tertentu.
|
Sumardi Suryabrata, menegaskan
bahwa dalam masalah norma, sebenarnya ada tiga jenis, yaitu:
Norma nasional,
Norma lokal, dan
Norma sekolah (Sumadi Suryarata, 1987: 128)
Perbedaan antar norma nasional dan
norma lokal mencakup daerah liputannya, norma nasional memiliki karateristik
yang unik, tidak sederhana, dan tidak mudah menyusunnya karena keadaan oyek
yang sangat heterogen; sedangkan norma lokal sampel relatif homogen. Norma
lokal lebih cermat dalam menginterprestasikan prestasi dalam jangkauan
wilayahnya, hal ini penting bilamana akan dipakai untuk melakukan penilaian
pendidikan. Norma nasional sekalipun sulit, namun bila sudah tersusun sangat
berguna untuk acuan menginterpretasikan taraf kompetensi individual, sekolah,
dan wilayahnya.
Sampel norma sekolah jauh lebih
homogen dibandingkan kedua norma diatas. Norma sekolah dapat dipakai sebagai
acuan interpretasi hasil tes peserta didik dari sekolah bersangkutan. Oleh
karena itu masing-masing sekolah memiliki norma sendiri sesuai dengan kualitas
sekolah bersangkutan.
Pada saat ini hasil belajar
peserta didik kita jumpai penggunaan dua norma, yaitu norma sekolah dan norma
nasional Norma sekolah ditemuan dalam STTB dan nilai rata-rata rapor, sedangkan
norma nasional ditemukan pada NEM (Nilai Ebtanas Murni). Secara ideal lebih
baik bilamana setiap peserta didik juga memiliki norma lokal.
Kedua, untuk menyusun tes standar,
dibutuhkan waktu yang lama. Seperti disebutkan ahwa untuk memperoleh sebuah tes
standar melalui prosedur:
Penyusunan;
Uji coba;
BAB III
Penutup
A. Kesimpulan
Menurut Azwar (1986) validitas berasal dari
kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Menurut Arikunto
(1999) validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu
tes. Menurut Nursalam (2003) validitas adalah suatu ukuran yang menunjukkan
tingkat kevalidan atau kesahihan suatu instrumen.
Menurut Arikunto (1999) suatu tes dikatakan
valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki
validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki
kesejajaran antara tes dan criteria.
Secara garis besar, ada dua macam validitas, yaitu validitas
logis dan validitas empisris ( kriteria ).
a. Validitas Logis: validitas
instrumen berdasarkan logika (hasil penalaan).
Validitas logis adalah validitas yang
diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir
secara logis.
1) Validitas Isi (Content Validity)
Validitas isi dari suatu tes hasil
belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan,
penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil
belajar tersebut. Validitas isi adalah yang ditilik dari
2) Validitas Konstruksi (Construct Validity)
Validitas
konstruksi dapat diartikan sebagai validitas yang ditilik dari segi susunan,
kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil
b. Validitas Empiris: Validitas
instrumen berdasarkan berdasarkan hasil uji pengalaman.
Validitas
empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang
bersifat empiris
Ada 2
macam validitas empiris:
1) Validitas ada sekarang (concurrent
validity)
2) Validitas Prediksi (Predictive
Validity)
Teknik yang digunakan untuk mengetahui
kesejajaran dalah teknik korelasi product moment yang dikemukakan oleh pearson.
Rumus korelasi product moment ada dua
macam, yaitu :
a.
Korelasi product
moment dengan simpangan, dan
b.
Korelasi product
moment dengan angka kasar.
Reliabilitas dapat
diartikan sebagai tingkat konsistensi skor yang dicapai oleh orang yang sama
dan tes yang sama pula ketika diuji pada waktu yang berbeda. Atau, konsistensi
skor juga dapat diperoleh dengan soal yang berbeda tetapi memiliki kesamaan
dari berbagai aspek.
Menenentukan
Besaran Koefisien Reliabelitas
a. Metode Bentuk Paralel
b. Metode Tes Ulang
c. Metode Tes Belah Dua
Ø Belah ganjil genap
Ø Belahan awal akhir
berikut ini beberapa
fungsi (formula) yang digunakan dalam menentukan koefisien reliabilitas dari
teknik belah dua, yaitu:
- Formula Spearman-Brown
- Formula Rulon
- Formula Flanangan
Pengertian tes standar secara
sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga
yang khusus menyelenggarakan secara professional. Tes tersebut diketahui
memenuhi syarat sebagai tes yang baik; yakni diketahui validitas dan
reliabilitasnya baik validitas rasional maupun validitas empirik, reliabilitas
dalam arti teruji tingkat stabilitas, maupun homoginitasnya.
Secara garis besar manual tes standar memuat:
Ø Tujuan serta keuntungan-keuntungan
dari tes
Ø Proses standarisasi tes
Ø Besarnya sampel,
Ø Teknik sampling,
Ø Kelompok mana yang diambil sebagai
sampel(sifat sampel).
Ø Petunjuk-petunjuk tentang cara
melaksanakan tes
Ø Petunjuk-petunjuk bagaimana cara
menskor
Ø Petunjuk-petunjuk untuk
menginterpretasikan hasil
Tes nonstandard adalah kebalikan
tes standar, yaitu tes yang disusun oleh seorang pendidik yang belum memiliki
keahlian professional dalam penyusunan tes, atau mereka yang memiliki keahlian
tetapi tidak sempat menyusun tes secara baik, mengujicobakan, melakukan
analisis sehingga validitas dan reliabilitas belum dapat dipertanggungjawabkan.
Tes non standar sering
baik tes standard dan tes buatan
guru dianjurkan dipakai jika hasilnya akan digunakan untuk:
Ø Mengadaan diagnosis terhadap
ketidakmampuan siswa.
Ø Menentukan tempat siswa dalam
suatu kelas atau kelompok.
Ø Memberikan bimbingan kepada siswa
dalam pendidikan dan pemilihan jurusan.
Ø Memilih siswa untuk
program-program khusus
B. Saran
Tuntutan perkembangan jaman tentang guru profesional hendaknya
mendapatkan tanggapan positif dari seluruh guru yang ada dipelosok negeri ini.
Professional tersebut salah satunya terlihat dari cara guru memproduksi alat evaluasi
beruapa soal yang bermutu. Soal bermutu disini tentunya yang validitas dan
reliabilitasnya baik. Pembuatan soal oleh guru hendaknya mengikuti kaidah –
kaidah standarisai pembuatan soal yang ada. Hal ini dilakukan agar soal yang
dibuat oleh guru merupakan soal standar yang sudah memenuhi syarat kelayakan
disebut sebagai soal.
DAFTAR
PUSTAKA
Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi
Aksara.
Arikonto, Suharsimi. 2008.
Dasar-Dasar Evaluasi Pendidikan. Jakarta :Bumi Angkasami
Purwanto, M. Ngalim. 2001.
Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran. Bandung: Remaja
Rosdakarya.
Thoha, M. Chabib. 2001. Teknik
Evaluasi Pendidikan. Jakarta: Grafindo Persada.
Sudijono, A.
(2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Suhermin. (2008). Uji Validitas dan Uji
Reliabilitas [Online]. Tersedia:
http://blog.its.ac.id/suherminstatistikaitsacid/files/2008/09/validitas-reliabilitas.
Utami, D. (2010). Validitas dan Reliabilitas
[Online]. Tersedia: http://lussysf.multiply.com/journal/item/137
Tidak ada komentar:
Posting Komentar