Selasa, 15 Mei 2012

Kelompok 8- VALIDITAS TES, REALIBILITAS TES, TES STANDAR dan TES BUATAN GURU


VALIDITAS TES, REALIBILITAS TES, TES STANDAR
 dan TES BUATAN GURU
Makalah
Dipresentasikan pada 24 April 2012 di jurusan Bahasa Inggris semester 6
Dalam rangka melengkapi perkuliahan
Evaluasi pembelajaran
Dosen : Drs. Naeila Rifatil Muna, s.psi. M. pd







Disusun oleh :
Kasudin ( 59430504 )
Nunung nurul inayah ( 59430513 )

INSTITUT AGAMA ISLAM NEGERI ( IAIN )
SYEKH NURJATI CIREBON
Jalan Perjuangan By Pass Sunyaragi Cirrebon
2012



BAB I
PENDAHULUAN
A.     Latar Belakang
Tes kemampuan pada dasarnya terbagi menjadi dua macam, yaitu :
1.     Aptitude test
2.     Achievement tes
Perbedaan antara dua tes ini sebenearnya tidak tegas, soal – soal mengenai kedua tes tersebut sering kali saling melingkupi ( overlap ). Untuk kedua macam tes ini biasanya menggunakan hitung – hitungan dan perbendaharaan kata – kata dan sekelompok tes dari kedua macam tes ini biasanya juga menguji tentang keterampilan membaca. Kesamaan yang lain adalah bahwa keduanya telah digunakan untuk meramalkan hasil untuk yang masa akan dating, walaupun pada umumnya jika kita menggunakan tes prestasi penilai melihat apa yang telah diperoleh setelah siswa ( tercoba ) itu diberi suatu pelajaran.
Tes adalah salah satu bentuk instrumen evaluasi untuk mengukur seberapa besar kemampuan siswa dalam memahami dan menguasai pokok-pokok materi yang sudah diajarkan. Tes ada yang dibuat oleh seorang guru yang kemudian disebut tes buatan guru dan ada tes yang sudah memenuhi standar suatu satuan pendidikan maupun lembaga pendidikan yang kemudian disebut tes terstandar.
Dalam menilai, baik tes terstandar maupun tes buatan guru ada beberapa hal yang perlu diperhatikan yang berkaitan dengan analisis hasil tes tersebut. Dalam makalah ini akan diuraikan tentang banyak hal yang berkaitan dengan tes standar dan tes buatan guru. Serta dijelaskan juga tentang analisis hasil tes.  
Reliabilitas berhubungan dengan maslah kepercayaan. Suatu tes  dapat mempunyai taraf kepercayaan tinggi jika tes tersebut dapat memberika hasil yang tetap.  Maka pengertian realibilitas tes, berhubungan dengan masalah ketetapan hasil tes. Atau hasilnya berubah – ubah,  perubahan yang terjadi dapat dikatakan tidak berarti.
Konsep tentang realibilitas ini tidak akan sulit dipahamai apabila pembaca memahami konsep validitas. Tuntutan bahawa ninstrumen evaluasi harus valid menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan. Dalam hal reliebilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari kenyataan. Artinya, bahwa data tersebut benar, maka konsep reliabilitas terkait dengan pemotretan berkali – kali. Instrument yang baik dalah instrument yang dapat dengan konsisten memberikan data yang sesuai dengan kenyataan.

B.          Pembatasan dan perumusan masalah
1.     Pembatasan masalah
Dari  latar belakang  yang telah dipaparkan, pembahasan yang ada dalam makalah ini  dibatasi  pada:
a.     Pengertian validitas, realibilitas, soal standard dan soal buatan guru.
b.     Macam – macam validitas dan Cara mengetahui validitas alat ukur
c.      Arti realibilitas bagi sebuah tes serta menentukan besaran koefisiennya.
d.     Kelengkapan dan Kegunaan Tes Standar dan tes buatan guru.
e.     Perbandingan antara tes standar dengan tes nonstandard.

2.     Perumusan masalah
Dalam  makalah ini  masalah yang akan dirumuskan yaitu
a.     Apa Pengertian validitas, realibilitas, soal standard dan soal buatan guru?
b.     Apa saja Macam – macam validitas dan bagaimana cara mengetahui validitas alat ukur?
c.      Apa Arti realibilitas bagi sebuah tes dan bagaimana menentukan besaran koefisiennya?
d.     Seperti apa Kelengkapan dan Kegunaan Tes Standar dan tes buatan guru?
e.     Apa Perbandingan antara tes standar dengan tes nonstandard?

C.          Tujuan Pembuatan Makalah
Sesuai masalah yang dirumuskan, tujuan dari pembuatan makalah ini adalah sebagai berikut :
a.      Untuk mengetahui pengertian validitas, realibilitas, soal standard dan soal buatan guru.
b.     Untuk mengetahui macam – macam validitas dan Cara mengetahui validitas alat ukur
c.      Untuk mengetahui arti realibilitas bagi sebuah tes serta menentukan besaran koefisiennya.
d.     Untuk mengetahui kelengkapan dan Kegunaan Tes Standar dan tes buatan guru.
e.     Untuk mengetahui Perbandingan antara tes standar dengan tes nonstandard.












BAB II
VALIDITAS DAN RELIABILITAS
A.     VALIDITAS
1.Pengertian validitas
Dalam kehidupan sehari-hari, manusia senantiasa dihadapkan pada masalah keakuratan sebuah informasi. Informasi yang diterima manusia setiap hari sangat banyak dengan sumber yang semakin beragam. Koran dan televisi adalah dua sumber informasi utama saat ini. Dengan semakin banyaknya sumber-sumber informasi yang senantiasa berkembang, maka muncul sebuah pertanyaan mendasar tentang sejauhmana informasi yang diperoleh tersebut dapat dipercaya?
Dalam penelitian-penelitian sosial, keakuratan informasi yang diperoleh sangat mempengaruhi keputusan yang akan diambil. Sayangnya, akurasi informasi dalam penelitian-penelitian sosial tersebut tidak mudah diperoleh disebabkan sulitnya mendapatkan operasionalisasi konsep mengenai variabel yang hendak diukur. Untuk mengungkap aspek-aspek yang hendak diteliti, maka diperlukan alat ukur yang baik dan berkualitas. Alat ukur tersebut dapat berupa skala atau tes. Sebuah tes yang baik sebagaimana disampaikan oleh Syaifuddin Azwar (2006 : 2) harus memiliki beberapa kriteria antara lain valid, reliable, standar, ekonomis dan praktis. 
Menurut Azwar (1986) validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Menurut Arikunto (1999) validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes. Menurut Nursalam (2003) validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu instrumen.
Dalam Standards for Educational and Psychological Testing validitas adalah "... the degree to which evidence and theory support the interpretation of test scores entailed by proposed uses of tests " (1999: 9). Sebuah tes dikatakan valid jika ia memang mengukur apa yang seharusnya diukur (Allen & Yen, 1979: 95). Dalam bahasa yang hampir sama Djemari Mardapi (2004: 25) menyatakan bahwa validitas adalah ukuran seberapa cermat suatu tes melakukan fungsi ukurnya. Menurut Nitko & Brookhart (2007: 38) kevalidan sebuah alat ukur tergantung pada bagaimana hasil tes tersebut diinterpretasikan dan digunakan. Dalam pandangan Samuel Messick (1989: 13) validitas merupakan penilaian menyeluruh dimana bukti empiris dan logika teori mendukung pengambilan keputusan serta tindakan berdasarkan skor tes atau model-model penilaian yang lain
Berdasarkan beberapa pendapat tentang pengertian validitas di atas, maka dapat diambil kesimpulan bahwa validitas adalah suatu standar ukuran yang menunjukkan ketepatan dan kesahihan suatu instrumen.
Menurut Arikunto (1999) suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran antara tes dan kriteria.
Sisi lain dari pengertian validitas adalah aspek kecermatan pengukuran. Suatu alat ukur yang valid tidak hanya mampu menghasilkan data yang tepat akan tetapi juga harus memberikan gambaran yang cermat mengenai data tersebut.
Cermat berarti bahwa pengukuran itu dapat memberikan gambaran mengenai perbedaan yang sekecil- kecilnya di antara subjek yang satu dengan yang lain. Sebagai contoh, dalam bidang pengukuran aspek fisik, bila kita hendak mengetahui berat sebuah cincin emas maka kita harus menggunakan alat penimbang berat emas agar hasil penimbangannnya valid, yaitu tepat dan cermat. Sebuah alat penimbang badan memang mengukur berat, akan tetapi tidaklah cukup cermat guna menimbang berat cincin emas karena perbedaan berat yang sangat kecil pada berat emas itu tidak akan terlihat pada alat ukur berat badan.
Demikian pula kita ingin mengetahui waktu tempuh yang diperlukan dalam perjalanan dari satu kota ke kota lainnya, maka sebuah jam tangan biasa adalah cukup cermat dan karenanya akan menghasikan pengukuran waktu yang valid. Akan tetapi, jam tangan yang sama tentu tidak dapat memberikan hasil ukur yang valid mengenai waktu yang diperlukan seorang atlit pelari cepat dalam menempuh jarak 100 meter dikarenakan dalam hal itu diperlukan alat ukur yang dapat memberikan perbedaan satuan waktu terkecil sampai kepada pecahan detik yaitu stopwatch.
Menggunakan alat ukur yang dimaksudkan untuk mengukur suatu aspek tertentu akan tetapi tidak dapat memberikan hasil ukur yang cermat dan teliti akan menimbulkan kesalahan atau eror. Alat ukur yang valid akan memiliki tingkat kesalahan yang kecil sehingga angka yang dihasilkannya dapat dipercaya sebagai angka yang sebenarnya atau angka yang mendekati keadaan sebenarnya.
Jika dikaitkan dengan bidang psikologi, penggunaan validitas dapat dijumpai dalam tiga konteks yaitu validitas penelitian, validitas soal dan validitas alat ukur. Validitas penelitian merupakan derajad kesesuaian hasil penelitian dengan keadaan sebenarnya. Validitas soal berkaitan dengan kesesuaian antara suatu soal dengan soal lain. Sedangkan validitas alat ukur merujuk pada kecermatan ukurnya suatu tes (Sumadi Suryabrata, 2004: 40).
Menurut Allen & Yen (1979: 95) validitas tes dapat dibagi kedalam tiga kelompok utama yaitu : (1) validitas isi (content validity), (2) validitas konstruk (construct validity) dan (3) validitas kriteria (criterion related validity). Meskipun idealnya validasi dapat dilakukan dengan memakai semua bentuk validitas tes tersebut, tetapi pengembang tes dapat memilih bentuk validasi dengan melihat tujuan pengembangan tes (Kumaidi, 1994: 58). Suatu tes dikatakan valid jika tes tersebut dapat mengukur apa yang hendak diukur.


2.     Macam-macam validitas
Secara garis besar,  ada dua macam validitas, yaitu validitas logis dan validitas empisris ( kriteria ).
a.     Validitas Logis: validitas instrumen berdasarkan logika (hasil penalaan).
Validitas logis adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir secara logis. Sebuah instrumen dikatakan memiliki validitas logis jika instrument tersebut sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. validitas logis menunjukkan sejauhmana isi tes mengungkapkan representasi dari ciri-ciri atribut yang hendak diukur Validitas logis 2 yaitu:
1)          Validitas Isi (Content Validity)
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Validitas isi adalah yang ditilik dari segi isi tes itu sendiri sebagai alat pengukur hasil belajar yaitu: sejauh mana tes hasil belajar sebagai alat pengukur hasil belajar peserta didik, isisnya telah dapat mewakili secara representatif terhadap keseluruhan materi atau bahkan pelajaran yang seharusnya diteskan (diujikan).
Validitas isi menunjuk pada sejauhmana isi perangkat soal tersebut mengukur apa yang seharusnya diukur. Dalam kaitannya dengan kegiatan pembelajaran menurut Djemari Mardapi (1996: 22) validitas ini adalah kesesuaian antara materi ujian dan materi yang telah dipelajari. Pengujian validitas isi tidak melalui analisis statistik melainkan analisis rasional yaitu dengan melihat apakah butir-butirnya telah sesuai dengan batasan domain ukur yang telah ditetapkan sebelumnya.
Allen & Yen (1979: 95) membagi validitas isi kedalam dua kelompok yaitu face validity (validitas muka) dan logical validity (validitas logis). Validitas muka dapat dicapai jika tampilan tes tersebut telah meyakinkan untuk mengungkap atribut yang hendak diukur. Sebuah tes dikatakan memiliki validitas isi jika butir tes yang diujikan mencerminkan isi kurikulum yang seharusnya diukur.
2)     Validitas Konstruksi (Construct Validity)
Validitas konstruksi dapat diartikan sebagai validitas yang ditilik dari segi susunan, kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas konstruksi, apabila tes hasil belajar tersebut telalh dapat dengan secara tepat mencerminkan suatu konstruksi dalam teori psikologis.
Validitas konstruk merujuk pada sejauhmana suatu tes mengukur suatu konstruk teoretik atau trait yang hendak diukurnya (Allen & Yen, 1979: 108) konstruk dalam pengertian ini adalah berkaitan dengan aspek-aspek psikologi seseorang khususnya aspek kognitif, afektif dan psikomotor.
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir soal yang membangun tes tersebut mengukur setiap asfek berfikir seperti yang disebutkan dalam tujuan instruksional khusus atau indikator pencapaian kopetensi.
Ada beberapa cara yang bisa digunakan untuk menguji validitas konstruk. Misalnya dengan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam tes hasil belajar dengan aspek-aspek berpikir yang hendak diungkap oleh tujuan instruksional khusus. Pengujian yang lebih sederhana tentang validitas konstruk adalah malalui pendekatan multi trait multi-method (Saifuddin Azwar 2003: 176). Pendekatan ini akan menghasilkan bukti validitas diskriminan yang ditunjukkan dengan rendahnya korelasi antar skor yang mengukur trait yang berbeda bila digunakan metode yang sama dan validitas konvergen yang ditunjukkan oleh tingginya korelasi skor-skor tes yang mengukur trait yang sama dengan menggunakan metode yang berbeda.
Contoh mengenai estimasi koefisien validitas berdasarkan metode multitrait multimethod adalah sebagaimana disampaikan Fred N. Kerlinger (1973:742) tentang matriks hubungan antara sikap sosial. Ada dua instrument berbeda yang digunakan untuk mengukur liberalisme (L) dan konservatisme (C) dalam hubungannya dengan sikap sosial seseorang yaitu dengan pernyataan sikap biasa (metode 1) dan referen (metode 2) menggunakan referensi-referensi sikap seperti sepatah kata atau frase singkat. Korelasi antara kedua instrument tersebut disajikan dalam bentuk matriks multitrait-multimethod berikut :
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEicB0GzFwPVEnVcqH_VHYpcaBOQN3reqnMOyLNCDWV9zgOmU1eqefU5aRPEabMy-1uUjpFHWSMW0dgJxAQVEvY4g9sdnOx5EKSn5NMyZpwT8nfL4Znq5KIZ2OzaUP0NPlTrFwTjQM5E9YE/s320/validitas.bmp
Dalam contoh tersebut secara teoritis dituntut adanya korelasi negative atau mendekati nol antara L dan C. korelasi antara L1 dengan C1 adalah -0,07 serta antara L2 dengan C2 adalah -0,09 yang berarti bahwa keduanya hampir selaras dengan teorinya. Korelasi silang antara L dan C yakni korelasi antara L pada metode 1 dan C pada metode 2 atau antara L1 dan C2 adalah -0,37 dan ini lebih tinggi daripada yang diprediksikan oleh teorinya (-0,30). Maka, dengan perkecualian korelasi silang yang besarnya -0,37 antara L1 dan C2 validitas konstruk dalam skala sikap itu terdukung.
b.     Validitas Empiris: Validitas instrumen berdasarkan berdasarkan hasil uji pengalaman.
Validitas empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiris. Dengan kata lain, validitas empiris adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan.
Validitas Empiris dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu dapat dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang disebut validitas prediktif (predictive validity).
Untuk memperoleh validitas empiris, diperlukan pengujian dengan menggunakan korelasi. Validitas empiris ditunjukkan dengan angka korelasi antara skor pada alat yang dipergunakan dengan skor yang dihasilkan dari alat yang dijadikan kriteria. Tetapi dalam ujian masuk perguruan tinggi misalnya, koefisien validitas ditunjukkan dengan skor pada saat ujian masuk dengan skor yang diperoleh pada saat seseorang telah belajar selama beberapa waktu tertentu.
Menurut Sumadi Suryabrata, (2004: 46) dalam menafsirkan koefisien validitas yang didapat dari mengkorelasikan skor alat ukur dengan kriterianya sebaiknya dilakukan melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25. semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan prediksinya.
Ada 2 macam validitas empiris:
1)     Validitas ada sekarang (concurrent validity)
Tes sebagai alat pengukur dapat dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat mampu menunjukkan adanya hubungan yang searah, antara tes pertama dengan tes berikutnya.
Dalam kata lain, sebuah tes dikatakan memiliki validitas ada sekarang jika hasil tes tersebut memiliki kesetaraan dengan sejumlah hasil tes yang sudah ada. Menguji validitas ini dilakukan dengan membandingkan kondisi instument yang bersangkutan dengan yang sudah ada.
2)     Validitas Prediksi (Predictive Validity)
Validitas ramalan adalah suatu kondisi yang menunjukkan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukkan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang.
Sebuah tes dikatakan memiliki validitas prediksi jika mempunyai kemampuan untuk meramalkan apa yang akan terjadi dimasa yang akan datang. Misalnya tes yang digunakan untuk melakukan seleksi penerimaan siswa baru SMP dikatakan memiliki validitas prediksi jika terdapat kesejajaran antara nilai tes calon siswa dengan nilai yang diperolehnya setelah menjadi siswa pada sekolah yang bersangkutan. Untuk uji validitas ini dapat dilakukan dengan menggunakan rumus korelasi product moment.

3.     Cara mengetahui validitas alat ukur
Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jikam hasilnya sesuai dengan kriterium dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran dalah teknik korelasi product moment yang dikemukakan oleh pearson.
Rumus korelasi product moment ada dua macam, ysitu :
a.     Korelasi product moment dengan simpangan, dan
b.     Korelasi product moment dengan angka kasar.
Rumus korelasi product momen dengan simpangan
 






Dimana :
r xy  = koefisien korelasi antara variable x dan variable Y, dua variable yang dikorelasikan ( x  =  X    X    dan    y = Y – Y  )
xy = jumlah perkalian x dengan y
 x2     = kuadrat dari x
 y2     = kuadrat dari y
contoh perhitungan :
Misalnya akan menghitung validitas tes prestasi belajar bahasa Inggris sebagai kriterium sebagai rata – rata  ulangan yang akan dicari validitasnya diberi kode X danrata – rata nilai harian diberi kode Y. kemudian dibuat table persiapan sebagai berikut

No
Nama
X
Y
x
y
X2
y2
xy
1
2
3
4
5
6
7
8
9
10
Ahhmad zaed
Amiruddinnus
Didin
Faisol
Mahadir
Sandy
Zaenal
Wawan
Yunus
Umar
6.5
7
7.5
7
6
6
5.5
6.5
7
6
6.3
6.8
7.2
6.8
7
6.2
5.1
6
6.5
5.9
0
+0.5
+1.0
+0.5
- 0.5
- 0.5
- 1.0
0
+0.5
- 0.5
- 0.1
+0.4
+0.8 +0.4 +0.6
- 0.2
- 1.3
- 0.4
+1.0
-0.6
0.0
0.25
1.0
0.25
0.25
0.25
1.0
0.0
0.25
0.25
0.01
0.16
1.64
0.16
0.36
0.04
1.69
0.16
0.01
0.36
0.0
+ 0.2
+ 0.8
+ 0.2
-0.3
+1.0
+1.3
0.0
+0.05
+ 0.3

Jumlah
65.0
63.8


3.5
3.59
2.64

X  =      = 6.5
Y =   = 6.38 di bulatkan 6.4
X = X – X
Y = Y – Y
Dimasukkan ke rumus




  = 

=   = 0.748

Indeks korelasi X dan Y inilah indeks validitas soal yang dicari.

Rumus korelasi product moment dengan angka kasar :


Dimana :
rXY = koefisien korelasi antara variable X dan variable Y, dua variable yang dikorelasikan

Dengan menggunakan data hasil teas bahasa  Inggris di ats, kini dihitung dengan korelasi  product moment dengan angka kasar yang table persiapannya sebagai berikut.

No
Nama
X
Y
X2
y2
xy
1
2
3
4
5
6
7
8
9
10
Ahhmad zaed
Amiruddinnus
Didin
Faisol
Mahadir
Sandy
Zaenal
Wawan
Yunus
Umar
6.5
7
7.5
7
6
6
5.5
6.5
7
6
6.3
6.8
7.2
6.8
7
6.2
5.1
6
6.5
5.9
42. 25
49
56.25
48
36
36
30.25
42.5
49
36
39.69
46.24
51.84
46.24
49
38.44
26.01
36
42.5
34.81
40.95
47.6
54.0
47.6
42
37.2
28.05
39
45.5
35.4

Jumlah
65.0
63.8
426.0
410.52
2.64

Dimasukkan kedalam rumus :







Jika dibandingkan validitas soal yang dihitung dengan rumus simpangan, ternyata terdapat perbedaan sebesar 0.003, lebih besar yang dihitung dengan rumus simpangan. Hal ini wajar karena dalam  mengerjakan perkalian atau penjumlahan, jika diperoleh 3 atau angka di belakang koma, dilakukan pembulatan keatas. Perbedaan ini sangat kecil sehingga dapat di abaikan.
Untuk memperjelas pengertian tersebut dapat disampaikan keterangan sebgai berikut.
-   Korelasi positif menunjukan aadanya hubungan sejajar antara dua hal. Misalnya hal pertama nilainya naik, hal kedua ikut naik. Sena;liknya jika hal pertama turun, yang kedua juga ikut turun.
Contoh korelasi positif antara nilai bahasa Inggris dan Bahasa Indonesia
Bahasa Inggris            :  2       3          5          7          4          3          2
Bahasa Indonesia       :  4       5          6          8          5          4          3
Kondisi nilai Bahasa Inggris sejalan dengan bahasa Indonesia karena naik dan turunnya nilai Bahasa Indonesia mengikuti naik turunnya nilai Bahasa Inggris.
-   Korelasi negative menunjukan adanya hubungan kebalikan antara dua hal. Misalnya, hal pertama nilainya naik, justru yang kedua turun. Sebaliknya, jika yang pertama turun, yang kedua naik.
Contoh korelasi negative antara nilai bahasa Inggris dan Bahasa Indonesia
Bahasa Inggris               : 4        5          6          8          5          4          3
Bahasa Indonesia          : 2        3          5          7          4          3          2

Keadaaan huubungan antara dua hal yang kita jumpai dalam kehidupan sehari – hari tidak selalu positif saja, tetapi mungkin 0. Besarnya korelasi pun tidak menentu. Coba cermatilah bagaimana hubungan antara dua nilai mata pelajaran A dan B berikut ini.
Nilai A :           5         6          4          7          3          8          7
Nilai B :           4         4          3          7          4          9          4
Keadaan kedua nilai tersebut jika dihitung dengan rumus korelasi, mungkin positif mungkin negative.
Koefisien korelasi selalu berada antara – 1.00 sampai + 1.00. namun karena dalam menghitung seriing dilakukan pembulatan angka – angka, sangat mungkin diperoleh koefisienn lebih dari 1.00. koefisien negatif menunjukan hubungan kebalikan sedangka koefisisen positif menunjukan adanya kesejajaran. untuk mengadakan interpretasi mengenai besarnya koefisien korelasi adlah sebagi berikut:
-        Antara 0.800 sampai dengan 1.00       : sangat tinggi
-        Antara 0.600 sampai dengan 0.80       :  tinggi
-        Antara 0.400 sampai dengan 0.60       : cukup
-        Antara 0.200 sampai dengan 0.40       : rendah
-        Antara 0.00 sampai dengan 0.20         : sangat rendah

B.     Reliabelitas
1.     Arti realibilitas bagi sebuah tes
Reliabilitas dapat diartikan sebagai tingkat konsistensi skor yang dicapai oleh orang yang sama dan tes yang sama pula ketika diuji pada waktu yang berbeda. Atau, konsistensi skor juga dapat diperoleh dengan soal yang berbeda tetapi memiliki kesamaan dari berbagai aspek.
Menurut Sugiono (2005) Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda. Menurut Sukadji (2000) reliabilitas suatu tes adalah seberapa besar derajat tes mengukur secara konsisten sasaran yang diukur. Reliabilitas dinyatakan dalam bentuk angka, biasanya sebagai koefisien. Koefisien tinggi berarti reliabilitas tinggi. Menurut Nursalam (2003) Reliabilitas adalah kesamaan hasil pengukuran atau pengamatan bila fakta atau kenyataan hidup tadi diukur atau diamati berkali – kali dalam waktu yang berlainan. Alat dan cara mengukur atau mengamati sama – sama memegang peranan penting dalam waktu yang bersamaan.
Reliabelitas sering diartikan kosistensi\ ketetapan, Artinya jika tes tersebut dipake berulang-ulang pada kelompok siswa yang sama, hasilnya akan relatif sama. Contoh: Tes biologi bentuk pilihan ganda sebanyak 50 nomor uji coba pada sekelompok siswa sebanyak tiga kali pada saat yang berlainan maka setiap siswa akan tetap berada pada ranking yang sama dalam kelompoknya.
Berdasarkan beberapa pendapat tentang pengertian reliabilitas di atas, maka dapat diambil kesimpulan bahwa reliabilitas adalah suatu keajegan suatu tes untuk mengukur atau mengamati sesuatu yang menjadi objek ukur.
Dalam menentukan reliabilitas sebuah alat evaluasi dalam hal ini instrumen tes, dapat dikelompokkan berdasarkan jenis instrumen tersebut, yaitu: (1) Tes Objektif , (2) Tes Uraian, dan (3) Tes Afektif.
2.     Menenentukan Besaran Koefisien Reliabelitas
a.      Metode Bentuk Paralel
Tes paralel adalah dua buah tes yang memiliki kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya berbeda. Misalnya: tes biologi seri A dan tes biologi seri B. Kedua tes tersebut diuji coba pada kelompok siswa yang sama. Teknik yang digunakan untuk menentukan koefisien reliabelitas adalah teknik korelasi product moment.
b.     Metode Tes Ulang
Dalam metode tes ulang guru yang menguji reliabelitas tes hanya menyusun satu tes yang diuji cobakan sebanyak dua kali. Teknik yang digunakan untuk menentukan koefisien reliabelitas adalah teknik korelasi product moment.
c.       Metode Tes Belah Dua
Teknik belah dua adalah teknik analisis yang digunakan dengan cara instrumen tes objektif dibelah menjadi dua bagian yang sama, artinya jumlah soal yang harus dianalisis memiliki jumlah soal yang genap (agar terbagi rata), Dalam menentukan reliabelitas menggunakan metode tes belah dua, guru hanya membuat satu tes. Tes tersebut dibelah dua dengan cara:
NΣX² - (ΣX)²)
NΣY² - (ΣY)²)
1). Belah ganjil genap: membelah tes berdasarkan nomor ganjil dan nomor genap. Skor tes bernomor ganjil dianggap sebagai skor, demikian juga tes bernomor genap.
2). Belahan awal akhir: tes dibelah berdasarkan nomor awal dan akhir. Misalnya tes nomor 1 sampai dengan 100 juga dianggap sebagai skor satu tes.
berikut ini beberapa fungsi (formula) yang digunakan dalam menentukan koefisien reliabilitas dari teknik belah dua, yaitu:
  1. Formula Spearman-Brown
Langkah pertama yang dilakukan adalah menghitung reliabilitas bagian (setengah) instrumen tes objektif tersebut, dengan rumus:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi7HxNIaG3UjXwC6vnDfBBCCB6C6hi_DoXKGd5QJzwZD65l0HxlvP-6OxhVJWB5Zlp0RkaKmQUEbY7vwzt0cgpV56Fr7fGKaI67JO5Je9UQ19DuWnDBRUV3N-KG-loDnP1mK1-RKcBrSjo/s1600/r11-1.png
Jika reliabilitas bagiannya telah ditemukan maka langkah selanjutnya adalah menghitung nilai koefisien reliabilitasnya dengan rumus:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiPeGhnBfgRprwPUKvWDPQXdd0L5A7OKst5ZsRv3gu-3eI0L_T9W5YRVS4fgVpyBSIA1zMOiDjq6tcV-LHhcOi50JPHo7igFqJSbjCveh0Cy2V8-WZSq9kk-ZjwT2VuxcCYQp_efF4WEe8/s320/r11-2.png



Keterangan:
n  adalah banyaknya subjek
X1 adalah data belahan pertama
X2 adalah data belahan kedua

  1. Formula Rulon
Konsep formula Rulon adalah perbedaan antara skor yang diperoleh subjek pada belahan pertama dengan belahan kedua, perbedaan ini dipandang sebagai galat (error) dari instrumen tes objektif. Persamaan yang digunakan adalah:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiAG8g6Zcg6Z5LPb1_P6F2Q54PxZZU1QRQh1xktMG4Za1F3IBKBFIMv-z6sY6kTrEr5yH75OcAvjjrkOa80B7nab6j3KYO8akhA9T9gGkpllZFCa2TSXTBCzB4_P1iKxCDfLKk5I_qXdXM/s1600/r11-3.png
Dengan:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg2oZo0MbYv27aASiXznIa66l_1-uG-2Ga7w8irx7ih_YdGC7sSvatEU7L-xyUrxoA3veBaPTZrW8Q08asqw1aBD2Dkr1apEETveEiipMA9vxea4cnmdc6nzSR7tuteVc_c06Zzr24OVQs/s1600/r11-4.png
  1. Formula Flanangan
Koefisien reliabilitas menurut Flanangan berdasarkan pada varians masing-masing belahan dan varians totalnya. Dengan formula, sebagai berikut:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhSCOX_olr7lvjKoHL0_tCjer7GyjjGkoIvAa08x8TgV9KMmhcq7UO9WsPs_V3EiHeCgoc08miPvCxK_yfitkcYrVnr2FJ6sbR3whqlbOq45k4NKHr0RakVbKyY6D_S9Afi9Z3oTZ3_Mi0/s320/r11-5.png
d.      Teknik Non Belah Dua
Uji reliabilitas dengan teknik non belah dua dikembangkan oleh Kuder dan Richardson, hasil pengembangan ini kemudian disebut dengan rumus KR-20 dan KR-21.
1.     Formula KR-20
Rumus yang digunakan adalah:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEiU3QR55-IaNoTGz5Yp9EbOi_eG-fQjvlqkTVjyK3O1rxfT23aMkunZh50jUh1FfwnRrzcyRz50blS0fekkH6276_YRPSFCiUjVW2LYS0qI0Rf-iWdoHOHRb0eBScJg-BCp1k83BP0rdfo/s320/EP-1.png
Keterangan:
r11 : Reliabilitas tes secara keseluruhan
p : proporsi subjek yang menjawab benar butir soal ke-i
q : proporsi subjek yang menjawab salah butir soal ke-I (q = 1 – p)
Jum.pq : Jumlah hasil kali p dan q
n : Banyaknya item
S : Standar deviasi (akar varians)
  1. Formula KR-21
Rumus yang digunakan adalah:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhaCOa7vOC-NJ9BxsR54YTbPoM_y7_Ss44_ajyVvSXJAUJRQkh7fU78jJEOf-P0Q55PWx4cks89O9DUOqHnzaxU2uofFEK0vFClvFPzA3D44ljH4qgseK8_E3Rg2eATu0UgzxW-I2ZveGQ/s320/EP-2.png
Keterangan:
n : Banyaknya item
Xt : Rerata skor total


BAB III
TES STANDAR DAN  TES BUATAN GURU
A.       Tes Standar
1.   Pengertian Tes Standar, Tes Prestasi Standar
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik; yakni diketahui validitas dan reliabilitasnya baik validitas rasional maupun validitas empirik, reliabilitas dalam arti teruji tingkat stabilitas, maupun homoginitasnya.
Tes ini dapat digunakan dalam waktu yang relatif lama, dapat diterapkan pada beberapa obyek mencakup wilayah yang luas. Untuk mengukur validitas dan reliabilitasnya telah diuji-cobakan beberapa kali sehingga hasilnya dapat dipertanggungjawabkan.
Di antara tes prestasi yang digunakan di sekolah ada yang dinamakan tes prestasi standar. Dalam salah satu  kamus, arti kata ”standar” adalah:
A degree of level of requirement, excellence, or attainment
Yang dituntut dalam tes standar bukan standar prestasi peserta didik dari penguasaan materi yang diajarkan pada suatu tingkat, lembaga pendidikan tertentu, melainkan adanya kesamaan performance pada kelompok peserta didik atau lembaga pendidikan disebabkan adanya kesamaan tolok ukur. Oleh karena itu dalam tes standar, masalah keseragaman dan konsistensi skoring penting untuk diperhatikan; sehingga tes tersebut dapat dipakai untuk membandingkan peserta didik dari berbagai sekolah.
Standar untuk siswa dapat dimaksudkan seagai suatu tingkat kemampuan yang harus dimiliki bagi suatu program tertentu. Mungkin standar bagi suatu kursus A berbeda dengan B. jadi standar ini yang dibuat “keras” maupun “lunak” tergantung dari yang menggunakan keijaksanaan. Suatu tes standar dengan demikian berbeda dengan tes prestasi biasa.
Prosedur yang digunakan untuk menyusun tes standar untuk tes prestasi secara langsung yang ditumbuhkan dari tes yang digunakan dikelas. Sedangkan spesifikasi yang digunakan untuk menentukan isi dalam tes bakat biasanya didasarkan atas analisis job(jabatan) atau analisis tugas yang merupakan tuntutan calon pekerjaannya. Disamping itu juga mempertimbangkan sifat-sifat yang ada pada manusia. Analisis jabatan analisis tugas yang dilakukan biasanya tidak tidak didasarkan atas satu kurikulum, tetapi diambil dari masyarakat.
Istilah “standar” dalam tes dimaksudkan bahwa semua siswa menjawab pertanyaan-pertanyaan yang sama dari sejumlah besar pertanyaan dikerjakan dengan menggunakan petunjuk yang sama dan dalam batasan waktu yang sama pula. Dengan demikian maka seolah-olah ada suatu standar atau ukuran sehingga diperoleh suatu standar penampilan (performance) dan penampilan kelompok lain dapat dibandingan dengan penampilan kelompok standar tersebut.
Istilah “standar” tidak mengandung arti bahwa tes tersebut mengukur apa yang harus dan dapat diajarkan pada suatu tingkat tertentu atau tes itu menyiapkan suatu standar prestasi dimana siswa harus dan dapat mencapai suatu tingkat tertentu. sekali lagi tes standar dipolakan untuk penampilan prestasi sekarang (yang ada) yang dilaksanakan secara seragam, diusahakan dalam kondisi yang seragam, baik itu diberikan kepada siswa dalam pelaksanaan peseorangan maupun siswa sebagai anggota dari suatu kelompok.
Apabila pendidik bermaksud menstandarisasikan tes buatannya sendiri, memerlukan perencanaan yang baik, dilakukan uji coba di lapangan beberapa kali, dan ada beberapa yang perlu distandarisasikan, yaitu:
Ø  Materi yang akan diujikan,
Ø  Sistem evaluasi yang digunakan,
Ø  Waktu penyelesaian soalan tes,
Ø  Tingkat kesukaran tes, dan
Ø  Cara pengolahan hasil, termasuk skoring yang digunakan.
Sesungguhnya tes standar tidak hanya mecakup achievement test saja tetapi mencangkup personality tes, seperti tes sikap, tes minat, tes bakat, dan tes integelensi.
2.     Kelengkapan Tes Standar
Sebuah tes yang sudah distandardisasikan dan sudah dapat disebut sebagai tes standar, biasanya dilengkapi dengan sebuah manual. Manual ini memuat keterangan-keterangan atau petunjuk-petunjuk yang perlu terutama yang menjelaskan tentang pelaksanaan, menskor, dan mengadakan interpretasi.
Secara garis besar manual tes standar ini memuat:
Ø Tujuan serta keuntungan-keuntungan dari tes
Misalnya yang disebutkan untuk siapa tes tersebut diberikan dan untuk tujuan apa.
Ø  Proses standarisasi tes
Misalnya mengenai hal-hal yang berhubungan dengan sampel.
Ø Besarnya sampel,
Ø Teknik sampling,
Ø Kelompok mana yang diambil sebagai sampel(sifat sampel).
Ø Juga mengenai taraf kepercayaan yang diambil dan bagaimana kaitannya dengan hasil tes.
Ø Petunjuk-petunjuk tentang cara melaksanakan tes
Misalnya: dilaksanakan dengan lisan atau tertulis, watu yang digunakan untuk mengerjakan setiap bagian, boleh tidaknya tercoba keluar jika sudah selesai mengerjaan soal itu dan sebagainya.
Ø Petunjuk-petunjuk bagaimana cara menskor
Misalnya: untuk beberapa skor tiap-tiap soal/unit, menggunakan sistem hukuman atau tidak, bagaimana cara menghitung nilai akhir dan sebagainya.
Ø  Petunjuk-petunjuk untuk menginterpretasikan hasil
Misalnya: Betul nomor sekian sampai sekian cocok untuk jabatan kepala seksi, Betul nomor sekian saja, cocok untuk jabatan guru dan sebagainya.
Ø  Saran-saran lain
Misalnya: siapa pun harus menjadi pengawas, bagaimana seandainya tidak ada calon yang mencapai skor tertentu dan sebagainya.

B.     Tes Nonstandar
1.     Pengertian tes tidak standar
Tes nonstandard adalah kebalikan tes standar, yaitu tes yang disusun oleh seorang pendidik yang belum memiliki keahlian professional dalam penyusunan tes, atau mereka yang memiliki keahlian tetapi tidak sempat menyusun tes secara baik, mengujicobakan, melakukan analisis sehingga validitas dan reliabilitas belum dapat dipertanggungjawabkan. Tes non standar sering digunakan untuk menyebut tes buatan guru, artinya disusun oleh seorang guru tanpa bantuan tim ahli. Sebenatnya penggunaan istilah kedua ini tidak tepat, sebab mendiskripsikan guru seagai orang yang tidak mampu menyusun tes yang baik, penulis lebih cenderung menggunakan pengertian yang mendasarkan pada kriteria kualitatif dari pada dilihat dari siapa yang menyusun.
Tes buatan guru memang memiliki beberapa kekhususan, bisa jadi syarat kualitatif belum terpenuhi, tetapi ia memiliki kelebihan lebih cocok untuk mengukur hal-hal khusus yang tidak dapat distandarisasikan; seperi formatif, tes diagnostik, hasilnya lebih realistik. Sebab tes ini dirancang sesuai dengan keadan peserrta didik, PBM suatu tingkat dan lembaga pendidikan tertentu.

2.     Kegunaan Tes Standar dan tes tidak standar
Secara singkat dapat dikemukakan bahwa kegunaan tes standar adalah:
Ø  Jika ingin membuat perbandingan,
Ø  Jika banyak orang yang akan memasuki suatu sekolah tetapi tidak tersedia data tentang calon ini.
Secara garis besar kegunaan tes standar adalah:
Ø  Membandingkan prestasi belajar dengan pembawaan individual atau kelompok.
Ø  Membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi untuk individual atau kelompok.
Ø  Membandingkan prestasi siswa berbagai sekolah atau kelas, dan
Ø  Mempelajari perkembangan siswa dalam suatu periode atau waktu tertentu.
Ø  Kelengkapan Tes Standar
Sedangkan Kegunaan tes tidak standar
Ø Untuk menentukan seberapa baik siswa telah menguasai bahan pelajaran yang diberikan dalam waktu tertentu.
Ø Untuk menentukan apakah sesuatu tujuan telah tercapai.
Ø Untuk memperoleh suatu nilai.
Selanjutnya baik tes standard dan tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan untuk:
Ø Mengadaan diagnosis terhadap ketidakmampuan siswa.
Ø Menentukan tempat siswa dalam suatu kelas atau kelompok.
Ø Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.
Ø Memilih siswa untuk program-program khusus
                                                                            
C.     Perbandingan antara Tes Standar Dengan Tes Nonstandar
Tes standar disusun dalam tipe-tipe soal yang sama yang meliputi bahan atau pengetahuan yang sama banyak dengan bahan atau pengetahuan yang dicakup oleh tes buatan guru. Jadi, apakah perbedaan antara tes standar dengan tes tidak standar (tes buatan guru) atau apakah keburukan dan keuntungan tes standar.
Pertama, marilah kita tinjau perbedaan antara tes standar dengan tes buatan guru.
Tes Standar
Tes Buatan Guru
Didasarkan atas bahan dan tujuan umum dari sekolah-sekolah di seluruh Negara.
Mencakup aspek yang luas dan pengetahuan dan keterampilan yang hanya sedikit butir tes untuk setiap keterampilan atau topik.
Disusun dengan kelengkapan staf professor, pembahas, dan editor butir tes.
Menggunakan butir tes yang sudah diujicobakan (try out), dianalisa dan direvisi sebelum diujikan.
Mempunyai reliabilitas yang tinggi.
Dimungkinkan menggunakan norma untuk seluruh Negara.
Didasarkan atas bahan dan tujuan khusus yang dirumuskan oleh guru untuk kelasnya sendiri.
Dapat terjadi hanya mencakup pengetahuan dan keterampilan yang sempit.
Biasanya disusun sendiri oleh guru dengan sedikit atau tanpa bantuan orang lain/tenaga ahli.
Jarang menggunakan butir tes yang sudah diujicobakan, dianalisa dan direvisi.
Mempunyai reliabilitas sedang atau rendah.
Norma kelompok terbatas kelas tertentu.

Sumardi Suryabrata, menegaskan bahwa dalam masalah norma, sebenarnya ada tiga jenis, yaitu:
Norma nasional,
Norma lokal, dan
Norma sekolah (Sumadi Suryarata, 1987: 128)
Perbedaan antar norma nasional dan norma lokal mencakup daerah liputannya, norma nasional memiliki karateristik yang unik, tidak sederhana, dan tidak mudah menyusunnya karena keadaan oyek yang sangat heterogen; sedangkan norma lokal sampel relatif homogen. Norma lokal lebih cermat dalam menginterprestasikan prestasi dalam jangkauan wilayahnya, hal ini penting bilamana akan dipakai untuk melakukan penilaian pendidikan. Norma nasional sekalipun sulit, namun bila sudah tersusun sangat berguna untuk acuan menginterpretasikan taraf kompetensi individual, sekolah, dan wilayahnya.
Sampel norma sekolah jauh lebih homogen dibandingkan kedua norma diatas. Norma sekolah dapat dipakai sebagai acuan interpretasi hasil tes peserta didik dari sekolah bersangkutan. Oleh karena itu masing-masing sekolah memiliki norma sendiri sesuai dengan kualitas sekolah bersangkutan.
Pada saat ini hasil belajar peserta didik kita jumpai penggunaan dua norma, yaitu norma sekolah dan norma nasional Norma sekolah ditemuan dalam STTB dan nilai rata-rata rapor, sedangkan norma nasional ditemukan pada NEM (Nilai Ebtanas Murni). Secara ideal lebih baik bilamana setiap peserta didik juga memiliki norma lokal.
Kedua, untuk menyusun tes standar, dibutuhkan waktu yang lama. Seperti disebutkan ahwa untuk memperoleh sebuah tes standar melalui prosedur:
Penyusunan;
Uji coba;


BAB III
Penutup
A.     Kesimpulan
Menurut Azwar (1986) validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Menurut Arikunto (1999) validitas adalah suatu ukuran yang menunjukkan tingkat kesahihan suatu tes. Menurut Nursalam (2003) validitas adalah suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu instrumen.
Menurut Arikunto (1999) suatu tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Tes memiliki validitas yang tinggi jika hasilnya sesuai dengan kriteria, dalam arti memiliki kesejajaran antara tes dan criteria.
Secara garis besar,  ada dua macam validitas, yaitu validitas logis dan validitas empisris ( kriteria ).
a.     Validitas Logis: validitas instrumen berdasarkan logika (hasil penalaan).
Validitas logis adalah validitas yang diperoleh atas dasar hasil pemikiran, validitas yang diperoleh dengan berpikir secara logis.
1)     Validitas Isi (Content Validity)
Validitas isi dari suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelususran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Validitas isi adalah yang ditilik dari
2)     Validitas Konstruksi (Construct Validity)
Validitas konstruksi dapat diartikan sebagai validitas yang ditilik dari segi susunan, kerangka atau rekaannya. Adapun secara terminologis, suatu tes hasil
b.     Validitas Empiris: Validitas instrumen berdasarkan berdasarkan hasil uji pengalaman.
Validitas empiris adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empiris
Ada 2 macam validitas empiris:
1)     Validitas ada sekarang (concurrent validity)
2)     Validitas Prediksi (Predictive Validity)
Teknik yang digunakan untuk mengetahui kesejajaran dalah teknik korelasi product moment yang dikemukakan oleh pearson.
Rumus korelasi product moment ada dua macam, yaitu :
a.     Korelasi product moment dengan simpangan, dan
b.     Korelasi product moment dengan angka kasar.

Reliabilitas dapat diartikan sebagai tingkat konsistensi skor yang dicapai oleh orang yang sama dan tes yang sama pula ketika diuji pada waktu yang berbeda. Atau, konsistensi skor juga dapat diperoleh dengan soal yang berbeda tetapi memiliki kesamaan dari berbagai aspek.
Menenentukan Besaran Koefisien Reliabelitas
a.    Metode Bentuk Paralel
b.  Metode Tes Ulang
c.    Metode Tes Belah Dua
Ø Belah ganjil genap
Ø Belahan awal akhir
berikut ini beberapa fungsi (formula) yang digunakan dalam menentukan koefisien reliabilitas dari teknik belah dua, yaitu:
  1. Formula Spearman-Brown
  2. Formula Rulon
  3. Formula Flanangan
Pengertian tes standar secara sempit adalah tes yang disusun oleh satu tim ahli, atau disusun oleh lembaga yang khusus menyelenggarakan secara professional. Tes tersebut diketahui memenuhi syarat sebagai tes yang baik; yakni diketahui validitas dan reliabilitasnya baik validitas rasional maupun validitas empirik, reliabilitas dalam arti teruji tingkat stabilitas, maupun homoginitasnya.
Secara garis besar manual tes standar memuat:
Ø Tujuan serta keuntungan-keuntungan dari tes
Ø  Proses standarisasi tes
Ø Besarnya sampel,
Ø Teknik sampling,
Ø Kelompok mana yang diambil sebagai sampel(sifat sampel).
Ø Petunjuk-petunjuk tentang cara melaksanakan tes
Ø Petunjuk-petunjuk bagaimana cara menskor
Ø  Petunjuk-petunjuk untuk menginterpretasikan hasil
Tes nonstandard adalah kebalikan tes standar, yaitu tes yang disusun oleh seorang pendidik yang belum memiliki keahlian professional dalam penyusunan tes, atau mereka yang memiliki keahlian tetapi tidak sempat menyusun tes secara baik, mengujicobakan, melakukan analisis sehingga validitas dan reliabilitas belum dapat dipertanggungjawabkan. Tes non standar sering
baik tes standard dan tes buatan guru dianjurkan dipakai jika hasilnya akan digunakan untuk:
Ø Mengadaan diagnosis terhadap ketidakmampuan siswa.
Ø Menentukan tempat siswa dalam suatu kelas atau kelompok.
Ø Memberikan bimbingan kepada siswa dalam pendidikan dan pemilihan jurusan.
Ø Memilih siswa untuk program-program khusus

B.     Saran
Tuntutan perkembangan  jaman tentang guru profesional hendaknya mendapatkan tanggapan positif dari seluruh guru yang ada dipelosok negeri ini. Professional tersebut salah satunya terlihat dari cara guru memproduksi alat evaluasi beruapa soal yang bermutu. Soal bermutu disini tentunya yang validitas dan reliabilitasnya baik. Pembuatan soal oleh guru hendaknya mengikuti kaidah – kaidah standarisai pembuatan soal yang ada. Hal ini dilakukan agar soal yang dibuat oleh guru merupakan soal standar yang sudah memenuhi syarat kelayakan disebut sebagai soal.


DAFTAR PUSTAKA

Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta : Bumi Aksara.
Arikonto, Suharsimi. 2008. Dasar-Dasar Evaluasi Pendidikan. Jakarta :Bumi Angkasami
Purwanto, M. Ngalim. 2001. Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya.
Thoha, M. Chabib. 2001. Teknik Evaluasi Pendidikan. Jakarta: Grafindo Persada.

Sudijono, A. (2009). Pengantar Evaluasi Pendidikan. Jakarta: Rajawali Press.
Suhermin. (2008). Uji Validitas dan Uji Reliabilitas [Online]. Tersedia: http://blog.its.ac.id/suherminstatistikaitsacid/files/2008/09/validitas-reliabilitas.
Utami, D. (2010). Validitas dan Reliabilitas [Online]. Tersedia: http://lussysf.multiply.com/journal/item/137


 *Slide presentasi kelompok 8 dapat dilihat di: 



Tidak ada komentar:

Posting Komentar