MACAM_MACAM RELIABILITAS
BAB I
PENDAHULUAN
A. Latar Belakang
Dalam peroses pendidikan tidak akan lepas dari
peroses evaluasi pendidikan, yang melingkupi seluruh scope yang mendukungnya
mulai dari menejemen pendidikan, visi-misi, KMB dan tes baik formatif maupun
sumatif. Dalam evaluasi hasil belajar dapat dijumpai pembahasan mengenai
Validitas-Reliabilitas, dalam materi sebelumnya telah dijelaskan mengenai
validitas, setelah mempelajari materi tentang validitas. Untuk pembahasan
selanjutnya adalah reliabilitas.
Reliabilitas adalah derajat keandalan dari suatu
tes, Kerlinger (1986) dalam Zainal
Arifin (Evaluasi Pembelajaran) mengemukakan, reliabiltas dapat diukur dari tiga
kriteria, yaitu stability, dependability, dan predictability.” Stability
menunjukan keajegan suatu tes dalam mengukur gejala yang sama pada waktu yang
berbeda. Dependability menunjukkan kemantapan suatu tes atau seberapa jauh tes
dapat diandalkan. Predictability menunjukkan kemampuan tes untuk meramalkan
hasil pada pengukuran gejala selanjutnya.
Selanjutnya, dalam pembahasan reliabilitas akan
diterangkan mengenai macam-macam jenis reliabilitas dan hal-hal yang
mempengaruhi hasil belajar.
B. Rumusan Masalah
Rumusan maslah yang dapat diambil “Apakah
pengertian dari reliabilitas dan macam-macam reliabilitas sebagai alat mengukur
tes hasil belajar?”.
BAB II
PEMBAHASAN
A. PENGERTIAN
RELIABILITAS
Reliabilitas
adalah tingkat atau derajat konsistensi dari suatu instrumen. Reliablitas tes
berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai
kriteria yang telah ditetapkan (keandalan). Suatu tes dapat dikatakan reliabel
jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama
pada waktu atau kesempatan yang berbeda. Kerlinger (1986) mengemukakan,
reliabiltas dapat diukur dari tiga kriteria, yaitu stability, dependability,
dan predictability.” Stability menunjukan keajegan suatu tes dalam mengukur
gejala yang sama pada waktu yang berbeda. Dependability menunjukkan kemantapan
suatu tes atau seberapa jauh tes dapat diandalkan. Predictability menunjukkan
kemampuan tes untuk meramalkan hasil pada pengukuran gejala selanjutnya. Untuk
meninggalkan reliabilitas suatu tes antara lain dapat dilakukan dengan
memperbanyak butir soal. Selanjutnya, Gronloud (1985) mengemukakan ada empat faktor
yang dapat mempengaruhi reliabilitas, yaitu “panjang tes, sebaran skor, tingkat
kesukaran, dan objektivitas”.
Konsep
reliabiltas mendasari kesalahan pengukuran yang mungkin terjadi pada suatu
proses pengukuran atau pada nilai tunggal tertentu, sehingga menimbulkan
perubahan susunan kelompoknya (eror of measurement). Misalnya, guru mengetes
peserta didik dengan instrumen tertentu dan mendapat nilai 70. Kemudian pada
kesempatan yang berbeda dengan instrumen yang sama, guru melakukan tes kembali,
ternyata peserta didik tersebut mendapat nilai 75. Artinya tes tersebut tidak
reliabel, karena terjadi kesalahan pengukuran. Tes yang reliabel adalah apabila
koefisien reliabiltasnya tinggi dan kesalahan baku pengukurannya (standard
error of measurement) rendah.
1. Arti Reliabilitas
Bagi Sebuah Tes
Diterangkan dalam persyaratan tes, bahwa
reliabilitas berhubungan dengan masalah kepercayan. Suatu tes dapat dikatakan
mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan
hasil yang tetap. Maka pengertian reliabilitas tes, berhubungan dengan masalah
ketetapan hasil tes. Atau seandainya hasilnya berubah-ubah perubahan yang
terjadi dapat dikatakan tidak berarti.sehubungan dengan masalah reliabiltias
ini, scarvia B. Anderson dan kawan-kawan menyatakan bahwa persyaratan bagi tes,
yaitu validitas dan realibilitas ini penting. Dalam hal ini validitas lebih
penting, dan reliabilitas ini perlu, karena menyokong terbentuknya validitas.
Sebuah tes mungkin reliabel tetapi tidak valid. Sebaliknya, sebuah tes yang
valid biasanya reliabel.
Reliabel kadang diartikan Ajeg, namun untuk
mendapat gambaran yang ajeg memang agak sulit karena unsur kejiwaan manusia itu
sendiri tidak ajeg. Misalnya: kemampuan, kecakapan, sikap, dan sebagainya,
berubah-ubah dari waktu ke waktu.
2. Beberapa Hal Yang
Mempengaruhi Tes
Beberapa hal yang sedikit banyak mempengaruhi
hasil tes banyak sekali. Namun secara garis besar dapat dikelompokkan menjadi 3
hal:
a. Hal yang
berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya
Tes yang terdiri dari banyak butir, tentu saja lebih valid dibandingkan
dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi rendahnya
validitas menunjukkan tinggi rendahnya leliabilitas tes. Dengan demikian
semakin panjang tes, maka reliabilitasnya semakin tinggi. Dalam menghitung
besarnya reliabilitas berhubungan dengan penambahan banyaknya butir soal dalam
tes ini ada sebuah rumus yang diberikan oleh supesrman dan Brown sehingga
terkenal dengan rumus Spearman-Brown
Rumusnya adalah:
rnn=
nr
1 + (n-1)r
|
Di mana:
rnn = besarnya koefisien reliabilitas sesudah tes tersebut
ditambah butir soal baru
n = berapa kali butir-butir soal itu ditambah
r = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah
Contoh:
suatu tes terdiri atas 40 butir soal, mempunyai koefisien reliabilitas
0,70. Kemudian butir-butir soal itu ditambahkan menjadi 60 butir soal. Maka
koefisien reliabilitas baru adalah:
rnn= nr = 1,5 x 0,70 = 1,05= 0,79
1 +
(n-1)r 1 + (1,5 – 1) x 0,70 1,35
Dengan demikian maka penambahan sebanyak 20 butir soal dari 40 butir,
memperbesar koefesien reliabilitas sebesar 0,09. Akan tetapi penambahan
butir-butir soal tes adakalanya tidak berarti bahkan adakalanya merugikan. Hal
ini disebabkan karena:
1) Sampai pada suatu
batas tertentu, penambahan banyaknya butir soal sudah tidak menambah tinggi
reliabilitas.
2) Penambahan tingginya
reliabilitas tes tidak sebanding nilainya dengan waktu, biaya, dan tenaga yang
dikeluarkan untuk itu. Misal guru sudah cukup membuat 100 soal bentuk objectif
dan 10 soal esai sudah cukup mempiunyai validitas isi dan tingkah laku. Guru
tersebut ingin menambah butir-butir soal sehingga menjadi 200 dan 20 dengan
menambah soal-soal yang pararel. Tentu saja ini akan menambah waktu, biaya, dan
tenaga saja tanpa ada keuntungan apa-apa.
Kualitas butir-butir soal ditentukan oleh:
a) Jelas tidaknya
rumusan soal.
b) Baik-tidaknya
pengarahan soal kepada jawaban sehingga tidak menimbulkan salah jawab.
c) Petunjuknya jelas
sehingga mudah dan cepat dikerjakan.
b. Hal yang
berhubungan dengan tercoba (testee)
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya reliabilitas tes. Tes yang
dicobakan kepada bukan kelompok terpilih, akan menunjukkan reliabilitas yang
lebih besar daripada yang dicobakan pada kelompok tertentu yang diambil secara
terpilih.
c. Hal yang
berhubungan dengan penyelenggaraan tes
Sudahkan disebutkan bahwa faktor penyelenggaraan tes yang bersifat
administratif, sangat menentukan hasil tes.
Contoh:
1) Petunjuk yang
diberikan sebelum tes dimulai, akan memberikan ketenangan kepada para tes-tes
dalam mengerjakan tes, dan dalam penyelenggaraan tidak akan banyak terdapat
pertanyaan. Ketenangan ini tentu saja berpengaruh terhadap hasil tes.
2) Pengawas yang tertib
akan mempengaruhi hasil yang diberikan oleh siswa terhadap tes. Bagi
siswa-siswa tertentu adanya pengawasan yang terlalu ketat menyebabkan rasa
jengkel dan tidak dapat dengan leluasa mengerjakan tes.
3) Suasana lingkungan
dan tempat tes (duduk tidak teratur, suasana di sekelilingnya ramai, dan
sebagainya) akan mempengaruhi hasil tes.
Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara langsung akan
mempengaruhi reliabilitas soal tes.
B. MACAM-MACAM
RELIABILITAS
Dalam menentukan reliabilitas
tes hasil belajar, ada 2 (dua) jenis cara menentukan reliabilitas, yaitu:
1. TEKNIK MENENTUKAN
RELIABILITAS TES HASIL BELAJAR BENTUK URAIAN
Dalam rangka menentukan apakah
tes hasil belajar bentuk uraian yang disusun telah memiliki daya keajegan
mengukur atau reliabilitas yang tinggi
atau belum, pada umumnya orang menggunakan sebuah rumus yang dikenaldengan nama
Rumus Alpha. Adapun rumus alpha dimaksud adalah:
r11 =(
)(1-
)
di mana:
r11 = Koefisien reliabilitas
tes.
n =
Banyaknya butir item yang dikeluarkan dalam tes.
1 =
Bilangan konstan.
∑Si2 = Jumlah varian skor dari tiap-tiap butir
item.
St2 = Varian total.
Selanjutnya dalam pemberian interpretasi terhadap koefisien reliabilitas tes (r11) pada umumnya digunakan patokan
sebagai berikut:
a.
Apabila
r11sama
dengan atau lebih besar daripada 0,70 berarti tes hasil belajar yang sedang
diuji reliabilitasnya dinyatakan telah memiliki eliabilitas yang tinggi (=
reliable).
b.
Apabila r11lebih kecil daripada 0,70 berarti bahwa tes hasil belajar yang sedang diuji
reliabilitasnya dinyatakan belum memiliki reliabilitas yang tinggi
(un-reliable).
2.
TEKNIK PENGUJIAN RELIABILITAS TES HASIL BELAJAR
BENTUK OBYEKTIF
Berbeda dengan tes hasil belajar bentuk uraian,
maka pada tes hasil belajar bentuk obyektif penentuan reliabilitas tes dapat
dilakukan dengan menggunakan tiga macam pendekatan. Ketiga pendekatan tersebut
adalah: (1) Pendekatan Single Test-Single Trial (Single Test-Single Method),
(2) Pendekatan Test-Retest (Single Test-Double Trial Method), dan (3)
Pendekatan Alternate Form (Double Test-Double Trial Method).
Sedangkan Menurut perhitungan
product-moment dari Pearson, ada tiga macam reliabiltas, yaitu koefisien
stabilitas, koefisien ekuivalen, dan koefisien konsistensi internal.
a. Koefisien Stabilitas
(Test-Retest)
Koefisien stabilitas (coefficient of stability) adalah jenis
reliabilitas yang menggunakan teknik test dan retest(metode tes ulang),yaitu
memberikan tes kepada sekelompok individu, kemudian diadakan pengulangan tes
pada kelompok yang sama dengan waktu yang berbeda. Cara memperoleh koefisien
stabilitas adalah dengan mengorelasikan hasil tes pertama dengan hasil tes
kedua dari kelompok yang sama, tes yang sama, pada waktu yang berbeda. Jika
antara waktu tes pertama dengan tes kedua cukup lama, kemudian latihan-latihan
tambahan, maka bisa jadi nilai tes kedua akan lebih besar daripada tes pertama.
Sebaliknya jika antara waktu tes pertama dan tes kedua relatif pendek, maka
nilai tes kedua bisa jadi sama atau lebih besar daripada tes pertama karena
soal dan jawaban masih dapat diingat.
Untuk mencari korelasi antara skor-skor hasil tes pertama dengan skor-skor
hasil tes kedua, dapat dipergunakan teknik korelasi rank-order (teknik korelasi
tata jenjang) dari spearman, dengan menggunakan rumus:
p = 1-
di mana:
p (baca: Rho) = Koefisien korelasi
antara variabel I (skor-skor hasil tes I) dengan variabel II ( skor-skor hasil
tes II).
D = Difference (beda
antara rank variabel I dengan rank variabel II), atau: D = RI-RII
6 dan 1 = Bilangan konstan.
N = Banyaknya subyek
(testee)
b. Koefisien Ekuivalen
(Alternate Method)
Koefisien ekuivalen (coeffisient of equivalence) adalah jika mengorelasikan dua buah tes yang pararel
pada kelompok dan waktu yang sama. Metode yang digunakan untuk memperoleh
koefisien ekuivalen adalah metode dengan menggunakan dua buah bentuk tes yang
pararel (equivalen) atau equivalence forms method atau disebut
juga parallel Alternate-form method. Syarat-syarat yang harus dipenuhi dikedua
tes pararel adalah kriteria yang digunakan kedua tes sama, masing-masing tes
dikonstruksikan tersendiri, jumlah item isi, dan corak sama, tingkat kesukaran
sama, petunjuk waktu yang disediakan untuk mengerjakan tes, dan contoh-contoh
juga sama. Kemungkinan kesalahan pada teknik ini bersumber dari derajat
keseimbangan antara kedua tes tersebut, serta kondisi tempat yang mungkin
berbeda pada kelompok tes pertama dengan kelompok tes kedua, meskipun dilakukan
pada waktu yang sama.
Kelebihan metode ini adalah, bahwa metode ini:
1) Karena butir-butir
item dibuat sejenis tetapi tidak sama, maka tes hasil belajar (yang akan diuji
reliabilitasnya itu) dapat terhindar dari kemungkinan timbulnya pengaruh yang
datang dari testee, yaitu pengaruh berupa latihan atau menghafal.
2) Karena kedua tes itu
dilaksanakan secara bebarengan (pararel), maka dapat dihindarkan timbulnya
perbedaan-perbedaan situasi dan kondisi yang diperkirakan akan dapat
mempengaruhi penyelenggaraan tes, baik yang bersifat sosial maupun yang
bersifat alami.
Dalam pelaksanaan pengujian reliabilitas tes dengan menggunakan pendekatan
Alternate Form atau bentuk pararel ini, skor-skor yang diperoleh dari kedua
seri tes tadi dicari korelasinya. Apabila terdapat korelasi positif yang
signifikan maka dapat dikatakan tes hasil belajar tersebut dikatakan Reliabel.
Teknik korelasi yang dipergunakan bisa dipilih antar teknik korelasi
product-moment dari pearson atau teknik korelasi rank order dari spearman
(khusus untuk N kurang dari 30).
c. Koefisien Konsistensi
Internal
Koefisien konsistensi internal (coefficient of internal consistency)
adalah reliabilitas yang didapat dengan jalan mengorelasikan dua buah tes dari
kelompok yang sama, tetapi diambil butir-butir yang bernomor genap untuk tes
yang pertama dan butir-butir bernomor ganjul untuk tes yang kedua. Teknik ini
sering juga disebut split-half method. Split berarti membelah dan half
berarti setengah atau separuh. Jadi Split-Halfadalah tes yang dibagi
menjadi 2 bagian yang sama, kemudian mengorelasikan butir soal yang bernomor
ganjil dalam belahan pertama (X) dan yang bernomor genap dalam belahan kedua
(Y). Untuk membagi tes menjadi dua
bagian dapat juga dilakukan dengan cara mengambil nomor soal secara acak,
tetapi jumlahnya tetap harus sama untuk masing-masing kelompok. Di samping itu,
pembagian tes dapat juga dilakukan dengan cara setengah bagian pertama untuk
kelompok pertama dan setengah lagi untuk kelompok kedua.
Untuk menghitung koefisien
stabilitas, koefisien ekuivalen, dan koefisien konsistensi internal dapat
digunakan analisis korelasi seperti pada pengujian validitas. Khusus bagi
perhitungan koefisien konsistensi internal, korelasi tersebut baru sebagian
dari keseluruhan tes. Dapat digunakan lima formula antara lain: (1) Formula
Spearman-Brown (Korelasi Item Gasal-Genap dan Korelasi Belahan
Kanan-Kiri), (2) Formula Flanagan (Varian Deviasi Belahan I dengan
Belahan II), (3) Formula Rulon (Varian Beda Skor Belahan I dengan
Belahan II), (4) Formula Kuder Richardson (Analisis langsung terhadap
butir-butir item tes yang bersangkutan), dan (5) Formula C. Hyot (Interaksi
antara subyek dengan item) untuk lebih mudahnya lihat pada lampiran.Untuk memperoleh
angka koefisien korelasi secara menyeluruh dari tes tersebut harus dihitung
dari nomor-nomor kedua tes itu, seperti dengan rumus Spearman-Brown:
rnn=
Keterangan : n = panjang tes yang selalu sama
dengan 2 kerena seluruh tes 2 x ½
Contoh :
10 orang peserta didik dites dalam mata
pelajaran Ilmu Pengetahuan Alam (IPA) dan Ilmu Pengetahuan Sosial (IPS). Jumlah
soal masing-masing lima buah. Dua buah nomor genap diambil dari hasil tes IPA
dan tiga buah nomor ganjil diambil dari tes IPS. Data yang diperoleh sebagai
berikut:
Nilai 10 orang
Peserta didik
Dalam mata
pelajaran IPA dan IPS
nama
|
Skor IPA
No.Genap (2 dan 4)
|
Skor IPA
No.Ganjil (1,3,5)
|
|||
A
|
8
|
6
|
8
|
7
|
10
|
B
|
7
|
7
|
6
|
7
|
5
|
C
|
5
|
6
|
6
|
6
|
6
|
D
|
8
|
6
|
7
|
6
|
9
|
E
|
5
|
6
|
5
|
5
|
5
|
F
|
4
|
7
|
4
|
6
|
6
|
G
|
5
|
9
|
7
|
5
|
5
|
H
|
7
|
5
|
8
|
5
|
4
|
I
|
7
|
8
|
4
|
9
|
7
|
J
|
9
|
5
|
9
|
9
|
4
|
Perhitungan
Korelasi Konsistensi Internal
X
|
Y
|
x
|
y
|
x2
|
y2
|
xy
|
14
|
25
|
+1
|
+6
|
1
|
36
|
6
|
14
|
8
|
+1
|
-1
|
1
|
1
|
-1
|
11
|
18
|
-2
|
-1
|
4
|
1
|
2
|
14
|
22
|
+1
|
+3
|
1
|
9
|
3
|
11
|
15
|
-2
|
-4
|
4
|
16
|
8
|
11
|
16
|
-2
|
-3
|
4
|
9
|
6
|
14
|
17
|
+1
|
-2
|
1
|
4
|
-2
|
12
|
17
|
-1
|
-2
|
1
|
4
|
2
|
15
|
20
|
+2
|
+1
|
4
|
1
|
2
|
14
|
22
|
+1
|
+3
|
1
|
9
|
3
|
130
|
190
|
|
|
22
|
90
|
29
|
X=13
|
X=19
|
rxy
=
=
=
= 0,65
untuk menghitung seluruh tes itu, dapat
digunakan rumus spearman-Brown sebagai berikut :
rnn=
=
=
= 0, 787.
BAB I
KESIMPULAN
Reliabilitas adalah tingkat
atau derajat konsistensi dari suatu instrumen. Arti relibilitas bagi sebuah tes
adalah sebagai syarat dipercayanya sebuah tes, karena sebuah tes dapat
dikatakan baik bila tes tersebut valid dan reliable.
Hal-hal yang mempengaruhi
hasil tes secara garis besar dapat dikelompokkan menjadi 3 (tiga), yaitu:
1. Hal yang berhubungan
dnegan tes itu sendiri, yaitu panjang tes dan kualitas butir-butir soalnya.
2. Hal yang berhubungan
dengan testee atau orang yang di tes.
3. Hal yang berhubungan
dengan penyelenggaraan tes.
Adapun macam-macam cara
menentukan reliabilitas secara garis besar terbagi dalam 2 bagian:
1. Teknik pengujian
reliabilitas tes hasil belajar bentuk uraian
2. Teknik pengujian
reliabilitas tes hasil belajar bentuk objektif, dalam hal ini terbagi dalam 3
macam:
a.
Single test-Double Trial (Metode Ulangan)
b.
Single Test-Single Trial (Metode Belah Dua [Split
Half])
c.
Double Test-Double Trial (Alternate Form atau
metode Parallel)
Demikianlah ringkasan dari
pembahasan mengenai reliabilitas dalam makalah ini, semoga seluruh isi makalah
ini bermanfaat bagi pembaca secara umum dan bagi penyusun secara pribadi.
Penyusun menyadari adanya kekurangan dalam makalah ini, untuk itu kami mehon
kritik dan saran yang membangun guna perbaikan di waktu selanjutnya. Terimakasih.,
Komentar
Posting Komentar