Pages

Kamis, 10 Februari 2011

VALIDITAS, RELIABILITAS DAN SKALA


VALIDITAS, RELIABILITAS DAN SKALA


A. VALIDITAS
Validitas suatu instrumen penelitian adalah derajat yang menunjukkan dimana suatu tes mengukur apa yang hendak diukur. Menurut Ebel, dalam Moh. Nazir, Validitas dibagi menjadi concurrent validity (validitas concuren), construct validity (validitas konstruk), face validity (validitas rupa), factorial validity (validitas faktorial), empirical validity (validitas empiris), intrinsic validity (validitas intrinsik), dan predictive validity (validitas prediksi).
Factorial validity dari sebuah alat ukur adalah korelasi antara alat ukur dengan faktor-faktor yang bersamaan dalam suatu kelompok atau ukuran-ukuran perilaku lainnya.Validitas ini biasanya diperoleh dengan menggunakan teknik analisis faktor.
Empirical validity adalah validitas empiris yang berkaitan dengan hubungan antara skor dengan suatu kriteria, dimana kriteria itu adalah merupakan ukuran yang bebas dan langsung berhubungan dengan apa yang ingin diramalkan oleh pengukuran.
Intrinsic validity adalah validitas yang berkaitan dengan penggunaan teknik uji coba untuk memperoleh fakta kuantitatif dan objektif untuk. Teknik uji coba itu yang dilakukan untuk mendukung bahwa instrumen yang digunakan sebagai alat ukur adalah benar-benar mengukur apa yang seharusnya diukur.
Predictive validity adalah validitas perkiraan yang berkenaan dengan hubungan antara skor suatu alat ukur dengan kinerja atau seseorang di masa mendatang berdasarkan pengukuran awal.Validitas prediksi adalah validitas instrumen yang diharapkan bisa memiliki hubungan dengan hasil yang diharapkan dari instrumen yang dibuat.Misalnya instrumen yang ditujukan terhadap mahasiswa baru.Bila jawaban responden (mahasiswa baru) memiliki hubungan dengan prestasi belajar mahasiswa ketika mengikuti kuliah mulai dari semester awal sampai semester akhir, berarti instrumen itu memiliki validitas prediksi yang tinggi.Sebaliknya jika instrumen yang dibuat dan ditujukan terhadap mahasiswa baru itu tidak memilii bubungan dengan prestasi belajar mahasiswa mulai dari semester awal hingga semester akhir, berarti instrumen itu meiliki validitas prediksi yang rendah.
Curricular validity adalah validitas yang ditentukan oleh bagaimana cara peneliti menilik isi dari pengukuran dan menilai seberapa jauh pengukuran yang dilakukan ituadalah merupakan alat ukur yang benar-benar mengukur aspek-aspek sesuai dengan tujuan instruksional.
Validitas isi adalah validitas instrumen yang memiliki kandungan isi butir-butir item pertanyaan yang dibuat sesuai dengan topik penelitian dan bisa menggali jawaban responden sesuai dengan permasalahan yang sudah dirumuskan oleh peneliti.
Validitas konstruk adalah validitas yang berkenaan dengan kualitas dalam aspek psikologis tentang apa yang diukur oleh suatu pengukuran serta terdapat evaluasi bahwa suatu konstruk tertentu itu bisa menyebabkan kinerja dan hasil yang baik dalam pengukuran.

B. RELIABILITAS INSTRUMEN
Azwar, mengatakan bahwa reliabilitas merupakan penerjemahan dari kata reliability yang artinya keterpercayaan, keterandalan, konsistensi dan sebagainya. Hasil pengukuran dapat dipercaya bila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subyek yang sama diperoleh hasil yang relatif sama, selama aspek yang diukur tidak berubah. Reliabilitas instrumen adalah hasil pengukuran yang dapat dipercaya.Reliabilitasinstrumen diperlukan untuk mendapatkan data sesuai dengan tujuan pengururan. Suatu Instrumen memiliki tingkat reliabilitas yang memadai bila instrument tersebut di gunakan mengukur aspek yang di ukr beberapa kali hasilnya tetap sama atau relative sama. Sifat reliabilitas dari sebuah instrumen berhubungan dengan sejauh mana kemampuan alat ukur itu memberikan hasil yang konsisten dari satu even percobaan ke even percobaan lainnya.Jika konsistensi pengukuran itu tidak kita peroleh dalam setiap pengukuran, dapat dibayangkan bila pengukuran yang dilakukan dengan instrumen itu memberikan hasil yang berbeda dari pengukuran satu ke pengukuran berikutnya.Minimal ada metode untuk menguji relibilitas suatu Instrumen, pertama Metode tes-retes, dan kedua metode paruh. Dalam metode tes-retes pengujian di lakukan dua atau tiga kali terhadap sampel yang sama. Hasilnya di hitung dengan uji korelasi menggunakan rumus product moment dari pearson. Bila korelasi atau “r” nya signifikan maka intrumen tersebut memiliki nilai reliabilitas yang baik dan bisa di gunakan utnuk pengukuran selanjutnya.Dalam metode paruh, pengukuran uji coba hanya di lakukan satu kali, skor dari nomor-nomor butir pertanyaan ganjil di korelasikan dengan skor dari butir-butir soal genap.
Selain itu untuk mengukur relibilitas dapat juga dilakukan uji reliabilitas dengan menggunakan alpha Cronbach diukur berdasarkan skala alpha Cronbach 0 sampai 1.Jika skala itu itu dikelompok ke dalam lima kelas dengan reng yang sama, maka ukuran kemantapan alpha dapat diinterprestasikan sebagai berikut :
1. Nilai alpha Cronbach 0,00 s.d. 0,20, berarti kurang reliabel
2. Nilai alpha Cronbach 0,21 s.d. 0,40, berarti agak reliabel
3. Nilai alpha Cronbach 0,42 s.d. 0,60, berarti cukup reliabel
4. Nilai alpha Cronbach 0,61 s.d. 0,80, berarti reliabel
5. Nilai alpha Cronbach 0,81 s.d. 1,00, berarti sangat reliable

C. SKALA
1. Skala Guttman
Skala Guttman dikembangkan oleh Louis Guttman.Skala ini mempunyai ciri penting, yaitu merupakan skala kumulatif dan mengukur satu dimensi saja dari satu variabel yang multi dimensi, sehingga skala ini termasuk mempunyai sifat undimensional.Skala Guttman yang disebut juga metode scalogram atau analisa skala (scale analysis) sangat baik untuk menyakinkan peneliti tentang kesatuan dimensi dari sikap atau sifat yang diteliti, yang sering disebut isi universal (universe of content) atau atribut universal (universe attribute).Dalam prosedur Guttman, suatu atribut universal mempunyai dimensi satu jika menghasilkan suatu skala kumulatif yang sempurna.
Cara membuat skala guttman adalah sebagai berikut:
a) Susunlah sejumlah pertanyaan yang relevan dengan masalah yang ingin diselidiki.
b) Lakukan penelitiaan permulaan pada sejumlah sampel dari populasi yang akan diselidiki, sampel yang diselidiki minimal besarnya 50.
c) Jawaban yang diperoleh dianalisis, dan jawaban yang ekstrim dibuang. Jawaban yang ekstrim adalah jawaban yang disetujui atau tidak disetujui oleh lebih dari 80% responden.
d) Susunlah jawaban pada tabel Guttman.
e) Hitunglah koefisien reprodusibilitas dan koefisien skalabilitas.

Kelemahan pokok dari Skala Guttman, yaitu:
a) Skala ini bisa jadi tidak mungkin menjadi dasar yang efektif baik intuk mengukur sikap terhadap objek yang kompleks atau pun untuk membuat prediksi tentang perilaku objek tersebut.
b) Satu skala bisa saja mempunyai dimensi tunggal untuk satu kelompok tetapi ganda untuk kelompok lain, ataupun berdimensi satu untuk satu waktu dan mempunyai dimensi ganda untuk waktu yang lain.

2. Skala Likert
Skala likert pertama kali dikembangkan dalammengukur sikap masyarakat.Dalam skala ini hanya menggunakan item yang secara pasti baik dan secara pasti buruk. Item yang pasti disenangi, disukai, yang baik, diberi tanda negative
Total skor merupakan penjumlahan skor respon dari responden yang hasilnya ditafsirkan sebagai posisi responden. Skala ini menggunakan ukuran ordinal sehingga dapat membuat ranking walaupun tidak diketahui berapa kali satu responden lebih baik atau lebih buruk dari responden lainnya.
Prosedur dalam membuat skala linkert adalah sebagai berikut :
a) Pengumpulan item-item yang cukup banyak dan relevan dengan masalah yang sedang diteliti, berupa item yang cukup terang disukai dan yang cukup terang tidak disukai
b) Item-item tersebut dicoba kepada sekelompok responden yang cukup representatif dari populasi yang ingin diteliti.
c) Pengumpulan responsi dari responden untuk kemudian diberikan skor, untuk jawaban yang memberikan indikasi menyenangi diberi skor tertinggi.
d) Total skor dari masing-masing individu adalah penjumlahan dari skor masing-masing item dari individu tersebut
e) Respon dianalisa untuk mengetahui item-item mana yang sangat nyata batasan antara skor tinggi dan skor rendah dalam skala total. Untuk mempertahankan konsistensi internal dari pertanyaan maka item yang tidak menunjukkan korelasi dengan total skor atau tidak menunjukkan beda yang nyata apakah masuk kedalam skor tinggi atau rendah dibuang.

Kelebihan skala linkert:
a) Dalam menyusun skala, item-item yang tidak jelas korelasinya masih dapat dimasukkan dalam skala.
b) Lebih mudah membuatnya dari pada skala thurstone.
c) Mempunyai reliabilitas yang relatif tinggi dibanding skala thurstone untuk jumlah item yang sama. Juga dapat memperlihatkan item yang dinyatakan dalam beberapa responsi alternatif.
d) Dapat memberikan keterangan yang lebih nyata tentang pendapatan atau sikap responden.

Kelemahan skala linkert:
a) Hanya dapat mengurutkan individu dalam skala, tetapi tidak dapat membandingkan berapakali individu lebih baik dari individu lainya.
b) Kadangkala total skor dari individu tidak memberikan arti yang jelas, banyak pola respon terhadap beberapa item akan memberikan skor yang sama.

3. Skala Thurstone
Apabila skala yang kita susun menggunakan model Likert maka data yang akan kita peroleh berjenis ordinal, namun apabila kita menghendaki jenis data satu tingkat lebih tinggi atau data interval maka kita dapat menggunakan skala Thurstone atau sering juga disebut metode equal appearing interval. Penyusunan skala dengan model ini memang relatif agak rumit dibandingkan dengan penyusunan skala model Likert.
Ada beberapa langkah awal yang mungkin sama dengan model likert, seperti :
a) Penetapan tujuan atau kawasan ukur,
b) Melakukan pendefinisian secara konseptual,
c) Menyusun definisi operasional,
d) Mengidentifikasi indikator perilaku,
e) Membuat blue print alat ukur, dan
f) Penyusunan item-item per indikator yang juga disusun dengan item favorable dan unfavorable sebanyak mungkin.

Yang menjadi pembeda dalam penyusunan skala antara Likert dan Thurstone terletak pada perlakuan setelah item jadi. Setelah item tersusun langkah selanjutnya yang harus dilakukan adalah membuat format untuk proses penilaian oleh Judges. Setiap item diberikan alternatif respon dengan rentang skala 11, ke sebelas rentang skala tersebut diberikan keterangan dengan huruf A sampai K.
Langkah selanjutnya adalah mencari penilai atau Judges minimal 30 orang untuk memberikan penilaian item. Instruksi yang diberikan ke penilaian sebelum melakukan penilaian adalah penilai atau Judges diminta meletakkan item pada rentang huruf tersebut, semakin ke arah huruf A maka item tersebut menyatakan item yang Unfavorable demikian pula sebaliknya apabila item tersebut diletakkan semakin mendekati huruf K maka item tersebut menyatakan item yang Favorable. Proses penilaian ini dilakukan pada semua item yang telah disusun satu per satu
Apabila seluruh item sudah dilakukan penilaian oleh seluruh penilaian atau Judges, maka langkah selanjutnya adalah melakukan tabulasi data seperti menghitung frekuensi, menghitung persentase, menghitung persentase kumulatif. Selanjutnya melakukan penghitungan nilai S (median) dan nilai Q dari penghitungan nilai percentile 25 dan percentile 75

4. Skala diferential semantic
Skala diferential semantic berisi serangkaian karakteristik bipolar, seperti : Panas – dingin, baik-tidak baik, dsb. kakteristik bipolar tersebut mempunyai dasar sikap seseoraang terhadap tiga hal yakni Potensi, evaluasi dan aktivitas.

5. Rating scale
Rating scale adalah data mentah yang dapat berupa angka kemudian di tafsirkan dengan pengertian kualitatif. Dalam model ini responden tidak akan menjawab dengan data kualitatif yang sudah tersedia tersebut tetapi menjawab dengan data kuantitatif yang sudah di sediakan. Dengan demikian bentuk Rating scale lebih fleksibel, tidak terbatas pengukuran sikap saja, tetapi untuk mengukur persepsi responden dari gejala lain.

1 komentar:

  1. TErima kasih atas informasinya, sangat bermanfaat sekalli bagi saya...

    BalasHapus