Rabu, 21 Maret 2012

RELIABILITAS ALAT UKUR

Reliabilitas Alat Ukur Skala Kuesioner

(kesimpulan) Pada penelitian di bidang ilmu sosial seperti manajemen, psikologi, sosiologi umumnya, variabel-variabel penelitiaanya dirumuskan sebagai sebuah variabel latent atau un-observed (konstruk) yaitu variabel yang tidak dapat diukur secara langsung, tetapi dibentuk melalui dimensi-dimensi yang diamati atau indikator-indikator yang diamati. Skala yang sering dipakai dalam penyusunan kuesioner adalah skala ordinal atau sering disebut dengan skala LIKERT.

Reliabilitas sebenarnya adalah alat untuk mengukur suatu skala yang merupakan indikator dari variabel atau konstruk. Suatu skala dikatakan reliabel jika jawaban atau respon seseorang terhadap pernyataan adalah konsisten atau stabil dari waktu ke waktu.

Skala tersebut memiliki kemantapan, konsisten, preditikabel, jitu atau memiliki akurasi. Sebagai contoh seseorang yang bangun pagi secara reliabel jika di masa-masa yang lalu selalu konsisten bangun pagi, hari ini juga bangun pagi, sehingg dapat diramalkan bahwa pada hari-hari yang akan datang akan terus bangun pagi.

Misalnya seorang atlet menembak yang sangat mahir, diminta untuk melakukan uji coba membandingkan tiga pucuk senapan yaitu senapan A, senapan B, dan senapan C. Hasil uji coba menunjukkan bahwa hasil bidikan menggunakan senapan A menyebar, sedangkan bila menggunakan senapan B dan senapan C mengumpul pada satu daerah sasaran. Demikian maka senapan B dan senapan C lebih reliabel dibandingkan dengan senapan A.


Oleh karena konsistensi tersebut maka suatu alat ukur dapat diprediksi dengan lebih cermat atau memiliki reliabilitas yang tinggi dan senapan B/C lebih dipercaya dibanding senapan A.

Dalam arti yang paling luas reliabilitas skala alat ukur menunjuk pada sejauhmana perbedaan-perbedaan skor perolehan itu mencerminkan perbedaan-perbedaan atribut yang sebenarnya. Karena reliabilitas alat ukur itu berkenaan dengan derajat konsistensi atau kesamaan antara dua perangkat skor, maka dinyatakan dalam bentuk koefisien korelasi (r).

Reliabilitas alat ukur yang juga menunjukkan derajat kekeliruan pengukuran tak dapat ditentukan dengan pasti, melainkan hanya dapat diestimasi. Ada tiga pendekatan dalam mengestimasi reliabilitas alat ukur itu, yaitu (a) pendekatan tes ulang, (b) pendekatan dengan tes paralel, dan (c) pendekatan sate kali pengukuran.

1. Pendekatan tes ulang
Suatu perangkat tes diberikan kepada sekelompok subjek dua kali, dengan selang waktu tertentu. Reliabilitas tes dicari dengan menghitung korelasi antara skor pada testing I dan skor pada testing II, jadi r total = r.I.II. Pendekatan ini secara teori baik, namun di dalam praktek mengandung kelemahan, yaitu kondisi subjek pada testing II tidak lagi sama dengan kondisi subjek pada testing I, karena terjadinya proses belajar, pengalaman, perubahan motivasi dan sebagainya. Karena itu pada kebanyakan penelitian pendekatan ini tidak digunakan. Pendekatan tes ulang sangat sesuai kalau yang dijadikan objek peng¬ukuran adalah ketrampilan, terutama ketrampilan fisik.

2. Pendekatan dengan tes paralel
Dua perangkat tes yang paralel, misalnya perangkat A dan perangkat B diberikan kepada sekelompok subjek. Reliabilitas tes dicari dengan menghitung korelasi antara skor pada perangkat A dan skor pada perangkat B, jadi r total = rAB. Keterbatasan utama pendekatan ini terletak pada sulitnya menyusun dua perangkat tes yang paralel. Seperti telah diuraikan pada teori tes klasik, bahwa dua perangkat tes akan merupakan dua perangkat tes yang paralel kalau memenuhi sejumlah persyaratan (asumsi). Karena itu di dalam praktek pendekatan ini juga tidak banyak digunakan.

3. Pendekatan pengukuran satu kali
Seperangkat tes diberikan kepada sekelompok subjek satu kali, lalu dengan Cara tertentu dihitung estimasi reliabilitas tes tersebut. Pendekatan pengukuran satu kali ini menghasilkan informasi mengenai keajegan (konsistensi) internal alat ukur. Pendekatan pengukuran satu kali ini dapat menghindarkan dari kesulitan yang timbul dari pendekatan dengan pengukuran ulang maupun pendekatan dengan tes paralel.

Seberapa tinggi suatu koefisien reliabilitas yang dapat dianggap memuaskan? Sulit untuk dijawab dengan memberikan sauatu angka pasti. Pertama dikarenakan koefisien reliabilitas yang diperoleh berdasarkan perhitungan terhadap data empiris dari seke¬lompok subjek yang pada dasarnya hanya merupakan estimasi saja dari reliabilitas yang sesungguhnya dan hanya berlaku bagi kelompok subjek yang dijadikan dasar perhitungan itu saja. Ke dua, aneka macam jenis dan fungsi alat ukur menuntut tingkat reliabilitas minimal yang tidak sama sehingga penafsiran atas koefisien reliabilitas suatu tes tidak dapat dilepaskan sama sekali dari fungsi dan tujuan pengukurannya.

Guna tujuan prediksi dan diagnosis, suatu alat ukur dituntut untuk memiliki koefisien reliabilitas setinggi mungkin, katakanlah di atas 0,900. Namun demikian, kadang-kadang suatu koefisien yang tidak begitu tinggipun masih dapat dianggap cukup berarti dalam kasus pengukuran tertentu.

Dengan koefisien reliabilitas 0,900 berarti perbeda¬an (variasi) yang tampak pada skor tes tersebut mampu mencerminkan 90% dari variasi yang terjadi pada skor murni. Dapat pula dikatakan bahwa hanya 10% dari perbedaan skor yang tampak disebabkan oleh variasi eror pengukuran tersebut. Jadi dapatlah diperkirakan makna suatu koefisien reli¬abilitas pada tingkat 0,600 yang berarti bahwa 40% skor alat ukut tersebut cuma menampakkan variasi eror.

Interpretasi koefisien reliabilitas merupakan evalu¬asi kecermatan skor alat ukur, bukan sekedar keajegan pengukurannya saja. Suatu reliabiltas yang sangat tinggi menimbulkan rasa aman semu dalam diri pemakai alat ukur. Terlalu menggantungkan kepercayaan pada koefisien yang tinggi tanpa memahami pendekatan yang digunakan dalam esti¬masi dan sifat alat ukur yang bersangkutan, serta tidak memperhatikan representasi subjek yang dijadikan sampel dapat melupakan orang akan kemungkinan adanya bias dan overestimasi terhadap reliabilitas yang sesungguhnya.

Disamping tinggi-rendahnya koefisien reliabilitas, hendaknya jangan dilupakan bahwa bobot faktor-faktor yang ada dalam tes harus juga diperhitungkan. Makna skor dan apa yang dapat diprediksi oleh skor alat ukur terbatas semata-mata pada faktor-faktor yang relevan yang ada didalamnya.

Dalam menginterpretasikan tingginya koefisien reliabilitas, paling tidak ada dua hal yang perlu difahami, yaitu: 1) Reliabilitas alat ukur yang diestimasi dengan mengenakannya pada suatu kelompok subjek dalam situasi tertentu akan menghasilkan koefisien yang tidak sama dengan estimasi tes tersebut pada kelompok subjek lain dan dalam situasi yang lain. Oleh karena itu interpretasi koefisien reliabilitas adalah spesifik bagi situasi dan kelompok subjek tertentu saja. 2) Koefisien reliabilitas hanyalah mengindikasikan besarnya inkonsistensi skor hasil pengukuran, bukan menyatakan secara langsung sebab-sebab inkonsistensi itu.

Makna lain dari reliabilitas adalah keterpercayaan. Dengan mengetahui tingginya koefisien reliabilitas suatu alat ukur dapat menentukan sejauhmana boleh dan bersedia mempercayai skor hasil tes tersebut. Karena keter¬percayaan itu bersifat relatif, maka interpretasi koefisien reliabilitas pun bersifat relatif. Adalah tergantung kepada penilai atau pemakai alat ukur itu sendiri untuk menentukan apakah suatu koefisien reliabilitas sudah cukup memuaskan bagi keperluannya atau tidak.

Fred N. Kerlinger. Asas-Asas Penelitian Behavioral. Gadjah Mada University Press. Yogyakarta. 1993.

Imam Ghozali. Aplikasi analisis Multivariate Dengan Program SPSS. Badan Penerbit Universitas Diponegoro. Semarang. 2001.

Saifuddin Azwar. Reliabilitas dan Validitas. Pustaka Pelajar. Yogyakarta. 2008.

Sumadi Suryabrata. Pengembangan Alat Ukur Psikologis. Penerbit Andi. Yogyakarta. 2005.


Keandalan(Reliability)

Definisi

Jika tes tidak dapat diandalkan, maka meskipun hasilnya untuk satu penggunaan sebenarnya mungkin masih berlaku, selama mereka mungkin tidak valid. Keandalan demikian merupakan ukuran berapa banyak yang dapat Anda percaya hasil tes.
Pengujian sering memiliki keandalan yang tinggi - tetapi dengan mengorbankan validitas . Dengan kata lain, Anda bisa mendapatkan hasil yang sama, dari waktu ke waktu, tetapi tidak memberitahu Anda apa yang Anda benar-benar ingin tahu.

Stabilitas

Stabilitas adalah ukuran dari pengulangan tes dari waktu ke waktu, bahwa memberikan hasil yang sama setiap kali digunakan (dalam batasan yang ditetapkan, tentu saja).
Tes-tes kembali keandalan adalah pengulangan tes dari waktu ke waktu untuk mendapatkan hasil yang sama dengan orang yang sama dan perlu dilakukan untuk menjamin stabilitas tes. Stabilitas, dalam hal ini, adalah variasi dalam nilai yang diambil. Masalah dengan ini meliputi:
  • Carry-over efek: orang mengingat jawaban dari terakhir kali.
  • Efek Praktek: diulang mengambil tes meningkatkan skor (khas dengan tes IQ klasik).
  • Gesekan: Orang tidak hadir untuk re-tes.
Ada asumsi dengan stabilitas bahwa apa yang diukur tidak berubah. Variasi harus karena tes, belum faktor lainnya. Sayangnya, hal ini tidak selalu benar.

Konsistensi

Konsistensi adalah ukuran dari keandalan melalui kesamaan dalam ujian, dengan pertanyaan-pertanyaan individu memberikan jawaban diprediksi setiap waktu.
Konsistensi dapat diukur dengan split-setengah pengujian dan tes Kuder-Richardson.

Split-setengah pengujian

Split-setengah pengujian mengukur konsistensi dengan:
  • Membagi tes menjadi dua (biasanya metode mid point, aneh / bahkan nomor acak, atau lainnya)
  • Penyelenggara mereka sebagai tes yang terpisah.
  • Bandingkan hasil dari masing-masing setengah.
Masalah dengan hal ini adalah bahwa tes yang dihasilkan lebih pendek dan karenanya dapat kehilangan kehandalan. Split-setengah dengan demikian lebih baik dengan tes yang agak lama di tempat pertama.
Gunakan rumus Spearman-Brown untuk memperbaiki masalah sesak, memungkinkan korelasi seakan setiap bagian yang panjang penuh:
r = (2rhh) / (1 + rhh)
(Dimana rhh hubungan antara dua bagian)

Kuder-Richardson kehandalan atau koefisien alpha

Keandalan Kuder-Richardson atau koefisien alpha relatif sederhana untuk dilakukan, yang berbasis pada satu administrasi dari tes. Ini mengkaji antar-item tes konsistensi dengan melihat dua langkah kesalahan:
  • Kecukupan sampling konten
  • Heterogenitas dari domain menjadi sampel
Ini mengasumsikan varians tes dapat diandalkan mengandung lebih banyak dan karena itu lebih diskriminatif. Heterogenitas yang lebih tinggi menyebabkan menurunkan antar-item konsistensi. Untuk benar / salah nilai yang non-dikotomis item:
RKK = k / (k - 1 (1 - Σσ 2 i / 2 σ t))
Dimana RKK adalah koefisien alpha dari tes, k adalah jumlah item, σ 2 i adalah varians item, σ 2 t adalah varians uji

Kesetaraan hasil (bentuk paralel)

Mencari kehandalan melalui kesetaraan antara dua versi dari pengujian yang sama, membandingkan hasil dari setiap versi uji (seperti split-setengah). Ini lebih baik daripada tes-tes ulang karena dapat dilakukan pada hari yang sama (mengurangi variasi).
Ada bahaya dari tes dengan validitas internal yang tinggi memiliki jangkauan yang terbatas (dan karenanya validitas akhir lebih rendah).
Spesifik kembung adalah di mana pertanyaan-pertanyaan serupa menyebabkan signifikansi jelas. Ini bisa menjadi buruk ketika tidak diharapkan, tetapi dapat digunakan untuk membuat variasi disengaja.
Versi Paralel berguna dalam situasi seperti dengan lulusan yang dapat melakukan pengujian yang sama beberapa kali.
Efek buruk terjadi di mana kelompok yang berbeda mencetak berbeda (potensial ras, dll bias). Ini mungkin membutuhkan versi yang berbeda dari pengujian yang sama - misalnya. MBTI untuk negara yang berbeda.

Diskusi

Ada sejumlah aspek prosedural yang mempengaruhi uji reliabilitas, termasuk:
  • Uji kondisi
  • Tidak konsisten administrasi praktek
  • Variasi dalam uji menandai
  • Penerapan norma kelompok tidak sesuai
  • Intern keadaan tes-taker (lelah, dll)
  • Pengalaman tingkat uji-taker (misalnya jika uji diambil sebelumnya). 



Tidak ada komentar: