Pengertian Iteman Dan Analisis Iteman

Pengertian Iteman dan Analisis Iteman

ITEMAN merupakan kegiatan komputer yang dipakai untuk menganalisis butir soal secara klasik. Program ini termasuk satu paket kegiatan dalam MicroCAT°n yang dikembangkan oleh Assessment Systems Corporation mulai tahun 1982 dan mengalami revisi pada tahun 1984, 1986, 1988, dan 1993; mulai dari versi 2.00 hingga dengan versi 3.50. Alamatnya yakni Assessment Systems Corporation, 2233 University Avenue, Suite 400, St Paul, Minesota 55114, United States of America.

Program ini sanggup dipakai untuk: (1) menganalisis data file (format ASCII) tanggapan butir soal yang dihasilkan melalui manual entry data atau dari mesin scanner; (2) menskor dan menganalisis data soal pilihan ganda dan skala Likert untuk 30.000 siswa dan 250 butir soal; (3) menganalisis sebuah tes yang terdiri dari 10 skala (subtes) dan memperlihatkan informasi perihal validitas setiap butir (daya pembeda, tingkat kesukaran, proporsi tanggapan pada setiap option), reliabilitas (KR-20/Alpha), standar error of measurement, mean, variance, standar deviasi, skew, kurtosis untuk jumlah skor pada tanggapan benar, skor minimum dan maksimum, skor median, dan frekuensi distribusi skor.

Saat ini telah tersedia ITEMAN tinder Windows 95, 98, NT, 2000, ME, dan XP dengan harga $299. Sebelum memakai kegiatan Iteman, bacalah manualnya/buku petunjuk pengoperasionalnya secara seksama. Sebagai contoh, tahap awal yakni menciptakan "file data" (control tile) yang berisi 5 komponen utama.

Baris pertama yakni baris pengontrol yang mendeskripsikan data.
Baris kedua yakni daftar kunci tanggapan setiap butir soal.
Baris ketiga yakni daftar jumlah option untuk setiap butir soal.
Baris keempat yakni daftar butir soal yang hendak dianalisis (jika butir yang akan dianalisis diberi tanda Y (yes), jika tidak diikutkan dalam analisis diberi tanda N (no).
Baris kelima dan seterusnya yakni data siswa dan pilihan tanggapan siswa.

Setiap pilihan tanggapan siswa (untuk soal bentuk pilihan ganda) diketik dengan memakai huruf, misal ABCD atau angka 1234 untuk 4 pilihan tanggapan atau ABCDE atau 12345 untuk 5 pilihan jawaban.

Cara memakai kegiatan ini, pertama data diketik di DOS atau Windows.

Cara termudah yakni memakai kegiatan Windows yaitu dengan mengetik data di daerah Notepad. Caranya yakni klik Start-Programs-Accessories-Notepad.

Korelasi point-biserial (r pbi) tidak sama dengan 0, hubungan biserial (r bis) paling sedikit 25% lebih besar daripada r pbi untuk perhitungan pada data yang sama. Korelasi point-biserial (r pbi) merupakan hubungan product moment antara skor dikotomus dan pengukuran kriterion; sedangkan hubungan biserial (r bis) merupakan hubungan product moment antara variabel latent distribusi normal berdasarkan dikotomi benar-salah dan pengukuran kriterion.

Menurut Millman dan Greene (1989) dalam Educational Measurement, kedua hubungan ini mempunyai kelebihan masing-masing. Kelebihan hubungan point biserial adalah: (1) memperlihatkan refleksi bantuan soal secara sebetulnya terhadap fungsi tes. Maksudnya ini mengukur bagaimana baiknya soal berkorelasi dengan kriterion (tidak bagaimana baiknya beberapa secara abstrak); (2) sederhana dan eksklusif berafiliasi dengan statistik tes; (3) tidak pernah mempunyai value 1,00 sebab hanya variabel-variabel dengan distribusi bentuk yang sama yang sanggup berkorelasi secara sempurna, dan variabel kontinyu (kriterion) dan skor dikotomus tidak mempunyai bentuk yang sama. Kelebihan hubungan biserial adalah: (1) cenderung lebih stabil dari sampel ke sampel, (2) penilaian lebih akurat perihal bagaimana soal sanggup diharapkan untuk membedakan pada beberapa perbedaan point di skala abilitas, (3) value r bis yang sederhana lebih eksklusif berafiliasi dengan indikator diskriminasi kurva karakteristik butir (Item Characteristic Curve atau ICC). Kebanyakan para andal pendidikan, khususnya di Indonesia, banyak yang memakai hubungan point biserial daripada hubungan biserial.

Kriteria baik tidaknya butir soal berdasarkan Ebel dan Frisbie (1991) dalam Essentials of Educational Measurement halaman 232 yakni bila hubungan point biserial: >0.40=butir soal sangat baik; 0.30 - 0.39=soal baik, tetapi perlu perbaikan; 0.20 - 0.29=soal dengan beberapa catatan, biasanya diharapkan perbaikan; < 0. 19=soal jelek, dibuang, atau diperbaiki melalui revisi. Adapun tingkat kesukaran butir soal mempunyai skala 0 - 1. Semakin mendekati 1 soal tergolong gampang dan mendekati 0 soal tergolong sukar.

a. Interpretasi Hasil Analisis Program ITEMAN

Hasil dari analisis ITEMAN sanggup berupa dua file yaitu file statistik dan file skor. Keduanya berupa file ASCII yang sanggup dilihat dengan memakai kegiatan pengolah kata (word processor).

File statistik hasil analisis ITEMAN sanggup dibedakan ke dalam 2 bagian, yaitu : Statistik butir soal dan statistik tes (skala). Gambar 4 di atas memperlihatkan hasil analisis statistik butir soal, sedangkan gambar 5 memperlihatkan hasil analisis statistik tes. Interpretasi kedua gambar di atas sanggup diuraikan sebagai berikut :

I. Statistik Butir Soal

Untuk tes/skala yang terdiri dari butir-butir soal yang bersifat dikotomi contohnya pilihan ganda, statistik berikut yakni output dari setiap butir soal yang dianalisis :

Seq. No yakni nomor urut butir soal dalam file data.
Scala-item yakni nomor urut butir soal dalam skala (tes/subtes)

Prop. Correct yakni proporsi siswa( penerima tes) yang menjawab benar butir soal. Nilai ekstrim (mendekati nol atau satu) pertanda bahwa butir soal tersebut terlalu sukar atau terlalu gampang untuk penerima tes. Indeks ini disebut juga indeks tigkat kesukaran soal secara klasikal.

Biser yakni indeks daya pembeda soal dengan memakai koefisien hubungan biserial. Nilai faktual pertanda bahwa penerima tes yang menjawab benar butir soal, mempunyai skor yang relatif tinggi dalam tes/skala tersebut. Sebaliknya nilai negatif pertanda bahwa penerima tes yang menjawab benar butir soal, memperoleh skor yang relatif rendah dalam tes/skala tersebut. Untuk statistik pilihan tanggapan (alternative) hubungan biserial negatif sangat tidak dikehendaki untuk kunci tanggapan dan sangat dikehendaki untuk pilihan tanggapan yang lain (pengecoh).

Point-biser yakni juga indeks daya pembeda soal dan pilihan tanggapan (alternatif) dengan memakai koefisien hubungan point-biserial. Penafsirannya sama dengan statistik biserial.

Catatan : Nilai -9.000 pertanda bahwa statistik butir soal atas pilihan tanggapan tidak sanggup di hitung. Hal ini sering kali terjadii apabila tidak ada penerima tes yang menjawab butir soal/ pilihan tanggapan tersebut

Statistik pilihan tanggapan (alternative) memperlihatkan informasi yang sama dengan statistik butir soal. Perbedaannya yakni bahwa statistik pilihan tanggapan dihitung secara terpisah. Untuk setiap piihan tanggapan dan didasarkan pada dipilih tidaknya alternatif tersebut, bukan pada benarnya jawaban. Tanda (*) yang muncul di sebelah kanan hasil analisis pertanda kunci jawaban.

II. Statistik Tes/Skala

Analisis statistik untuk tes/skala dengan interpretasi berikut :

N of items yakni jumlah butir soal dalam tes/skala yang ikut dianalisis. Untuk tes/skala yang terdiri dari butir-butir soal dikotomi, hal ini merupakan jumlah total butir soal dalam tes /skala.
N of examines yakni jumlah penerima tes yang dipakai dalam analisis.
Mean yakni skor rata-rata penerima tes.
Variance yakni varian dari distribusi skor penerima tes yang memperlihatkan citra perihal sebaran skor penerima tes.
Std. Dev yakni deviasi standar dari distribusi skor penerima tes. Deviasi standar yakni akar dari variance.
Skew yakni kemiringan distribusi skor penerima tes yang memperlihatkan citra perihal bentuk distribusi skor penerima tes. Kemiringan negatif pertanda bahwa sebagian besar skor berada pada potongan atas (skor tinggi) dari distribusi skor. Sebaliknya kemiringan faktual pertanda bahwa sebagian besar skor berada potongan bawah (skor rendah) dari distribusi skor. Kemiringan nol pertanda bahwa skor berdistribusi secara simetris di sekitar skor rata-rata (Mean).
Kurtosis yakni puncak distribusi skor yang menggambarkan kelandaian distribusi skor dibanding dengan distribusi normal. Nilai faktual pertanda distribusi yang lebih lancip (memuncak) dan nilai negatif pertanda distribusi yang lebih landai (merata). Kurtosis untuk distribusi normal yakni nol.Minimun yakni skor terendah penerima tes dalam tes/skala tersebut.
Maximum yakni skor tertinggi penerima tes dalam tes/skala tersebut.
Median yakni skor tengah dimana 50% skor berada pada atau lebih rendah dari skor tersebut.
Alpha yakni koefisien reliabilitas alpha untuk tes/skala tersebut yang merupakan indeks homogenitas tes/skala. Koefisien alpha bergerak dari 0,0 hingga 1,0. Koefisien alpha hanya cocok dipakai pada tes yang bukan mengukur kecepatan (speeded test ) dan yang hanya mengukur satu dimensi (single-trait).
SEM yakni kesalahan pengukuran standar untuk setiap tes/skala. SEM merupakan estimit dari deviasi standar kesalahan pengukuran dalam skor tes.
Mean P yakni rata-rata tingat kesukaran semua butir soal dalam tes secara klasikal dihitung dengan cara mencari rata-rata proporsi penerima tes yang menjawab benar untuk semua butir soal dalam tes/skala.
Mean item-Tot nilai rata-rata indeks daya pembeda dari semua soal dalam tes/skala yang diperoleh dengan menghitung nilai rata-rata point biserial dari semua soal dalam tes/skala.
Mean-Biserial yakni juga nilai rata-rata indeks daya pembeda yang diperoleh dengan menghitung nilai rata-rata hubungan biserial dari semua butir soal dalam tes/skala.
Scale intercorrelation yakni indeks hubungan antara skor-skor penerima tes yang diperoleh dari setiap subtes/subskala

III. File Skor

Program iteman juga memperlihatkan hasil skor untuk setiap penerima tes yang pertanda jumlah benar dari seluruh jawaban. Dari pola diatas, kita sanggup melihat skor penerima tes pada file CONTOH_1.SCR ibarat pada gambar 6.

Baris pertama dari output memperlihatkan jumlah karakter untuk identitas penerima tes (dalam pola di atas 24), jumlah skala (dalam pola di atas 1), dan nama file input. Kemudian hasil skala diberikan secara berurutan sesuai dengan urutan penerima tes dalam file data.

BAB III

KESIMPULAN

Berdasarkan pemaparan di atas ada beberapa kesimpulan yang sanggup diambil yaitu:

Salah satu cara untuk memperbaiki proses berguru mengajar yang paling efektif yakni dengan jalan mengevaluasi tes hasil berguru yang diperoleh dari proses berguru mengajar
Pengolahan tes hasil berguru dalam rangka memperbaiki proses berguru mengajar sanggup dilakukan antara lain dengan melaksanakan analisis soal
Tujuan khusus dari analisis butir soal ialah mencari soal tes mana yang baik dan mana yang tidak baik, dan mengapa item atau soal itu dikatakan baik atau tidak baik
Soal sanggup di analisis dengan memakai analisis kualitatif (teoritis) dan kuantitatif (empiris)
Salah satu cara analisis butir soal secara kuantitatif sanggup dilakukan dengan memakai kegiatan komputer, ibarat ITEMAN, SPSS, SPS, Statpro, Microsat, Bigstep, Anates dll

DAFTAR PUSTAKA;

Depdikbud, 1999, Pengelolaan Pengujian Bagi Guru Mata Pelajaran, Jakarta.
Djemari Mardapi, 2004, Penyusunan Tes Hasil Belajar. Yogyakarta: UNY
Ign. Masidjo. 1995, Penilaian Hasil Belajar Siswa di Sekolah. Yogyakarta: Kanisius.
Nana Sudjana, 2005, Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya
Ngalim Purwanto, 2004, Prinsip-prinsip dan Teknik Evaluasi Pengajaran. Bandung: Remaja Rosdakarya.
Suharsimi Arikunto, 2006, Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara
Sukardjo, 2008, Modul Perkuliahan Evaluasi Pembelajaran Sains Pascasarjana UNY. Yogyakarta

Pengertian Iteman Dan Analisis Iteman

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel