Aplikasi Rasch Model dalam Mengevaluasi Intelligenz Structure Test (IST)
Main Article Content
Abstract
Abstract: The concept of objective measurement in the social sciences and educational assessment must have five criteria: 1) Gives a linear measure with the same interval; 2) Conduct a proper estimation process; 3) Finding unfeasible items (misfits) or outliers; 4) Overcoming the lost data; 5) Generate replicable measurements (independent of the parameters studied). These five conditions of measurement, so far only Rasch model that can fulfill it. The quality of intelligence measurements made with the Rasch model will have the same quality as the measurements made in the physical dimension in the field of physics. The logit scale (log odds unit) generated in the Rasch model is the scale of the same interval and is linear from the data ratio (odds ratio). Based on the results of the analysis that has been done on the IST test instrument can be seen that in general the quality of IST test included in either category. Of the 176 IST test items there is only 1 item that is not good, ie aitem 155 (WU19) so that aitem 155 should be discarded. Based on the DIF analysis it can be seen that there are 28 items in favor of one gender only, so the twenty-eight items should be revised.
Abstrak: Konsep pengukuran objektif dalam ilmu sosial dan penilaian pendidikan harus memiliki lima kriteria: 1) Memberikan ukuran yang linier dengan interval yang sama; 2) Melakukan proses estimasi yang tepat; 3) Menemukan item yang tidak tepat (misfits) atau tidak umum (outlier); 4) Mengatasi data yang hilang; 5) Hasilkan pengukuran yang replicable (independen dari parameter yang diteliti). Kelima kondisi pengukuran ini, sejauh ini hanya model Rasch yang bisa memenuhinya. Kualitas pengukuran kecerdasan yang dibuat dengan model Rasch akan memiliki kualitas yang sama dengan pengukuran yang dibuat dalam dimensi fisik di bidang fisika. Skala logit (log odds unit) yang dihasilkan dalam Rasch model adalah skala interval yang sama dan linear dari rasio data (odds ratio). Berdasarkan hasil analisis yang telah dilakukan pada instrumen tes IST dapat diketahui bahwa secara umum kualitas tes IST termasuk dalam kategori baik. Dari 176 item tes IST hanya ada 1 item yang tidak bagus, yaitu aitem 155 (WU19) sehingga aitem 155 harus dibuang. Berdasarkan analisis DIF dapat dilihat bahwa ada 28 item yang mendukung satu jenis kelamin saja, sehingga dua puluh delapan item harus direvisi.Downloads
Article Details
The copyright of the accepted article shall be assigned to the publisher of the journal. The intended copyright includes the right to publish the article in various forms (including reprints). The journal maintains the publishing rights to published articles.
In line with the license, authors and any users (readers and other researchers) are allowed to share and adapt the material only for non-commercial purposes. In addition, the material must be given appropriate credit, provided with a link to the license, and indicated if changes were made. If authors remix, transform, or build upon the material, authors must distribute their contributions under the same license as the original.
References
Anastasi, A. (1976). Psychological testing (4th ed.). New York: Macmillan Publishing Co.Inc.
Benyamin, J. C. (1998). Analisis kualitas soal Ebtanas PPKn SMU tahun pelajaran 1996/1997 dengan Pendekatan model rasch di Provinsi Nusa Tenggara Timur. Yogyakarta: Fakultas Psikologi Universitas Gadjah Mada Yogyakarta.
Bond, T. G., & Fox, C. M. (2007). Applying the rasch model: fundamental measurement in the human sciences (2nd ed.). Mahwah: Lawrence Erlbaum Associates Publishers.
Boone, W. J., Staver, R. J., & Yale, S. M. (2014). Rasch Analysis in the Human Sciences. London: Springer.
Davidoff, L. L. (1976). Introduction to psychology. New York: McGraw-Hill Book Company.
DeMars, C. (2010). Item Response theory. New York: Oxford University Press.
Gregory, R. J. (2013). Tes Psikologi: Sejarah, Prinsip, dan aplikasi. (A. Kumara & M. Seno, Eds.). Jakarta: Erlangga.
Hambleton, R. K., & Swaminathan, H. (1985). Item response theory. Boston: Kluwer Nijjhoff Publisher.
Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of Item response theory. Newbury Park: Sage Publication.
Kaplan, R. M., & Saccuzzo, D. P. (2012). Pengukuran psikologi. (E. P. Widodo, terj.). Jakarta: Salemba Humanika.
Linacre, J. M. (2006). A User’s Guide to WINSTEPS/MINISTEP Rasch-Model Computer Programs (3.91.0). Chicago. Retrieved from http://www.winsteps.com/a/Winsteps-ManualPDF.zip
Mardapi, D. (2017). Pengukuran, penilaian dan evaluasi pendidikan. Yogyakarta: Parama Publishing.
Nayla Amalia, A., & Widayati, A. (2012). “Analisis butir soal tes kendali mutu kelas XII SMA mata pelajaran Ekonomi Akuntansi di Kota Yogyakarta.” Jurnal Pendidikan Akuntansi Indonesia, X(1), 1–26.
Ridho, A. (2007). Karakteristik psikometrik tes berdasarkan pendekatan teori tes klasik dan teori respon aitem. Jurnal Psikologi INSAN, 2(2), 1–27.
Searing, L. M. (2008). Family Functioning scale validation: A Rasch analysis. Chicago: University of Illinois at Chicago. Retrieved from https://search.proquest.com/openview/a132cd2ac2805a5eb96badc8ed306eee/1?pq-origsite=gscholar&cbl=18750&diss=y
Sumintono, B., & Widhiarso, W. (2013). Aplikasi model Rasch Untuk penelitian ilmu-ilmu sosial. Cimahi: Trim Komunikata.
Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan rasch pada assesment pendidikan. Cimahi: Trim Komunikata.
Veerkamp, W. J., & Berger, M. P. (1999). Optimal item discrimination and maximum information for logistic IRT models. Applied Psychological Measurement, 23(1), 31–40.
Wainer, H., & Braun, H. I. (1998). Test validity. New Jersey: Lawrence Erlbaum Associates Publishers.
Wiratna, A. (1993). Manual intelligenz struktur Test. Surabaya: Locita Mandayaguna.