Seri Artikel Terjemahan Penting: 1. On the Theory of Scales of Measurement, S. S. Stevens

Handowo Dipo, penterjemah

CATATAN: Ini teori yang sering dibahas dan dikutip dalam buku Statistik. Semoga berguna.

Tentang Teori Skala Pengukuran
S. S. Stevens
Direktur, Laboratorium Psiko-Akustik, Universitas Harvard
dalam SCIENCE, Vol. 103, No. 2684, Friday, June 7, 1946

Selama tujuh tahun, Komite Asosiasi Inggris untuk Kemajuan Ilmu Pengetahuan memperdebatkan masalah pengukuran. Dibentuk tahun 1932 untuk mewakili Bagian A (Ilmu Matematika dan Fisika) dan Bagian J (Psikologi), komite ini diinstruksikan untuk mempertimbangkan dan melaporkan kemungkinan "estimasi kuantitatif peristiwa-peristiwa sensorik" - yang arti sederhananya adalah: Apakah mungkin sensasi yang dialami manusia diukur? Musyawarah hanya menimbulkan perbedaan pendapat, terutama mengenai apa yang dimaksud dengan istilah pengukuran. Sebuah laporan internal pada tahun 1938 menyebutkan salah satu anggota mengeluh bahwa rekan-rekannya "keluar melalui pintu yang sama saat mereka masuk", dan untuk berusaha mencapai kesepakatan, komite minta perpanjangan waktu kerja satu tahun lagi.

Untuk laporan akhirnya (1940), komite ini memilih landasan yang sama dalam perdebatannya, dan mengarahkan argumennya pada contoh nyata dalam skala sensoris. Ini adalah skala kenyaringan Sone (S. S. Stevens dan H. Davis. Hearing. New Pork: Wiley, 1938) yang dimaksudkan untuk mengukur besaran subjektif dari sensasi pendengaran terhadap skala yang memiliki sifat formal dari skala dasar lainnya, seperti skala tersebut. digunakan untuk mengukur panjang dan berat. Sekali lagi 19 anggota komite keluar dari jalur yang mereka masuki, dan pandangan mereka berkisar antara dua ekstrem. Salah satu anggota menyampaikan "bahwa hukum apa pun yang dimaksudkan untuk mengungkapkan hubungan kuantitatif antara intensitas sensasi dan intensitas stimulus tidak hanya salah tetapi pada kenyataannya tidak ada artinya kecuali dan sampai konsep penambahan sebagaimana diterapkan pada sensasi dapat diberikan makna" (Laporan Akhir, hal.245).

Jelas dari pernyataan ini dan pernyataan komite lainnya bahwa permasalahan sebenarnya adalah makna pengukuran. Tentu saja ini adalah masalah semantik, namun rentan untuk didiskusikan secara teratur. Mungkin kesepakatan dapat dicapai dengan lebih baik jika kita mengakui bahwa pengukuran ada dalam berbagai bentuk dan skala pengukuran masuk ke dalam kelas-kelas tertentu. Kelas-kelas ini ditentukan baik oleh operasi empiris yang dilakukan dalam proses "pengukuran" dan oleh sifat formal (matematis) dari skala. Lebih jauh lagi—dan hal ini menjadi perhatian besar bagi beberapa ilmu pengetahuan—manipulasi statistik yang dapat diterapkan secara sah pada data empiris bergantung pada jenis skala yang digunakan untuk menyusun data tersebut.

KLASIFIKASI SKALA PENGUKURAN
Mengutip N. R. Campbell (Laporan akhir, hal. 340)) kita dapat mengatakan bahwa pengukuran, dalam arti luas, didefinisikan sebagai pemberian angka pada objek atau peristiwa menurut aturan. Fakta bahwa angka dapat ditetapkan berdasarkan aturan yang berbeda menyebabkan jenis skala dan jenis pengukuran yang berbeda. Masalahnya kemudian menjadi masalah memperjelas (a) berbagai aturan untuk penetapan angka, (b) sifat matematika (atau struktur kelompok) dari skala yang dihasilkan, dan (c) operasi statistik yang dapat diterapkan pada pengukuran yang dilakukan dengan setiap jenis skala.

Skala dimungkinkan pada awalnya hanya karena terdapat isomorfisme tertentu antara apa yang dapat kita lakukan dengan aspek objek dan properti deret angka. Dalam menangani aspek-aspek objek, kita menggunakan operasi empiris untuk menentukan kesetaraan (mengklasifikasikan), untuk mengurutkan peringkat, dan untuk menentukan kapan perbedaan dan kapan rasio antara aspek-aspek objek adalah sama. Rangkaian konvensional menghasilkan operasi analog: kita dapat mengidentifikasi anggota rangkaian angka dan mengklasifikasikannya. Kita mengetahui urutannya sebagaimana ditentukan oleh konvensi. Kita dapat menentukan selisih yang sama, misalnya 8 -6 = 4 -2, dan rasio yang sama, misalnya 8/4 = 6/3. Isomorfisme antara sifat-sifat deret angka dan operasi empiris tertentu yang kita lakukan dengan objek memungkinkan penggunaan deret tersebut sebagai model untuk mewakili aspek dunia empiris.

Jenis skala yang dicapai bergantung pada karakter operasi empiris dasar yang dilakukan. Operasi-operasi ini biasanya dibatasi oleh sifat dari hal yang sedang diskalakan dan oleh pilihan prosedur kita, namun, setelah dipilih, operasi-operasi tersebut menentukan bahwa akan terjadi satu atau beberapa skala. Jadi, kasus yang berada di median (tengah- titik) tercantum pada Tabel 1.l

Keputusan untuk membuang nama skala yang biasa ditemui dalam tulisan tentang pengukuran didasarkan pada ambiguitas istilah seperti "intensif" dan "ekstensif". Skala ordinal dan interval kadang-kadang disebut intensif, dan skala interval dan rasio kadang-kadang disebut ekstensif.

Perlu dicatat bahwa kolom yang mencantumkan operasi dasar yang diperlukan untuk membuat setiap jenis skala bersifat kumulatif: ke operasi yang terdaftar di seberang skala tertentu harus ditambahkan semua operasi yang mendahuluinya. Jadi, skala interval hanya dapat dibuat jika kita mempunyai operasi untuk menentukan persamaan interval, untuk menentukan lebih besar atau lebih kecil, dan untuk menentukan persamaan (tidak lebih besar dan tidak kurang). Pada operasi ini harus ditambahkan metode untuk memastikan kesetaraan rasio jika ingin mencapai skala rasio.

Di kolom yang mencatat struktur kelompok setiap skala tercantum transformasi matematis yang membiarkan bentuk skala invarian. Jadi, angka apa pun, x, pada suatu skala dapat diganti dengan angka lain, x', di mana x' adalah fungsi dari x yang tercantum pada kolom ini. Setiap grup matematika pada kolom tersebut terdapat pada grup yang berada tepat di atasnya.

Kolom terakhir menyajikan contoh jenis operasi statistik yang sesuai untuk setiap skala. Kolom ini bersifat kumulatif karena semua statistik yang terdaftar dapat diterima untuk data yang diskalakan berdasarkan skala rasio. Kriteria kelayakan suatu statistik adalah in-varians pada transformasi di Kolom 3.

Dengan demikian, kasus yang berada pada median (titik tengah) dari suatu distribusi akan mempertahankan posisinya pada semua transformasi yang mempertahankan keteraturan (gugus isotonik), namun item yang terletak pada mean tetap berada pada mean hanya pada transformasi yang dibatasi seperti pada transformasi. kelompok linier. Rasio yang dinyatakan dengan koefisien variasi tetap invarian hanya jika dilakukan transformasi kesamaan (dikalikan dengan konstanta). (Koefisien korelasi urutan peringkat biasanya dianggap sesuai untuk skala ordinal, namun sebenarnya statistik ini mengasumsikan interval yang sama antara peringkat yang berurutan dan oleh karena itu memerlukan skala interval.) Sekarang mari kita pertimbangkan setiap skala secara bergantian.

SKALA NOMINAL
Skala nominal mewakili penetapan angka yang paling tidak dibatasi. Angka hanya digunakan sebagai label atau nomor ketik, dan cetakan kata atau huruf juga berfungsi. Ada dua jenis tugas nominal yang kadang-kadang dibedakan, seperti yang diilustrasikan (a) dengan 'penomoran' pemain sepak bola untuk mengidentifikasi individu, dan (b) dengan 'penomoran' jenis atau kelas, di mana setiap anggota kelas adalah diberi nomor yang sama. Sebenarnya, kasus pertama adalah kasus khusus dari kasus kedua, karena ketika kita memberi label pada pemain sepak bola, kita berhadapan dengan kelas unit yang masing-masing terdiri dari satu anggota. Karena tujuannya juga terpenuhi ketika dua angka yang ditunjuk dipertukarkan, bentuk skala ini tetap invarian di bawah kelompok substitusi atau permutasi umum (kadang-kadang disebut kelompok transformasi simetris). Satu-satunya statistik yang relevan dengan skala nominal Tipe A adalah jumlah kasus, misalnya. jumlah pemain yang diberi nomor. Namun begitu kelas-kelas yang berisi beberapa individu telah terbentuk (Tipe B), kita dapat menentukan kelas yang paling banyak jumlahnya (mode), dan dalam kondisi tertentu kita dapat menguji, dengan metode kontingersi, hipotesis mengenai distribusi kasus di antara kelas-kelas tersebut.

Skala nominal adalah suatu bentuk yang primitif, dan tentu saja ada banyak orang yang berpendapat bahwa tidak masuk akal untuk mengaitkan proses pemberian angka dengan martabat yang tersirat dalam istilah pengukuran. Tentu saja tidak ada yang bisa diperdebatkan dengan keberatan ini, karena penamaan sesuatu adalah tindakan sembarangan. Bagaimanapun kami menyebutnya, penggunaan angka sebagai nama kelas adalah contoh dari "penugasan angka menurut aturan". Aturannya adalah: Jangan memberikan angka yang sama pada kelas yang berbeda atau angka yang berbeda pada kelas yang sama. Di luar itu, apapun itu sesuai dengan skala nominalnya.

SKALA ORDINAL
Skala ordinal muncul dari pengoperasian pengurutan peringkat. Karena setiap transformasi 'pemelihara keteraturan' akan membuat bentuk skala menjadi invarian, skala ini memiliki struktur yang disebut kelompok isotonik atau kelompok pemelihara keteraturan. Contoh klasik skala ordinal adalah skala kekerasan mineral. Contoh lain ditemukan di antara skala kecerdasan, ciri-ciri kepribadian, tingkat atau kualitas kulit, dan lain-lain. Faktanya, sebagian besar skala yang digunakan secara luas dan efektif oleh para psikolog adalah skala ordinal. Dalam kepatutan yang paling ketat, statistik biasa yang melibatkan rata-rata dan deviasi standar tidak boleh digunakan dengan skala ini, karena statistik ini menyiratkan pengetahuan tentang sesuatu yang lebih dari sekadar urutan peringkat data. Di sisi lain, untuk statistik 'ilegal' ini dapat dikenakan semacam sanksi pragmatis: Dalam banyak kasus, hal ini membuahkan hasil yang bermanfaat.

Meskipun pelarangan prosedur ini mungkin tidak akan memberikan manfaat yang baik, patut dicatat bahwa rata-rata dan deviasi standar yang dihitung pada skala ordinal adalah salah jika interval yang berurutan pada skala tersebut tidak sama besarnya. Ketika hanya data yang diketahui berdasarkan peringkat, kita harus berhati-hati dalam menggunakan statistik kita, dan terutama dalam menarik kesimpulan dari statistik tersebut. Bahkan dalam menerapkan statistik yang biasanya sesuai untuk skala ordinal, terkadang kita menemukan bahwa ketelitian telah dikompromikan. Jadi, meskipun ditunjukkan pada Tabel 1 bahwa ukuran persentil dapat diterapkan pada data yang diurutkan berdasarkan peringkat, harus ditunjukkan bahwa prosedur umum dalam menetapkan nilai pada persentil dengan melakukan interpolasi secara linier dalam suatu interval kelas, dengan segala ketelitiannya, sepenuhnya di luar batas. Demikian pula, tidaklah tepat untuk menentukan titik tengah suatu interval kelas dengan interpolasi linier, karena linearitas skala ordinal merupakan sifat yang patut dipertanyakan.

SKALA INTERVAL
Dengan skala interval kita sampai pada suatu bentuk yang "kuantitatif" dalam arti kata yang biasa. Hampir semua pengukuran statistik biasa dapat diterapkan di sini, kecuali pengukuran tersebut menyiratkan pengetahuan tentang titik nol yang 'sebenarnya'. Titik nol pada skala interval adalah masalah konvensi atau kemudahan, seperti yang ditunjukkan oleh fakta bahwa bentuk skala tetap in-varian ketika sebuah konstanta ditambahkan. Hal ini diilustrasikan oleh dua skala suhu kita, Celcius dan Fahrenheit. Interval suhu yang sama diperkecil dengan memperhatikan volume pemuaian yang sama; angka nol yang sewenang-wenang disepakati untuk setiap skala; dan nilai numerik pada salah satu skala diubah menjadi nilai pada skala yang lain melalui persamaan berbentuk x' = ax + b. Skala waktu kita memberikan contoh serupa. Tanggal-tanggal di satu kalender diubah ke tanggal-tanggal di kalender lain melalui persamaan yang sama. Pada skala ini, tentu saja, tidak ada gunanya mengatakan bahwa satu nilai dua kali atau proporsi lain lebih besar dari nilai lainnya.

Namun, periode waktu dapat diukur dengan skala rasio dan suatu periode dapat didefinisikan dengan tepat sebagai dua kali periode lainnya. Hal yang sama mungkin berlaku pada suhu yang diukur pada apa yang disebut Skala Absolut. Kebanyakan pengukuran psikologis bertujuan untuk menciptakan skala interval, dan terkadang berhasil. Permasalahannya biasanya adalah merencanakan operasi untuk menyamakan satuan-satuan skala—sebuah permasalahan yang tidak selalu mudah untuk dipecahkan, namun terdapat beberapa kemungkinan cara penyerangan. Hanya kadang-kadang saja ada kekhawatiran mengenai letak titik nol yang 'sebenarnya', karena sifat-sifat manusia yang diukur oleh para psikolog biasanya ada dalam derajat positif yang besar dibandingkan dengan jangkauan variatidnnya. Dalam hal ini atribut-atribut tersebut dianalogikan dengan suhu sebagaimana yang ditemui dalam kehidupan sehari-hari. Kecerdasan, misalnya, dinilai dengan menggunakan skala ordinal yang mencoba memperkirakan skala interval, dan tidak perlu mendefinisikan apa yang dimaksud dengan kecerdasan nol.

SKALA RASIO
Skala rasio adalah skala yang paling umum dijumpai dalam fisika dan hanya mungkin dilakukan jika terdapat operasi untuk menentukan keempat hubungan: persamaan, urutan pangkat, persamaan interval, dan persamaan rasio. Setelah skala tersebut dibuat, nilai numeriknya dapat diubah (misalnya dari inci ke kaki) hanya dengan mengalikan setiap nilai dengan sebuah konstanta. Nol mutlak selalu tersirat, meskipun nilai nol pada beberapa skala (misalnya Suhu Absolut) mungkin tidak pernah diproduksi. Semua jenis ukuran statistik dapat diterapkan pada skala rasio, dan hanya dengan skala ini kita dapat melakukan transformasi logaritmik seperti yang terlibat dalam penggunaan desibel.

Yang terpenting di antara skala rasio adalah skala bilangan itu sendiri—bilangan pokok—skala yang kita gunakan saat menghitung benda seperti telur, uang receh, dan apel. Skala jumlah agregat ini sangat mendasar dan umum sehingga biasanya tidak disebutkan dalam diskusi pengukuran.

Dalam fisika, merupakan hal yang lazim untuk membedakan dua jenis skala rasio: skala fundamental dan turunan. Skala fundamental diwakili oleh panjang, berat, dan hambatan listrik, sedangkan skala turunan diwakili oleh kepadatan, gaya, dan elastisitas.

Yang terakhir ini adalah besaran turunan dalam arti bahwa mereka merupakan fungsi matematika dari besaran fundamental tertentu. Jumlahnya sebenarnya lebih banyak dalam fisika daripada besaran dasar, yang umumnya dianggap dasar karena memenuhi kriteria aditif. Berat, panjang, dan hambatan dapat ditambahkan dalam arti fisik, namun fakta empiris yang penting ini umumnya lebih diutamakan dalam teori pengukuran daripada yang seharusnya. Skala fundamental adalah contoh penting dari skala rasio, namun skala tersebut hanyalah contoh saja. Faktanya, dapat ditunjukkan bahwa skala fundamental dapat diatur bahkan jika operasi fisik penambahan dikesampingkan sebagai hal yang mustahil untuk dilakukan. Dengan adanya tiga timbangan, misalnya, yang masing-masing memiliki konstruksi yang tepat, satu set anak timbangan standar dapat diproduksi tanpa harus menempatkan dua anak timbangan dalam wadah timbangan yang sama pada waktu yang bersamaan. Prosedurnya terlalu panjang untuk dijelaskan di halaman-halaman ini, namun kelayakannya disebutkan di sini hanya untuk memberi kesan bahwa penambahan fisik, meskipun kadang-kadang memungkinkan, belum tentu menjadi dasar seluruh pengukuran. Terlalu banyak pengukuran yang dilakukan sehingga tidak dapat dilakukan upaya untuk meletakkan barang-barang secara end-to-end atau menumpuknya.

Skala rasio besaran psikologis jarang terjadi tetapi tidak sepenuhnya diketahui. Skala Sone yang dibahas oleh komite Inggris adalah contoh yang didasarkan pada upaya yang disengaja agar pengamat manusia dapat menilai rasio kenyaringan pasangan nada. Penilaian interval yang sama telah lama ditetapkan sebagai metode yang sah, dan dengan penelitian tentang rasio sensorik, yang dimulai secara independen di beberapa laboratorium, langkah terakhir diambil untuk menetapkan angka pada sensasi kenyaringan sedemikian rupa sehingga hubungan antar sensasi menjadi lebih baik. dicerminkan oleh hubungan aritmatika biasa dalam deret angka. Seperti dalam semua pengukuran, ada batasan yang ditentukan oleh kesalahan dan variabilitas, namun dalam batasan ini skala Sone sebaiknya digolongkan sebagai skala rasio.

Oleh karena itu, kepada komite Inggris, kami dapat menyimpulkan bahwa definisi pengukuran yang paling liberal dan berguna adalah, seperti yang disarankan oleh salah satu anggotanya, “penetapan angka pada benda-benda untuk mewakili fakta dan konvensi mengenai benda tersebut. ." Persoalan mengenai apa yang dimaksud dengan pengukuran dan apa yang bukan pengukuran kemudian direduksi menjadi pertanyaan sederhana: Apa aturannya, jika ada, yang mendasari penetapan angka? Jika kita dapat menunjuk pada seperangkat aturan yang konsisten, kita jelas prihatin dengan beberapa jenis pengukuran, dan kita kemudian dapat melanjutkan ke pertanyaan yang lebih menarik mengenai jenis pengukurannya. Dalam kebanyakan kasus, rumusan aturan penugasan mengungkapkan secara langsung jenis pengukuran dan jenis skala yang terlibat. Jika masih ada ambiguitas, kita dapat mencari jawaban final dan definitif dalam struktur kelompok matematis dari bentuk skala: Dengan cara apa kita dapat mentransformasikan nilainya dan tetap memenuhi semua fungsi yang sebelumnya dipenuhi? Kita tahu bahwa nilai semua skala dapat dikalikan dengan sebuah konstanta, yang mengubah ukuran satuannya. Jika, sebagai tambahan, sebuah konstanta dapat ditambahkan (atau titik nol baru dipilih), ini merupakan bukti positif bahwa kita tidak peduli dengan skala rasio. Kemudian, jika tujuan dari skala tersebut masih dapat dipenuhi ketika nilainya dikuadratkan atau dikuadratkan atau dikuadratkan, maka skala tersebut bahkan bukan skala interval. Dan yang terakhir, jika ada dua nilai yang dapat dipertukarkan sesuka hati, skala ordinal dikesampingkan dan skala nominal adalah satu-satunya kemungkinan yang tersisa.


Solusi yang diusulkan untuk masalah semantik ini tidak dimaksudkan untuk menyiratkan bahwa semua skala yang termasuk dalam kelompok matematika yang sama adalah sama tepat atau akurat atau berguna atau "mendasar". Pengukuran tidak pernah lebih baik daripada operasi empiris yang dilakukannya, dan operasinya berkisar dari buruk hingga baik. Skala tertentu apa pun, baik sensorik maupun fisik, dapat ditolak atas dasar bias, presisi rendah, keumuman yang terbatas, dan faktor-faktor lain, namun pihak yang menolak harus ingat bahwa ini adalah masalah yang relatif dan praktis dan tidak ada skala yang digunakan oleh manusia. benar-benar bebas dari noda mereka.

1 Klasifikasi yang pada dasarnya setara dengan yang terdapat dalam tabel ini telah dipresentasikan di hadapan Kongres Internasional untuk Kesatuan Sains, September 1941. Penulis berhutang budi kepada mendiang Prof G. D. Birkhoff atas diskusi yang menggairahkan yang mengarah pada penyelesaian tabel pada dasarnya bentuknya yang sekarang.

************

Sebelumnya diterbitkan di Substack.com, 31 Juli 2025.

Subscribe to Jindonesia

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe